2012-06-28 16 views
18

Mam do czynienia z danymi tekstowymi w różnych zmiennych grupujących. Zastanawiam się nad stworzeniem metody tworzenia fasetowych działek z usługami word przy użyciu pakietu Ian Fellows 'wordcloud. Podobają mi się różne aspekty zmiennych społecznych. Podejmuję decyzję, jak podejść do tego problemu (fasetowany projekt fabuły).geom_wordcloud: czy to marzenie ze snu

Czy można używać pracy Fellows jako geom (nigdy nie dokonałem geomu, ale mogę się dowiedzieć, czy jest to wykonalne), czy też ggplot nie będzie ładnie grał, ponieważ jedna jest siatką, a jedna jest podstawą (a wordcloud także używa niektóre kodowanie C) lub jakiś inny problem? Jak trudne jest to (wiem, że zależy to od moich umiejętności, ale chciałbym otrzymać odpowiedź na pytanie o piłkę)? Proszę doradzić, czy używanie grafiki bazowej może być bardziej rozsądnym podejściem do tego problemu. Przewiduję, że można się do niego zbliżyć, używając pakietu panes z pakietu plotrix, aby nadać mu wrażenie estetyczne, jakie daje facing ggplota.

Być może jest to głupi pomysł, biorąc pod uwagę rozmiar chmur słowa i sposób faceting szybko ogranicza dostępną przestrzeń.

+0

Można znaleźć to przydatne: http://stackoverflow.com/questions/7029906/extending-ggplot2-prawidłowo –

+3

Możesz zmodyfikować funkcję 'wordcloud' na (niewidocznie) zwróć pozycję, orientację, rozmiar i kolor słów , a następnie użyj tego z' geom_text'. Aby uzyskać bardziej przejrzyste rozwiązanie, prawdopodobnie trzeba byłoby zawinąć wywołanie do 'wordcloud' w funkcji' stat_wordcloud'. –

+3

Poza tym, że ggplot2 używa siatki do drukowania, a rozmiary słów są obliczane przy użyciu grafiki podstawowej. –

Odpowiedz

6

To może być mrzonką, a to z pewnością nie jest łatwe do ponownego wykorzystania kodu wordcloud:

  1. Ian Fellows zwraca uwagę w komentarzu, kod wordcloud oblicza rozmiary słowo i stanowiska w podstawowa grafika.
  2. Modyfikacja kodu zgodna z geom musi być świadoma aspektów.

Pod względem zarówno pracować, ramy do projektowania rozwiązanie może być:

  1. Przepisz wordcloud obliczyć rozmiary słowo w grafice siatki, zamiast grafiki bazowych
  2. Napisz wyniki słowo wielkość i położenie do ramki danych
  3. Wrap obliczeń w funkcji o nazwie stat_wordcloud
  4. Zmienić geom_text do nowego geom_wordcloud

Tak, to mrzonka, ale byłbym chętnie go używać raz zrobiłeś to ;-)

+1

Czy są jeszcze jakieś wiadomości, czy ktoś faktycznie to zrobił? :-) Jestem bardzo zainteresowany – rdatasculptor