Snelle check van Google-reviews
Je besluit een comparison.cloud() te maken van Google's positieve en negatieve reviews om te vergelijken met Amazon. Zo krijg je snel een beeld van de belangrijkste termen zonder net zo veel tijd te hoeven besteden als bij het doornemen van de Amazon-reviews in de vorige oefeningen.
We hebben een corpus all_goog_corpus voor je klaargezet, met 500 positieve en 500 negatieve reviews voor Google. Hier ga je het corpus opschonen en een comparison cloud maken die de veelvoorkomende woorden in zowel de pro- als de contra-reviews vergelijkt.
Deze oefening maakt deel uit van de cursus
Text mining met bag-of-words in R
Oefeninstructies
Het object all_goog_corpus, met Google pro- en contra-reviews, is geladen in je werkruimte.
- Maak
all_goog_corpdoorall_goog_corpusop te schonen met de vooraf gedefinieerde functietm_clean(). - Maak
all_tdmdoorall_goog_corpom te zetten naar een term-documentmatrix. - Maak
all_mdoorall_tdmom te zetten naar een matrix. - Bouw een
comparison.cloud()op basis vanall_m. Zetmax.wordsop100. Het argumentcolorsis al voor je gespecificeerd.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create all_goog_corp
___ <- ___
# Create all_tdm
___ <- ___
# Create all_m
___ <- ___
# Build a comparison cloud
___(___,
max.words = ___,
colors = c("#F44336", "#2196f3"))