Aan de slagGa gratis aan de slag

Snelle check van Google-reviews

Je besluit een comparison.cloud() te maken van Google's positieve en negatieve reviews om te vergelijken met Amazon. Zo krijg je snel een beeld van de belangrijkste termen zonder net zo veel tijd te hoeven besteden als bij het doornemen van de Amazon-reviews in de vorige oefeningen.

We hebben een corpus all_goog_corpus voor je klaargezet, met 500 positieve en 500 negatieve reviews voor Google. Hier ga je het corpus opschonen en een comparison cloud maken die de veelvoorkomende woorden in zowel de pro- als de contra-reviews vergelijkt.

Deze oefening maakt deel uit van de cursus

Text mining met bag-of-words in R

Cursus bekijken

Oefeninstructies

Het object all_goog_corpus, met Google pro- en contra-reviews, is geladen in je werkruimte.

  • Maak all_goog_corp door all_goog_corpus op te schonen met de vooraf gedefinieerde functie tm_clean().
  • Maak all_tdm door all_goog_corp om te zetten naar een term-documentmatrix.
  • Maak all_m door all_tdm om te zetten naar een matrix.
  • Bouw een comparison.cloud() op basis van all_m. Zet max.words op 100. Het argument colors is al voor je gespecificeerd.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create all_goog_corp
___ <- ___

# Create all_tdm
___ <- ___

# Create all_m
___ <- ___

# Build a comparison cloud
___(___, 
    max.words = ___, 
    colors = c("#F44336", "#2196f3"))
Code bewerken en uitvoeren