Aan de slagGa gratis aan de slag

Visualiseer gemeenschappelijke woorden

Nu je een corpus hebt met woorden die in zowel de chardonnay- als de coffee-tweets voorkomen, kun je het corpus opschonen, omzetten naar een TermDocumentMatrix en daarna naar een matrix om het voor te bereiden op een commonality.cloud().

De functie commonality.cloud() accepteert dit matrixobject, plus extra argumenten zoals max.words en colors om de plot verder aan te passen.

commonality.cloud(tdm_matrix, max.words = 100, colors = "springgreen")

Deze oefening maakt deel uit van de cursus

Text mining met bag-of-words in R

Cursus bekijken

Oefeninstructies

  • Maak all_clean door de vooraf gedefinieerde functie clean_corpus() toe te passen op all_corpus.
  • Maak all_tdm, een TermDocumentMatrix van all_clean.
  • Maak all_m door all_tdm om te zetten naar een matrixobject.
  • Maak een commonality.cloud() van all_m met max.words = 100 en colors = "steelblue1".

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Clean the corpus
___ <- ___(___)

# Create all_tdm
___ <- ___(___)

# Create all_m
___ <- ___(___)

# Print a commonality cloud
___(___, ___, ___)
Code bewerken en uitvoeren