Visualiseer gemeenschappelijke woorden
Nu je een corpus hebt met woorden die in zowel de chardonnay- als de coffee-tweets voorkomen, kun je het corpus opschonen, omzetten naar een TermDocumentMatrix en daarna naar een matrix om het voor te bereiden op een commonality.cloud().
De functie commonality.cloud() accepteert dit matrixobject, plus extra argumenten zoals max.words en colors om de plot verder aan te passen.
commonality.cloud(tdm_matrix, max.words = 100, colors = "springgreen")
Deze oefening maakt deel uit van de cursus
Text mining met bag-of-words in R
Oefeninstructies
- Maak
all_cleandoor de vooraf gedefinieerde functieclean_corpus()toe te passen opall_corpus. - Maak
all_tdm, eenTermDocumentMatrixvanall_clean. - Maak
all_mdoorall_tdmom te zetten naar een matrixobject. - Maak een
commonality.cloud()vanall_mmetmax.words = 100encolors = "steelblue1".
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Clean the corpus
___ <- ___(___)
# Create all_tdm
___ <- ___(___)
# Create all_m
___ <- ___(___)
# Print a commonality cloud
___(___, ___, ___)