Woordfrequenties visualiseren
Nu je de meest voorkomende woorden mét en zonder stopwoorden hebt berekend, is het tijd om de verschillen te visualiseren. In deze oefening gebruik je matplotlib om staafdiagrammen voor beide gevallen te plotten.
De volgende lijsten zijn alvast voor je geladen: top_words_without_stopwords, top_counts_without_stopwords, top_words_with_stopwords, top_counts_with_stopwords.
Deze oefening maakt deel uit van de cursus
Natural Language Processing (NLP) in Python
Oefeninstructies
- Gebruik
plt.bar()om de top 10 woordfrequenties mét stopwoorden te plotten. - Gebruik
plt.bar()om de top 10 woordfrequenties zónder stopwoorden te plotten.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
import matplotlib.pyplot as plt
# Plot the frequencies with stop words
plt.bar(____, ____)
plt.title("Top 10 word frequencies (with stop words)")
plt.xlabel("Words")
plt.ylabel("Frequency")
plt.show()
# Plot the frequencies without stop words
plt.figure()
plt.bar(____, ____)
plt.title("Top 10 word frequencies (without stop words)")
plt.xlabel("Words")
plt.ylabel("Frequency")
plt.show()