Woordwolk van filmrecensies
Je werkt met de dataset met filmrecensies. Je hebt gekeken naar de verdeling van de recensies en gezien hoe lang de kortste en langste recensies zijn. Maar waar gaan positieve en negatieve recensies nu eigenlijk over?
In deze oefening ga je een woordwolk maken van de top 100 positieve recensies.
Welke woorden springen eruit? Klinkt dat logisch voor jou?
De string descriptions is voor je klaargezet door de beschrijvingen van de top 100 positieve recensies aan elkaar te plakken. Een filmspecifieke set stopwoorden (zeer frequente woorden, zoals the, a/an en and, die weinig informatief zijn en die we uit de grafiek willen weglaten) is beschikbaar als my_stopwords. Denk eraan dat het argument interpolation de woordwolk vloeiender laat ogen.
Deze oefening maakt deel uit van de cursus
Sentimentanalyse in Python
Oefeninstructies
- Importeer de functie wordcloud uit het bijbehorende pakket.
- Pas de wordcloud-functie toe op de string
descriptions. Stel de achtergrondkleur in op 'white' en wijzig het argumentstopwords. - Maak een wordcloud-afbeelding.
- Vergeet tot slot niet de afbeelding te tonen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the word cloud function
____
# Create and generate a word cloud image
my_cloud = ____(____='white', ____=my_stopwords).____(descriptions)
# Display the generated wordcloud image
plt.____(____, interpolation='bilinear')
plt.axis("off")
# Don't forget to show the final image
____