Woordwolk van filmrecensies

Je werkt met de dataset met filmrecensies. Je hebt gekeken naar de verdeling van de recensies en gezien hoe lang de kortste en langste recensies zijn. Maar waar gaan positieve en negatieve recensies nu eigenlijk over?

In deze oefening ga je een woordwolk maken van de top 100 positieve recensies.

Welke woorden springen eruit? Klinkt dat logisch voor jou?

De string descriptions is voor je klaargezet door de beschrijvingen van de top 100 positieve recensies aan elkaar te plakken. Een filmspecifieke set stopwoorden (zeer frequente woorden, zoals the, a/an en and, die weinig informatief zijn en die we uit de grafiek willen weglaten) is beschikbaar als my_stopwords. Denk eraan dat het argument interpolation de woordwolk vloeiender laat ogen.

Deze oefening maakt deel uit van de cursus

Sentimentanalyse in Python

Bekijk cursus

Oefeninstructies

Importeer de functie wordcloud uit het bijbehorende pakket.
Pas de wordcloud-functie toe op de string descriptions. Stel de achtergrondkleur in op 'white' en wijzig het argument stopwords.
Maak een wordcloud-afbeelding.
Vergeet tot slot niet de afbeelding te tonen.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Import the word cloud function  
____

# Create and generate a word cloud image 
my_cloud = ____(____='white', ____=my_stopwords).____(descriptions)

# Display the generated wordcloud image
plt.____(____, interpolation='bilinear') 
plt.axis("off")

# Don't forget to show the final image
____

Code bewerken en uitvoeren