Aan de slagGa gratis aan de slag

Stap 1: Woordwolk en feature-creatie

Je werkt in deze oefening met een steekproef van de gegevensset reviews. Deze bevat de kolommen review en score. Verken ze gerust in de IPython-shell.

In de eerste stap bouw je een woordwolk met alleen positieve reviews. De string positive_reviews is al voor je aangemaakt door de 100 meest positieve reviews samen te voegen.

In de tweede stap maak je een nieuwe feature voor de lengte van elke review en voeg je die feature toe aan de gegevensset.

Alle functies die nodig zijn om een woordwolk te plotten zijn voor je geïmporteerd, evenals de functie word_tokenize uit de module nltk.

Deze oefening maakt deel uit van de cursus

Sentimentanalyse in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create and generate a word cloud image
cloud_positives = ____(background_color='white').____(positive_reviews)
 
# Display the generated wordcloud image
plt.___(cloud_positives, interpolation='bilinear') 
plt.axis("off")

# Don't forget to show the final image
plt.show()
Code bewerken en uitvoeren