Hoeveel positieve en negatieve reviews zijn er?
Als eerste stap in een sentimentanalyse, net als bij andere data science-problemen, wil je de gegevensset vaak wat beter verkennen.
Je werkt met een steekproef van IMDB-filmreviews. Er is een gegevensset movies voor je klaargezet. Dit is een steekproef van de data die we in de dia's zagen. Verken die gerust in de IPython-shell, bijvoorbeeld met de methode .head().
Wees je ervan bewust dat deze oefening echte data gebruikt, en dat er dus altijd een kans is dat er grof taalgebruik of andere aanstootgevende inhoud in voorkomt (in deze oefening en in eventuele volgende oefeningen die ook echte data gebruiken).
Deze oefening maakt deel uit van de cursus
Sentimentanalyse in Python
Oefeninstructies
- Bepaal het aantal positieve en negatieve reviews in de gegevensset
movies. - Bepaal het aandeel (percentage) positieve en negatieve reviews in de gegevensset.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Find the number of positive and negative reviews
print('Number of positive and negative reviews: ', movies.label.____)
# Find the proportion of positive and negative reviews
print('Proportion of positive and negative reviews: ', movies.label.____ / ____(movies))