Wie viele positive und negative Bewertungen gibt es?
Als ersten Schritt in einer Sentiment-Analyse, ähnlich wie bei anderen Data-Science-Aufgaben, möchtest du den Datensatz genauer erkunden.
Du arbeitest mit einer Stichprobe der IMDB-Filmrezensionen. Ein Datensatz namens movies wurde für dich erstellt. Er ist eine Stichprobe der Daten, die wir in den Folien gesehen haben. Du kannst ihn gern in der IPython-Shell erkunden, zum Beispiel mit der Methode .head().
Beachte, dass diese Übung echte Daten verwendet und daher das Risiko besteht, dass sie Obszönitäten oder andere anstößige Inhalte enthält (in dieser Übung und in allen folgenden Übungen, die ebenfalls echte Daten verwenden).
Diese Übung ist Teil des Kurses
Stimmungsanalyse in Python
Anleitung zur Übung
- Ermittle die Anzahl der positiven und negativen Bewertungen im
movies-Datensatz. - Ermittle den Anteil (Prozentsatz) der positiven und negativen Bewertungen im Datensatz.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Find the number of positive and negative reviews
print('Number of positive and negative reviews: ', movies.label.____)
# Find the proportion of positive and negative reviews
print('Proportion of positive and negative reviews: ', movies.label.____ / ____(movies))