Bewerkingen op strings
Nu je de tekstgegevens in bags kunt laden, is het tijd om er echt iets mee te doen. Om te bepalen hoe positief of negatief de reviews zijn, begin je met het tellen van een paar trefwoorden.
De bag die je in de vorige oefening hebt gemaakt, review_bag, is beschikbaar in je omgeving.
Deze oefening maakt deel uit van de cursus
Parallel programmeren met Dask in Python
Oefeninstructies
- Gebruik de
.lower()-methode van de string-toegangsmethode vanreview_bagom elke review naar kleine letters om te zetten. - Gebruik de
.count()-methode van de string-toegangsmethode om te tellen hoe vaak het woord'excellent'in elke review voorkomt. - Print 10 waarden van
excellent_counts.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Convert all of the reviews to lower case
lowercase_reviews = review_bag.____
# Count the number of times 'excellent' appears in each review
excellent_counts = lowercase_reviews.____
# Print the first 10 counts of 'excellent'
print(____)