Opérations sur les chaînes de caractères
Maintenant que vous savez charger des données texte dans des bags, passons à l’action. Pour détecter si les avis sont positifs ou négatifs, vous allez commencer par compter certains mots-clés.
Le bag que vous avez créé dans l’exercice précédent, review_bag, est disponible dans votre environnement.
Cet exercice fait partie du cours
Programmation parallèle avec Dask en Python
Instructions
- Utilisez la méthode
.lower()de l’accesseur de chaînes dereview_bagpour mettre chaque avis en minuscules. - Utilisez la méthode
.count()de l’accesseur de chaînes pour compter combien de fois le mot'excellent'apparaît dans chaque avis. - Affichez 10 valeurs de
excellent_counts.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Convert all of the reviews to lower case
lowercase_reviews = review_bag.____
# Count the number of times 'excellent' appears in each review
excellent_counts = lowercase_reviews.____
# Print the first 10 counts of 'excellent'
print(____)