Sentiment de la communauté des trottinettes
Le Conseil municipal souhaite savoir comment les différentes communautés de la ville réagissent aux trottinettes. Le jeu de données s’est étoffé depuis l’analyse initiale de Sam et contient désormais des signalements en vietnamien, tagalog, espagnol et anglais.
On demande à Sam d’examiner la question. Elle décide que, compte tenu des données immédiatement disponibles, la langue est le meilleur proxy pour identifier une communauté.
Elle a déjà chargé le CSV dans la variable scooter_df :

Dans cet exercice, vous allez aider Sam à analyser le sentiment dans plusieurs langues. Cela permettra à la Ville de mieux comprendre la perception des trottinettes selon les communautés, ce qui pourrait influencer le vote des membres du Conseil municipal.
Cet exercice fait partie du cours
Introduction à AWS Boto en Python
Instructions
- Pour chaque ligne du DataFrame, détectez la langue dominante.
- Utilisez la langue détectée pour déterminer le sentiment de la description.
- Regroupez le DataFrame par les colonnes
'sentiment'puis'lang', dans cet ordre.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
for index, row in scooter_requests.iterrows():
# For every DataFrame row
desc = scooter_requests.loc[index, 'public_description']
if desc != '':
# Detect the dominant language
resp = comprehend.____(____=desc)
lang_code = resp['Languages'][0]['LanguageCode']
scooter_requests.loc[index, 'lang'] = lang_code
# Use the detected language to determine sentiment
scooter_requests.loc[index, 'sentiment'] = comprehend.____(
____=desc,
____=lang_code)['____']
# Perform a count of sentiment by group.
counts = scooter_requests.groupby(['sentiment', 'lang']).count()
counts.head()