Sentiment de la communauté des trottinettes

Le Conseil municipal souhaite savoir comment les différentes communautés de la ville réagissent aux trottinettes. Le jeu de données s’est étoffé depuis l’analyse initiale de Sam et contient désormais des signalements en vietnamien, tagalog, espagnol et anglais.

On demande à Sam d’examiner la question. Elle décide que, compte tenu des données immédiatement disponibles, la langue est le meilleur proxy pour identifier une communauté.

Elle a déjà chargé le CSV dans la variable scooter_df :

Scooter dataframe contents

Dans cet exercice, vous allez aider Sam à analyser le sentiment dans plusieurs langues. Cela permettra à la Ville de mieux comprendre la perception des trottinettes selon les communautés, ce qui pourrait influencer le vote des membres du Conseil municipal.

Cet exercice fait partie du cours

<cours>Introduction à AWS Boto en Python</cours>

Voir le cours

Instructions de l’exercice

Pour chaque ligne du DataFrame, détectez la langue dominante.
Utilisez la langue détectée pour déterminer le sentiment de la description.
Regroupez le DataFrame par les colonnes 'sentiment' puis 'lang', dans cet ordre.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

for index, row in scooter_requests.iterrows():
  	# For every DataFrame row
    desc = scooter_requests.loc[index, 'public_description']
    if desc != '':
      	# Detect the dominant language
        resp = comprehend.____(____=desc)
        lang_code = resp['Languages'][0]['LanguageCode']
        scooter_requests.loc[index, 'lang'] = lang_code
        # Use the detected language to determine sentiment
        scooter_requests.loc[index, 'sentiment'] = comprehend.____(
          ____=desc, 
          ____=lang_code)['____']
# Perform a count of sentiment by group.
counts = scooter_requests.groupby(['sentiment', 'lang']).count()
counts.head()

Modifier et exécuter le code