CommencerCommencer gratuitement

Sentiment de la communauté des trottinettes

Le Conseil municipal souhaite savoir comment les différentes communautés de la ville réagissent aux trottinettes. Le jeu de données s’est étoffé depuis l’analyse initiale de Sam et contient désormais des signalements en vietnamien, tagalog, espagnol et anglais.

On demande à Sam d’examiner la question. Elle décide que, compte tenu des données immédiatement disponibles, la langue est le meilleur proxy pour identifier une communauté.

Elle a déjà chargé le CSV dans la variable scooter_df :

Scooter dataframe contents

Dans cet exercice, vous allez aider Sam à analyser le sentiment dans plusieurs langues. Cela permettra à la Ville de mieux comprendre la perception des trottinettes selon les communautés, ce qui pourrait influencer le vote des membres du Conseil municipal.

Cet exercice fait partie du cours

Introduction à AWS Boto en Python

Afficher le cours

Instructions

  • Pour chaque ligne du DataFrame, détectez la langue dominante.
  • Utilisez la langue détectée pour déterminer le sentiment de la description.
  • Regroupez le DataFrame par les colonnes 'sentiment' puis 'lang', dans cet ordre.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

for index, row in scooter_requests.iterrows():
  	# For every DataFrame row
    desc = scooter_requests.loc[index, 'public_description']
    if desc != '':
      	# Detect the dominant language
        resp = comprehend.____(____=desc)
        lang_code = resp['Languages'][0]['LanguageCode']
        scooter_requests.loc[index, 'lang'] = lang_code
        # Use the detected language to determine sentiment
        scooter_requests.loc[index, 'sentiment'] = comprehend.____(
          ____=desc, 
          ____=lang_code)['____']
# Perform a count of sentiment by group.
counts = scooter_requests.groupby(['sentiment', 'lang']).count()
counts.head()
Modifier et exécuter le code