Détecter la langue
Le conseil municipal se demande s’il est pertinent de créer une version espagnole de l’application Get It Done. Il existe une importante population hispanophone, mais rien ne garantit leur engagement. Intégrer la traduction multilingue complexifie le système et doit être justifié.
Ils demandent à Sam de déterminer combien de personnes soumettent des demandes en espagnol.
Elle a déjà chargé le CSV dans la variable dumping_df et l’a réduit aux colonnes suivantes :

Aidez Sam à quantifier l’intérêt pour une version espagnole de l’application Get It Done. Déterminez combien de demandeurs utilisent l’espagnol et affichez le résultat final !
Cet exercice fait partie du cours
Introduction à AWS Boto en Python
Instructions
- Pour chaque ligne du DataFrame, détectez la langue dominante.
- Affectez la première langue renvoyée à la colonne
'lang'. - Comptez le nombre total de publications en espagnol.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# For each dataframe row
for index, row in dumping_df.iterrows():
# Get the public description field
description =dumping_df.loc[index, 'public_description']
if description != '':
# Detect language in the field content
resp = comprehend.____(____=description)
# Assign the top choice language to the lang column.
dumping_df.loc[index, 'lang'] = resp['____'][0]['____']
# Count the total number of spanish posts
spanish_post_ct = len(dumping_df[dumping_df.lang == 'es'])
# Print the result
print("{} posts in Spanish".format(spanish_post_ct))