CommencerCommencer gratuitement

Détecter la langue

Le conseil municipal se demande s’il est pertinent de créer une version espagnole de l’application Get It Done. Il existe une importante population hispanophone, mais rien ne garantit leur engagement. Intégrer la traduction multilingue complexifie le système et doit être justifié.

Ils demandent à Sam de déterminer combien de personnes soumettent des demandes en espagnol.

Elle a déjà chargé le CSV dans la variable dumping_df et l’a réduit aux colonnes suivantes :

Get It Done requests in many languages

Aidez Sam à quantifier l’intérêt pour une version espagnole de l’application Get It Done. Déterminez combien de demandeurs utilisent l’espagnol et affichez le résultat final !

Cet exercice fait partie du cours

Introduction à AWS Boto en Python

Afficher le cours

Instructions

  • Pour chaque ligne du DataFrame, détectez la langue dominante.
  • Affectez la première langue renvoyée à la colonne 'lang'.
  • Comptez le nombre total de publications en espagnol.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# For each dataframe row
for index, row in dumping_df.iterrows():
    # Get the public description field
    description =dumping_df.loc[index, 'public_description']
    if description != '':
        # Detect language in the field content
        resp = comprehend.____(____=description)
        # Assign the top choice language to the lang column.
        dumping_df.loc[index, 'lang'] = resp['____'][0]['____']
        
# Count the total number of spanish posts
spanish_post_ct = len(dumping_df[dumping_df.lang == 'es'])
# Print the result
print("{} posts in Spanish".format(spanish_post_ct))
Modifier et exécuter le code