ComeçarComece de graça

Detectando idioma

A Câmara Municipal quer saber se vale a pena criar uma versão em espanhol do aplicativo Get It Done. Há um grande público que fala espanhol, mas não se sabe se eles vão se engajar. Incluir tradução multilíngue complica o sistema e precisa ser justificado.

Eles pedem para Sam descobrir quantas pessoas estão enviando solicitações em espanhol.

Ela já carregou o CSV na variável dumping_df e fez um subconjunto com as seguintes colunas:

Get It Done requests in many languages

Ajude Sam a quantificar a demanda por uma versão em espanhol do Get It Done. Descubra quantos solicitantes usam espanhol e imprima o resultado final!

Este exercício faz parte do curso

Introdução ao AWS Boto em Python

Ver curso

Instruções do exercício

  • Para cada linha do DataFrame, detecte o idioma dominante.
  • Atribua o primeiro idioma selecionado à coluna 'lang'.
  • Conte o total de postagens em espanhol.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# For each dataframe row
for index, row in dumping_df.iterrows():
    # Get the public description field
    description =dumping_df.loc[index, 'public_description']
    if description != '':
        # Detect language in the field content
        resp = comprehend.____(____=description)
        # Assign the top choice language to the lang column.
        dumping_df.loc[index, 'lang'] = resp['____'][0]['____']
        
# Count the total number of spanish posts
spanish_post_ct = len(dumping_df[dumping_df.lang == 'es'])
# Print the result
print("{} posts in Spanish".format(spanish_post_ct))
Editar e executar o código