Sentimento da comunidade sobre scooters

A Câmara Municipal quer entender como diferentes comunidades da cidade estão reagindo aos scooters. O conjunto de dados cresceu desde a análise inicial da Sam e agora contém relatos em vietnamita, tagalo, espanhol e inglês.

Eles pedem para Sam investigar. Ela decide que a melhor forma de representar uma comunidade é pelo idioma (pelo menos com os dados a que tem acesso agora).

Ela já carregou o CSV na variável scooter_df:

Scooter dataframe contents

Neste exercício, você vai ajudar a Sam a entender o sentimento em vários idiomas. Isso vai ajudar a cidade a compreender como diferentes comunidades estão se relacionando com os scooters, algo que pode influenciar os votos dos membros da Câmara Municipal.

Este exercício faz parte do curso

Introdução ao AWS Boto em Python

Ver curso

Instruções do exercício

Para cada linha do DataFrame, detecte o idioma dominante.
Use o idioma detectado para determinar o sentimento da descrição.
Agrupe o DataFrame pelas colunas 'sentiment' e 'lang', nessa ordem.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

for index, row in scooter_requests.iterrows():
  	# For every DataFrame row
    desc = scooter_requests.loc[index, 'public_description']
    if desc != '':
      	# Detect the dominant language
        resp = comprehend.____(____=desc)
        lang_code = resp['Languages'][0]['LanguageCode']
        scooter_requests.loc[index, 'lang'] = lang_code
        # Use the detected language to determine sentiment
        scooter_requests.loc[index, 'sentiment'] = comprehend.____(
          ____=desc, 
          ____=lang_code)['____']
# Perform a count of sentiment by group.
counts = scooter_requests.groupby(['sentiment', 'lang']).count()
counts.head()

Editar e executar o código