ComeçarComece gratuitamente

Reunindo tudo isso (1)

Você teve a primeira experiência de escrever suas próprias funções nos exercícios anteriores. Você aprendeu a adicionar parâmetros às suas próprias definições de função, a retornar um valor ou vários valores com tuplas e a chamar as funções que definiu.

Neste exercício e no seguinte, você reunirá todos esses conceitos e os aplicará a um problema simples de ciência de dados. Você carregará um conjunto de dados e desenvolverá funcionalidades para extrair insights simples dos dados.

Para este exercício, seu objetivo é relembrar como carregar um conjunto de dados em um DataFrame. O conjunto de dados contém dados do Twitter e você iterará sobre as entradas em uma coluna para criar um dicionário no qual as chaves são os nomes dos idiomas e os valores são o número de tuítes no idioma fornecido. O arquivo tweets.csv está disponível no seu diretório atual.

Esteja ciente de que esses são dados reais do Twitter e, portanto, há sempre o risco de que eles contenham palavrões ou outros conteúdos ofensivos (neste exercício e em quaisquer exercícios seguintes que também usem dados reais do Twitter).

Este exercício faz parte do curso

Introdução a funções em Python

Ver Curso

Instruções de exercício

  • Importe o pacote pandas com o alias pd.
  • Importe o arquivo 'tweets.csv' usando a função do pandas read_csv(). Atribua o DataFrame resultante a df.
  • Conclua o loop for fazendo uma iteração sobre col, a coluna 'lang' no DataFrame df.
  • Complete os corpos das instruções if-else no loop for: se a chave estiver no dicionário langs_count, adicione 1 ao valor correspondente a essa chave no dicionário; caso contrário, adicione a chave a langs_count e defina o valor correspondente como 1. Use a variável de loop entry em seu código.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Import pandas


# Import Twitter data as DataFrame: df
df = ____

# Initialize an empty dictionary: langs_count
langs_count = {}

# Extract column from DataFrame: col
col = df['lang']

# Iterate over lang column in DataFrame
for entry in ____:

    # If the language is in langs_count, add 1 
    if entry in langs_count.keys():
        ____
    # Else add the language to langs_count, set the value to 1
    else:
        ____

# Print the populated dictionary
print(langs_count)
Editar e executar código