Reunindo tudo isso (1)
Você teve a primeira experiência de escrever suas próprias funções nos exercícios anteriores. Você aprendeu a adicionar parâmetros às suas próprias definições de função, a retornar um valor ou vários valores com tuplas e a chamar as funções que definiu.
Neste exercício e no seguinte, você reunirá todos esses conceitos e os aplicará a um problema simples de ciência de dados. Você carregará um conjunto de dados e desenvolverá funcionalidades para extrair insights simples dos dados.
Para este exercício, seu objetivo é relembrar como carregar um conjunto de dados em um DataFrame. O conjunto de dados contém dados do Twitter e você iterará sobre as entradas em uma coluna para criar um dicionário no qual as chaves são os nomes dos idiomas e os valores são o número de tuítes no idioma fornecido. O arquivo tweets.csv
está disponível no seu diretório atual.
Esteja ciente de que esses são dados reais do Twitter e, portanto, há sempre o risco de que eles contenham palavrões ou outros conteúdos ofensivos (neste exercício e em quaisquer exercícios seguintes que também usem dados reais do Twitter).
Este exercício faz parte do curso
Introdução a funções em Python
Instruções de exercício
- Importe o pacote pandas com o alias
pd
. - Importe o arquivo
'tweets.csv'
usando a função do pandasread_csv()
. Atribua o DataFrame resultante adf
. - Conclua o loop
for
fazendo uma iteração sobrecol
, a coluna'lang'
no DataFramedf
. - Complete os corpos das instruções
if-else
no loop for: se a chave estiver no dicionáriolangs_count
, adicione1
ao valor correspondente a essa chave no dicionário; caso contrário, adicione a chave alangs_count
e defina o valor correspondente como1
. Use a variável de loopentry
em seu código.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Import pandas
# Import Twitter data as DataFrame: df
df = ____
# Initialize an empty dictionary: langs_count
langs_count = {}
# Extract column from DataFrame: col
col = df['lang']
# Iterate over lang column in DataFrame
for entry in ____:
# If the language is in langs_count, add 1
if entry in langs_count.keys():
____
# Else add the language to langs_count, set the value to 1
else:
____
# Print the populated dictionary
print(langs_count)