Carregando tweets em um DataFrame
Agora é hora de importar dados para um DataFrame do pandas para que possamos analisar tweets em escala.
Vamos trabalhar com um conjunto de dados de tweets que contêm as hashtags '#rstats' ou '#python'. Esse conjunto de dados está armazenado como uma lista de objetos JSON de tweets em data_science_json.
Este curso aborda muitos conceitos que você pode ter esquecido; se precisar de uma revisão rápida, baixe o Pandas basics Cheat Sheet e deixe-o à mão!
Atenção: estes são dados reais do Twitter e, por isso, sempre há risco de presença de palavrões ou outro conteúdo ofensivo (neste exercício e em quaisquer outros que também usem dados reais do Twitter).
Este exercício faz parte do curso
Analisando dados de mídias sociais em Python
Instruções do exercício
- Importe o
pandas(lembre-se: por convenção, usamos o aliaspd). - Achate os tweets de
data_science_jsoncomflatten_tweets()e armazene-os emtweets. - Crie um DataFrame a partir de
tweetsusandopd.DataFrame(). - Imprima o texto dos primeiros 5 tweets.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import pandas
import ____ as ____
# Flatten the tweets and store in `tweets`
tweets = ____(____)
# Create a DataFrame from `tweets`
ds_tweets = ____(____)
# Print out the first 5 tweets from this dataset
print(ds_tweets[____].values[0:5])