ComeçarComece de graça

Carregando tweets em um DataFrame

Agora é hora de importar dados para um DataFrame do pandas para que possamos analisar tweets em escala.

Vamos trabalhar com um conjunto de dados de tweets que contêm as hashtags '#rstats' ou '#python'. Esse conjunto de dados está armazenado como uma lista de objetos JSON de tweets em data_science_json.

Este curso aborda muitos conceitos que você pode ter esquecido; se precisar de uma revisão rápida, baixe o Pandas basics Cheat Sheet e deixe-o à mão!

Atenção: estes são dados reais do Twitter e, por isso, sempre há risco de presença de palavrões ou outro conteúdo ofensivo (neste exercício e em quaisquer outros que também usem dados reais do Twitter).

Este exercício faz parte do curso

Analisando dados de mídias sociais em Python

Ver curso

Instruções do exercício

  • Importe o pandas (lembre-se: por convenção, usamos o alias pd).
  • Achate os tweets de data_science_json com flatten_tweets() e armazene-os em tweets.
  • Crie um DataFrame a partir de tweets usando pd.DataFrame().
  • Imprima o texto dos primeiros 5 tweets.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import pandas
import ____ as ____

# Flatten the tweets and store in `tweets`
tweets = ____(____)

# Create a DataFrame from `tweets`
ds_tweets = ____(____)

# Print out the first 5 tweets from this dataset
print(ds_tweets[____].values[0:5])
Editar e executar o código