Criando um data frame de séries temporais
Usamos dados de séries temporais quando queremos analisar ou explorar variações ao longo do tempo. Isso é útil ao explorar textos do Twitter se quisermos acompanhar a ocorrência de uma palavra ou de um conjunto de palavras.
O primeiro passo é converter o DataFrame para um formato que possa ser manipulado com os métodos de séries temporais do pandas. Isso pode ser feito convertendo o índice para o tipo datetime.
Este exercício faz parte do curso
Analisando dados de mídias sociais em Python
Instruções do exercício
- Imprima as primeiras cinco linhas de
created_atemds_tweetscom o método.head(). - Converta essa coluna para o tipo datetime com o método
.to_datetime()do pandas. - Imprima novamente as primeiras cinco linhas.
- Defina o índice como
created_atcom.set_index().
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Print created_at to see the original format of datetime in Twitter data
print(ds_tweets[____].____())
# Convert the created_at column to np.datetime object
ds_tweets[____] = pd.____(____)
# Print created_at to see new format
print(ds_tweets[____].____())
# Set the index of ds_tweets to created_at
ds_tweets = ds_tweets.____(____)