Crear un data frame de series temporales
Los datos de series temporales se usan cuando queremos analizar o explorar la variación a lo largo del tiempo. Esto es útil al explorar texto de Twitter si queremos seguir la prevalencia de una palabra o conjunto de palabras.
El primer paso es convertir el DataFrame a un formato que pueda manejarse con los métodos de series temporales de pandas. Esto se puede hacer convirtiendo el índice a tipo datetime.
Este ejercicio forma parte del curso
Análisis de datos de redes sociales con Python
Instrucciones del ejercicio
- Imprime las primeras cinco filas de
created_atends_tweetscon el método.head(). - Convierte esa columna a tipo datetime con el método
.to_datetime()de pandas. - Vuelve a imprimir las primeras cinco filas.
- Establece el índice a
created_atcon.set_index().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Print created_at to see the original format of datetime in Twitter data
print(ds_tweets[____].____())
# Convert the created_at column to np.datetime object
ds_tweets[____] = pd.____(____)
# Print created_at to see new format
print(ds_tweets[____].____())
# Set the index of ds_tweets to created_at
ds_tweets = ds_tweets.____(____)