ComenzarEmpieza gratis

Crear un data frame de series temporales

Los datos de series temporales se usan cuando queremos analizar o explorar la variación a lo largo del tiempo. Esto es útil al explorar texto de Twitter si queremos seguir la prevalencia de una palabra o conjunto de palabras.

El primer paso es convertir el DataFrame a un formato que pueda manejarse con los métodos de series temporales de pandas. Esto se puede hacer convirtiendo el índice a tipo datetime.

Este ejercicio forma parte del curso

Análisis de datos de redes sociales con Python

Ver curso

Instrucciones del ejercicio

  • Imprime las primeras cinco filas de created_at en ds_tweets con el método .head().
  • Convierte esa columna a tipo datetime con el método .to_datetime() de pandas.
  • Vuelve a imprimir las primeras cinco filas.
  • Establece el índice a created_at con .set_index().

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Print created_at to see the original format of datetime in Twitter data
print(ds_tweets[____].____())

# Convert the created_at column to np.datetime object
ds_tweets[____] = pd.____(____)

# Print created_at to see new format
print(ds_tweets[____].____())

# Set the index of ds_tweets to created_at
ds_tweets = ds_tweets.____(____)
Editar y ejecutar código