ComenzarEmpieza gratis

Comprensiones de listas para datos con marca temporal

Ahora utilizarás lo que has aprendido en este capítulo para resolver un sencillo problema de extracción de datos. En este ejercicio también conocerás la estructura de datos Serie de pandas. No nos extenderemos mucho sobre ella aquí, pero debes saber que es que es una estructura de datos con la que trabajarás muchas veces al analizar datos de DataFrames de pandas. Las columnas del DataFrame son como matrices unidimensionales llamadas series.

En este ejercicio, utilizarás una comprensión de listas para extraer la hora de los datos de Twitter con marca temporal. El paquete pandas se ha importado como pd y el archivo 'tweets.csv' se ha importado como DataFrame df para que lo uses.

Este ejercicio forma parte del curso

Caja de herramientas Python

Ver curso

Instrucciones de ejercicio

  • Extrae la columna 'created_at' de df y asigna el resultado a tweet_time. Dato curioso: la columna extraída de tweet_time es aquí la estructura de datos Serie.
  • Crea una comprensión de listas que extraiga la hora de cada fila de tweet_time. Cada fila es una cadena que representa una marca temporal, y accederás a los caracteres 12-19 de la cadena para extraer la hora. Utiliza entry como variable de iterador y asigna el resultado a tweet_clock_time. Recuerda que Python utiliza la indexación de base 0.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Extract the created_at column from df: tweet_time
tweet_time = ____

# Extract the clock time: tweet_clock_time
tweet_clock_time = [____]

# Print the extracted times
print(tweet_clock_time)
Editar y ejecutar código