Comprensiones de listas para datos con marca temporal
Ahora utilizarás lo que has aprendido en este capítulo para resolver un sencillo problema de extracción de datos. En este ejercicio también conocerás la estructura de datos Serie de pandas. No nos extenderemos mucho sobre ella aquí, pero debes saber que es que es una estructura de datos con la que trabajarás muchas veces al analizar datos de DataFrames de pandas. Las columnas del DataFrame son como matrices unidimensionales llamadas series.
En este ejercicio, utilizarás una comprensión de listas para extraer la hora de los datos de Twitter con marca temporal. El paquete pandas se ha importado como pd
y el archivo 'tweets.csv'
se ha importado como DataFrame df
para que lo uses.
Este ejercicio forma parte del curso
Caja de herramientas Python
Instrucciones de ejercicio
- Extrae la columna
'created_at'
dedf
y asigna el resultado atweet_time
. Dato curioso: la columna extraída detweet_time
es aquí la estructura de datos Serie. - Crea una comprensión de listas que extraiga la hora de cada fila de
tweet_time
. Cada fila es una cadena que representa una marca temporal, y accederás a los caracteres 12-19 de la cadena para extraer la hora. Utilizaentry
como variable de iterador y asigna el resultado atweet_clock_time
. Recuerda que Python utiliza la indexación de base 0.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Extract the created_at column from df: tweet_time
tweet_time = ____
# Extract the clock time: tweet_clock_time
tweet_clock_time = [____]
# Print the extracted times
print(tweet_clock_time)