Explora el conjunto de datos de Jobs
En este ejercicio vas a explorar el nuevo DataFrame jobs, que contiene la tasa de desempleo de distintas industrias en EE. UU. durante los años 2000-2010. Como verás, el conjunto de datos incluye series temporales para 16 industrias y a lo largo de 122 puntos temporales (uno por mes durante 10 años). En general, el flujo de trabajo típico de un proyecto de ciencia de datos incluye limpieza y exploración de datos, así que empezaremos leyendo los datos y comprobando si hay valores ausentes.
Este ejercicio forma parte del curso
Visualización de datos temporales en Python
Instrucciones del ejercicio
Hemos importado pandas como pd.
- Lee el archivo csv ubicado en
url_jobsen un DataFrame llamadojobsy revisa el tipo de datos de cada columna. - Convierte la columna
datestampenjobsal tipodatetime. - Establece la columna
datestampcomo índice dejobs. - Imprime el número de valores ausentes en cada columna de
jobs.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Read in jobs file
jobs = ____
# Print first five lines of your DataFrame
print(jobs.head(5))
# Check the type of each column in your DataFrame
print(jobs.dtypes)
# Convert datestamp column to a datetime object
jobs[____] = ____(jobs[____])
# Set the datestamp columns as the index of your DataFrame
jobs = ____('datestamp')
# Check the number of missing values in each column
print(jobs.isnull().____())