ComenzarEmpieza gratis

Explora el conjunto de datos de Jobs

En este ejercicio vas a explorar el nuevo DataFrame jobs, que contiene la tasa de desempleo de distintas industrias en EE. UU. durante los años 2000-2010. Como verás, el conjunto de datos incluye series temporales para 16 industrias y a lo largo de 122 puntos temporales (uno por mes durante 10 años). En general, el flujo de trabajo típico de un proyecto de ciencia de datos incluye limpieza y exploración de datos, así que empezaremos leyendo los datos y comprobando si hay valores ausentes.

Este ejercicio forma parte del curso

Visualización de datos temporales en Python

Ver curso

Instrucciones del ejercicio

Hemos importado pandas como pd.

  • Lee el archivo csv ubicado en url_jobs en un DataFrame llamado jobs y revisa el tipo de datos de cada columna.
  • Convierte la columna datestamp en jobs al tipo datetime.
  • Establece la columna datestamp como índice de jobs.
  • Imprime el número de valores ausentes en cada columna de jobs.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Read in jobs file
jobs = ____

# Print first five lines of your DataFrame
print(jobs.head(5))

# Check the type of each column in your DataFrame
print(jobs.dtypes)

# Convert datestamp column to a datetime object
jobs[____] = ____(jobs[____])

# Set the datestamp columns as the index of your DataFrame
jobs = ____('datestamp')

# Check the number of missing values in each column
print(jobs.isnull().____())
Editar y ejecutar código