Explore o conjunto de dados Jobs
Neste exercício, você vai explorar o novo DataFrame jobs, que contém a taxa de desemprego de diferentes setores nos EUA durante os anos de 2000 a 2010. Como você verá, o conjunto de dados contém séries temporais para 16 setores e ao longo de 122 pontos no tempo (um por mês durante 10 anos). Em geral, o fluxo de trabalho típico de um projeto de Data Science envolve limpeza e exploração de dados, então vamos começar lendo os dados e verificando valores ausentes.
Este exercício faz parte do curso
Visualizing Time Series Data in Python
Instruções do exercício
Nós já importamos pandas como pd.
- Leia o arquivo csv localizado em
url_jobsem um DataFrame chamadojobse revise o tipo de dado de cada coluna. - Converta a coluna
datestampemjobspara o tipodatetime. - Defina a coluna
datestampcomo índice dejobs. - Imprima o número de valores ausentes em cada coluna de
jobs.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Read in jobs file
jobs = ____
# Print first five lines of your DataFrame
print(jobs.head(5))
# Check the type of each column in your DataFrame
print(jobs.dtypes)
# Convert datestamp column to a datetime object
jobs[____] = ____(jobs[____])
# Set the datestamp columns as the index of your DataFrame
jobs = ____('datestamp')
# Check the number of missing values in each column
print(jobs.isnull().____())