ComeçarComece de graça

Explore o conjunto de dados Jobs

Neste exercício, você vai explorar o novo DataFrame jobs, que contém a taxa de desemprego de diferentes setores nos EUA durante os anos de 2000 a 2010. Como você verá, o conjunto de dados contém séries temporais para 16 setores e ao longo de 122 pontos no tempo (um por mês durante 10 anos). Em geral, o fluxo de trabalho típico de um projeto de Data Science envolve limpeza e exploração de dados, então vamos começar lendo os dados e verificando valores ausentes.

Este exercício faz parte do curso

Visualizing Time Series Data in Python

Ver curso

Instruções do exercício

Nós já importamos pandas como pd.

  • Leia o arquivo csv localizado em url_jobs em um DataFrame chamado jobs e revise o tipo de dado de cada coluna.
  • Converta a coluna datestamp em jobs para o tipo datetime.
  • Defina a coluna datestamp como índice de jobs.
  • Imprima o número de valores ausentes em cada coluna de jobs.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Read in jobs file
jobs = ____

# Print first five lines of your DataFrame
print(jobs.head(5))

# Check the type of each column in your DataFrame
print(jobs.dtypes)

# Convert datestamp column to a datetime object
jobs[____] = ____(jobs[____])

# Set the datestamp columns as the index of your DataFrame
jobs = ____('datestamp')

# Check the number of missing values in each column
print(jobs.isnull().____())
Editar e executar o código