Uso de .melt() para remodelar dados governamentais
O Bureau of Labor Statistics (BLS) dos EUA costuma disponibilizar séries de dados num formato fácil de ler - tem uma coluna separada para cada mês e cada ano é uma linha diferente. Infelizmente, esse formato amplo dificulta a plotagem dessas informações ao longo do tempo. Neste exercício, você vai reorganizar uma tabela com dados sobre a taxa de desemprego nos EUA, que veio do BLS, de um jeito que você possa colocar no .melt()
. Você precisará adicionar uma coluna de data à tabela e classificar por ela para plotar os dados corretamente.
Os dados da taxa de desemprego foram carregados para você em uma tabela chamada ur_wide
. Recomendamos que você explore essa tabela antes de iniciar o exercício.
Este exercício faz parte do curso
Junção de dados com o pandas
Instruções do exercício
- Use
.melt()
para desarticular todas as colunas deur_wide
, excetoyear
, e certifique-se de que as colunas com os meses e valores sejam nomeadasmonth
eunempl_rate
, respectivamente. Salve o resultado comour_tall
. - Adicione uma coluna a
ur_tall
chamadadate
, que combina as colunasyear
emonth
no formato ano-mês em uma cadeia de caracteres maior e a converte em um tipo de dados de data. - Classifique
ur_tall
por data e salve comour_sorted
. - Usando
ur_sorted
, traceunempl_rate
no eixo y edate
no eixo x.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# unpivot everything besides the year column
ur_tall = ____
# Create a date column using the month and year columns of ur_tall
ur_tall['date'] = pd.to_datetime(ur_tall['____'] + '-' + ____)
# Sort ur_tall by date in ascending order
ur_sorted = ____
# Plot the unempl_rate by date
ur_sorted.plot(____)
plt.show()