Visualização de dados confusos
Vamos dar uma olhada em um novo conjunto de dados - este é um pouco menos limpo do que o que você já viu antes.
Como sempre, primeiro você começará visualizando os dados brutos. Pegue Você deve dar uma olhada de perto e tentar encontrar pontos de dados que possam ser problemáticos para o ajuste de modelos.
Os dados foram carregados em um DataFrame chamado prices
.
Este exercício faz parte do curso
Aprendizado de máquina para dados de séries temporais em Python
Instruções de exercício
- Visualize os dados da série temporal usando o Pandas.
- Calcule o número de valores ausentes em cada série temporal. Observe todas as irregularidades que você puder ver. O que você acha que eles são?
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Visualize the dataset
prices.____(legend=False)
plt.tight_layout()
plt.show()
# Count the missing values of each time series
missing_values = prices.____.____
print(missing_values)