Visualiser des données brouillonnes
Examinons un nouveau jeu de données — il est un peu moins propre que ceux que vous avez vus jusqu’à présent.
Comme toujours, commencez par visualiser les données brutes. Regardez-les attentivement et essayez d’identifier des points de données qui pourraient poser problème pour l’ajustement de modèles.
Les données ont été chargées dans un DataFrame nommé prices.
Cet exercice fait partie du cours
Machine Learning for Time Series Data in Python
Instructions
- Visualisez la série temporelle avec Pandas.
- Calculez le nombre de valeurs manquantes dans chaque série temporelle. Relevez les irrégularités visibles. À votre avis, de quoi s’agit-il ?
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Visualize the dataset
prices.____(legend=False)
plt.tight_layout()
plt.show()
# Count the missing values of each time series
missing_values = prices.____.____
print(missing_values)