CommencerCommencer gratuitement

Visualiser des données brouillonnes

Examinons un nouveau jeu de données — il est un peu moins propre que ceux que vous avez vus jusqu’à présent.

Comme toujours, commencez par visualiser les données brutes. Regardez-les attentivement et essayez d’identifier des points de données qui pourraient poser problème pour l’ajustement de modèles.

Les données ont été chargées dans un DataFrame nommé prices.

Cet exercice fait partie du cours

Machine Learning for Time Series Data in Python

Afficher le cours

Instructions

  • Visualisez la série temporelle avec Pandas.
  • Calculez le nombre de valeurs manquantes dans chaque série temporelle. Relevez les irrégularités visibles. À votre avis, de quoi s’agit-il ?

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Visualize the dataset
prices.____(legend=False)
plt.tight_layout()
plt.show()

# Count the missing values of each time series
missing_values = prices.____.____
print(missing_values)
Modifier et exécuter le code