Explorer les données d’entraînement

Vous allez travailler sur une autre compétition Kaggle intitulée "Store Item Demand Forecasting Challenge". Dans cette compétition, vous disposez de 5 ans de données de ventes par magasin et par article, et vous devez prédire 3 mois de ventes pour 50 articles différents dans 10 magasins différents.

Pour commencer, explorons les données d’entraînement de cette compétition. Pour des performances plus rapides, vous allez travailler sur un sous-ensemble des données d’entraînement ne contenant qu’un seul mois d’historique.

Votre premier objectif est de lire les données en entrée et d’y jeter un premier coup d’œil.

Cet exercice fait partie du cours

<cours>Gagner une compétition Kaggle en Python</cours>

Voir le cours

Instructions de l’exercice

Importez pandas sous le nom pd.
Lisez les données d’entraînement avec la méthode read_csv() de pandas.
Affichez l’en-tête des données d’entraînement (avec la méthode head()) pour voir un échantillon des données.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Import pandas
import ____ as pd

# Read train data
train = pd.____('train.csv')

# Look at the shape of the data
print('Train shape:', train.shape)

# Look at the head() of the data
print(train.____())

Modifier et exécuter le code