Explorer les données d’entraînement
Vous allez travailler sur une autre compétition Kaggle intitulée "Store Item Demand Forecasting Challenge". Dans cette compétition, vous disposez de 5 ans de données de ventes par magasin et par article, et vous devez prédire 3 mois de ventes pour 50 articles différents dans 10 magasins différents.
Pour commencer, explorons les données d’entraînement de cette compétition. Pour des performances plus rapides, vous allez travailler sur un sous-ensemble des données d’entraînement ne contenant qu’un seul mois d’historique.
Votre premier objectif est de lire les données en entrée et d’y jeter un premier coup d’œil.
Cet exercice fait partie du cours
Gagner une compétition Kaggle en Python
Instructions
- Importez
pandassous le nompd. - Lisez les données d’entraînement avec la méthode
read_csv()depandas. - Affichez l’en-tête des données d’entraînement (avec la méthode
head()) pour voir un échantillon des données.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import pandas
import ____ as pd
# Read train data
train = pd.____('train.csv')
# Look at the shape of the data
print('Train shape:', train.shape)
# Look at the head() of the data
print(train.____())