CommencerCommencer gratuitement

Explorer les données de test

Après avoir examiné les données d’entraînement, explorons maintenant les données de test du « Store Item Demand Forecasting Challenge ». Rappelez-vous que le jeu de données de test contient généralement une colonne de moins que celui d’entraînement.

Cette colonne, ainsi que le format de sortie, est présentée dans le fichier d’exemple de soumission. Avant d’avancer dans la compétition, vous devez vous familiariser avec la sortie attendue.

C’est pourquoi nous allons regarder les colonnes du jeu de test et les comparer à celles du train. En complément, examinons le format de l’exemple de soumission. Le DataFrame train est disponible dans votre espace de travail.

Cet exercice fait partie du cours

Gagner une compétition Kaggle en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

import pandas as pd

# Read the test data
test = ____.____('test.csv')

# Print train and test columns
print('Train columns:', train.____.tolist())
print('Test columns:', test.____.tolist())
Modifier et exécuter le code