Esplora i dati di test
Dopo aver esaminato i dati di train, esploriamo i dati di test della "Store Item Demand Forecasting Challenge". Ricorda che, in genere, il dataset di test ha una colonna in meno rispetto a quello di train.
Questa colonna, insieme al formato dell’output, è mostrata nel file di invio di esempio (sample submission). Prima di fare progressi nella competition, dovresti familiarizzare con l’output atteso.
Per questo motivo, guardiamo le colonne del dataset di test e confrontiamole con quelle del train. Inoltre, esploriamo il formato della sample submission. Il DataFrame train è disponibile nel tuo workspace.
Questo esercizio fa parte del corso
Vincere una competizione Kaggle con Python
esercizio interattivo pratico
Prova questo esercizio completando questo codice di esempio.
import pandas as pd
# Read the test data
test = ____.____('test.csv')
# Print train and test columns
print('Train columns:', train.____.tolist())
print('Test columns:', test.____.tolist())