Esplora i dati di train
Lavorerai con un'altra competizione Kaggle chiamata "Store Item Demand Forecasting Challenge". In questa competizione ti vengono forniti 5 anni di dati di vendite negozio-articolo e ti viene chiesto di prevedere 3 mesi di vendite per 50 articoli diversi in 10 negozi differenti.
Per iniziare, esploriamo i dati di train di questa competizione. Per prestazioni più rapide, lavorerai con un sottoinsieme dei dati di train che contiene solo la cronologia di un singolo mese.
Il tuo obiettivo iniziale è leggere i dati in input e dare una prima occhiata al loro contenuto.
Questo esercizio fa parte del corso
Vincere una competizione Kaggle con Python
Istruzioni dell'esercizio
- Importa
pandascomepd. - Leggi i dati di train usando il metodo
read_csv()dipandas. - Stampa la testa dei dati di train (usando il metodo
head()) per vedere un campione dei dati.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import pandas
import ____ as pd
# Read train data
train = pd.____('train.csv')
# Look at the shape of the data
print('Train shape:', train.shape)
# Look at the head() of the data
print(train.____())