Verken de train-data
Je gaat werken met een andere Kaggle-wedstrijd: de "Store Item Demand Forecasting Challenge". In deze competitie krijg je 5 jaar aan winkel-itemverkoopgegevens en moet je 3 maanden aan verkopen voorspellen voor 50 verschillende items in 10 verschillende winkels.
Om te beginnen verkennen we de train-data voor deze competitie. Voor betere prestaties werk je met een subset van de train-data met alleen de historie van één maand.
Je eerste doel is om de invoergegevens te lezen en er alvast globaal naar te kijken.
Deze oefening maakt deel uit van de cursus
Een Kaggle-competitie winnen met Python
Oefeninstructies
- Importeer
pandasalspd. - Lees de train-data in met de
read_csv()-methode vanpandas. - Print de kop van de train-data (met de
head()-methode) om een voorbeeld van de gegevens te zien.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import pandas
import ____ as pd
# Read train data
train = pd.____('train.csv')
# Look at the shape of the data
print('Train shape:', train.shape)
# Look at the head() of the data
print(train.____())