Aan de slagGa gratis aan de slag

Verken de train-data

Je gaat werken met een andere Kaggle-wedstrijd: de "Store Item Demand Forecasting Challenge". In deze competitie krijg je 5 jaar aan winkel-itemverkoopgegevens en moet je 3 maanden aan verkopen voorspellen voor 50 verschillende items in 10 verschillende winkels.

Om te beginnen verkennen we de train-data voor deze competitie. Voor betere prestaties werk je met een subset van de train-data met alleen de historie van één maand.

Je eerste doel is om de invoergegevens te lezen en er alvast globaal naar te kijken.

Deze oefening maakt deel uit van de cursus

Een Kaggle-competitie winnen met Python

Cursus bekijken

Oefeninstructies

  • Importeer pandas als pd.
  • Lees de train-data in met de read_csv()-methode van pandas.
  • Print de kop van de train-data (met de head()-methode) om een voorbeeld van de gegevens te zien.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import pandas
import ____ as pd

# Read train data
train = pd.____('train.csv')

# Look at the shape of the data
print('Train shape:', train.shape)

# Look at the head() of the data
print(train.____())
Code bewerken en uitvoeren