Train-Daten erkunden
Du arbeitest mit einer weiteren Kaggle-Wettbewerbsaufgabe: der "Store Item Demand Forecasting Challenge". In diesem Wettbewerb erhältst du Verkaufsdaten für Filiale-Artikel über 5 Jahre und sollst die Verkäufe für 3 Monate für 50 verschiedene Artikel in 10 verschiedenen Filialen vorhersagen.
Lass uns zunächst die Train-Daten für diesen Wettbewerb erkunden. Für eine schnellere Ausführung arbeitest du mit einem Teil der Train-Daten, der nur die Historie eines einzelnen Monats enthält.
Dein erstes Ziel ist es, die Eingabedaten einzulesen und dir einen ersten Eindruck davon zu verschaffen.
Diese Übung ist Teil des Kurses
Eine Kaggle-Competition in Python gewinnen
Anleitung zur Übung
- Importiere
pandasalspd. - Lies die Train-Daten mit der
read_csv()-Methode vonpandasein. - Gib den Kopf der Train-Daten mit der Methode
head()aus, um eine Stichprobe der Daten zu sehen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import pandas
import ____ as pd
# Read train data
train = pd.____('train.csv')
# Look at the shape of the data
print('Train shape:', train.shape)
# Look at the head() of the data
print(train.____())