Train-Daten erkunden
Du arbeitest mit einer weiteren Kaggle-Wettbewerbsaufgabe: der "Store Item Demand Forecasting Challenge". In diesem Wettbewerb erhältst du Verkaufsdaten für Filiale-Artikel über 5 Jahre und sollst die Verkäufe für 3 Monate für 50 verschiedene Artikel in 10 verschiedenen Filialen vorhersagen.
Lass uns zunächst die Train-Daten für diesen Wettbewerb erkunden. Für eine schnellere Ausführung arbeitest du mit einem Teil der Train-Daten, der nur die Historie eines einzelnen Monats enthält.
Dein erstes Ziel ist es, die Eingabedaten einzulesen und dir einen ersten Eindruck davon zu verschaffen.
Diese Übung ist Teil des Kurses
<Kurs>Eine Kaggle-Competition in Python gewinnen</Kurs>Übungsanweisungen
- Importiere
pandasalspd. - Lies die Train-Daten mit der
read_csv()-Methode vonpandasein. - Gib den Kopf der Train-Daten mit der Methode
head()aus, um eine Stichprobe der Daten zu sehen.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import pandas
import ____ as pd
# Read train data
train = pd.____('train.csv')
# Look at the shape of the data
print('Train shape:', train.shape)
# Look at the head() of the data
print(train.____())