EDA-Statistiken
Wie in den Folien erwähnt, arbeitest du mit Daten zur Vorhersage von Taxitarifen in New York City. Du beginnst damit, einige grundlegende Statistiken über die Daten zu ermitteln. Danach visualisierst du Abhängigkeiten und leitest daraus Hypothesen ab.
Die DataFrames train und test sind bereits in deinem Workspace verfügbar.
Diese Übung ist Teil des Kurses
<Kurs>Eine Kaggle-Competition in Python gewinnen</Kurs>Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Shapes of train and test data
print('Train shape:', ____.____)
print('Test shape:', ____.____)
# Train head()
print(____.____())