LoslegenKostenlos loslegen

Datumsfeatures

Du hast bereits einige grundlegende Features aus numerischen Variablen erstellt. Jetzt ist es Zeit, Features auf Basis von Datum und Uhrzeit zu erzeugen. Du übst mit einer Teilmenge der Daten aus dem Kaggle-Wettbewerb Taxi Fare Prediction. Die Daten beschreiben Taxifahrten; Ziel ist es, den Preis für jede Fahrt vorherzusagen.

Deine Aufgabe ist es, aus dem Abholzeitpunkt (pickup datetime) Datumsfeatures zu generieren. Denk daran: Es ist besser, neue Features für Train- und Testdaten gleichzeitig zu erstellen. Nachdem die Features erzeugt wurden, teile die Daten wieder in die DataFrames train und test auf. Hier wird das mit der Methode isin() von pandas gemacht.

Die DataFrames train und test stehen in deinem Workspace bereits zur Verfügung.

Diese Übung ist Teil des Kurses

Eine Kaggle-Competition in Python gewinnen

Kurs anzeigen

Anleitung zur Übung

  • Fasse die DataFrames train und test zu einem einzelnen DataFrame taxi zusammen.
  • Konvertiere die Spalte "pickup_datetime" in ein datetime-Objekt.
  • Erzeuge die Features Wochentag (mit dem Attribut .dayofweek) und Stunde (mit dem Attribut .hour) aus der Spalte "pickup_datetime".

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Concatenate train and test together
taxi = ____.____([train, test])

# Convert pickup date to datetime object
taxi['pickup_datetime'] = ____.____(taxi['pickup_datetime'])

# Create a day of week feature
taxi['dayofweek'] = taxi['pickup_datetime'].dt.____

# Create an hour feature
taxi['hour'] = taxi['pickup_datetime'].dt.____

# Split back into train and test
new_train = taxi[taxi['id'].isin(train['id'])]
new_test = taxi[taxi['id'].isin(test['id'])]
Code bearbeiten und ausführen