Datumsfeatures
Du hast bereits einige grundlegende Features aus numerischen Variablen erstellt. Jetzt ist es Zeit, Features auf Basis von Datum und Uhrzeit zu erzeugen. Du übst mit einer Teilmenge der Daten aus dem Kaggle-Wettbewerb Taxi Fare Prediction. Die Daten beschreiben Taxifahrten; Ziel ist es, den Preis für jede Fahrt vorherzusagen.
Deine Aufgabe ist es, aus dem Abholzeitpunkt (pickup datetime) Datumsfeatures zu generieren. Denk daran: Es ist besser, neue Features für Train- und Testdaten gleichzeitig zu erstellen. Nachdem die Features erzeugt wurden, teile die Daten wieder in die DataFrames train und test auf. Hier wird das mit der Methode isin() von pandas gemacht.
Die DataFrames train und test stehen in deinem Workspace bereits zur Verfügung.
Diese Übung ist Teil des Kurses
Eine Kaggle-Competition in Python gewinnen
Anleitung zur Übung
- Fasse die DataFrames
trainundtestzu einem einzelnen DataFrametaxizusammen. - Konvertiere die Spalte "pickup_datetime" in ein
datetime-Objekt. - Erzeuge die Features Wochentag (mit dem Attribut
.dayofweek) und Stunde (mit dem Attribut.hour) aus der Spalte "pickup_datetime".
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Concatenate train and test together
taxi = ____.____([train, test])
# Convert pickup date to datetime object
taxi['pickup_datetime'] = ____.____(taxi['pickup_datetime'])
# Create a day of week feature
taxi['dayofweek'] = taxi['pickup_datetime'].dt.____
# Create an hour feature
taxi['hour'] = taxi['pickup_datetime'].dt.____
# Split back into train and test
new_train = taxi[taxi['id'].isin(train['id'])]
new_test = taxi[taxi['id'].isin(test['id'])]