1. 학습
  2. /
  3. 강의
  4. /
  5. Zwycięstwo w konkursie Kaggle w Pythonie

Connected

연습 문제

Cechy daty

Masz już za sobą tworzenie podstawowych cech na podstawie zmiennych numerycznych. Czas przejść do cech opartych na dacie i godzinie. Przećwiczysz to na próbce danych z konkursu Kaggle Taxi Fare Prediction. Dane zawierają informacje o przejazdach taksówką, a celem jest przewidzenie ceny każdego kursu.

Twoim zadaniem jest wygenerowanie cech daty z kolumny zawierającej czas przyjazdu taksówki. Pamiętaj, że nowe cechy najlepiej tworzyć jednocześnie dla zbioru treningowego i testowego. Po utworzeniu cech dane zostaną ponownie podzielone na zbiory train i test – służy do tego metoda isin() z biblioteki pandas.

Zbiory train i test są już dostępne w twoim środowisku roboczym.

지침

100 XP
  • Połącz zbiory train i test w jeden DataFrame o nazwie taxi.
  • Przekształć kolumnę "pickup_datetime" na obiekt typu datetime.
  • Na podstawie kolumny "pickup_datetime" utwórz cechy: dzień tygodnia (atrybut .dayofweek) oraz godzina (atrybut .hour).