1. Nauka
  2. /
  3. Kursy
  4. /
  5. Zwycięstwo w konkursie Kaggle w Pythonie

Connected

ćwiczenie

Model bazowy oparty na dacie

Zbudowaliśmy już 3 różne modele bazowe. Dla utrwalenia wiedzy stwórzmy jeszcze kilka kolejnych. Pierwszy model opiera się na zmiennych grupujących. Cena przejazdu może zależeć od pory dnia – na przykład w godzinach szczytu taryfy bywają wyższe.

Twoim celem jest zbudowanie modelu bazowego, który przypisze średnią wartość "fare_amount" dla odpowiedniej godziny. Na razie stworzysz model na podstawie całego zbioru train i wygenerujesz prognozy dla zbioru test.

DataFrame'y train i test są dostępne w twoim środowisku pracy. Kolumna "pickup_datetime" w obu z nich została już przekonwertowana na obiekt datetime.

Instrukcje

100 XP
  • Pobierz godzinę z kolumny "pickup_datetime" dla DataFrame'ów train i test.
  • Oblicz średnią wartość "fare_amount" dla każdej godziny na danych treningowych.
  • Wygeneruj prognozy dla zbioru test, używając metody map() z biblioteki pandas oraz uzyskanego grupowania.
  • Zapisz prognozy do pliku.