1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Jak vyhrát soutěž na Kaggle v Pythonu

Connected

cvičení

Základní model postavený na datu

Už jsme sestavili 3 různé základní modely. Pro procvičení si zkusme postavit ještě pár dalších. První model vychází ze seskupovacích proměnných. Je zřejmé, že cena jízdného může záviset na denní době – například během dopravní špičky bývají ceny vyšší.

Tvým úkolem je sestavit základní model, který přiřadí průměrnou hodnotu "fare_amount" odpovídající dané hodině. Tentokrát model vytvoříš na celých datech train a predikce uděláš pro dataset test.

DataFramy train a test jsou dostupné ve tvém pracovním prostředí. Sloupec "pickup_datetime" v obou DataFramech je navíc already převeden na objekt datetime.

Pokyny

100 XP
  • Získej hodinu ze sloupce "pickup_datetime" pro DataFramy train i test.
  • Vypočítej průměrné "fare_amount" pro každou hodinu na trénovacích datech.
  • Vytvoř predikce pro test pomocí metody map() z pandas a získaného seskupení.
  • Zapiš predikce do souboru.