1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Jak vyhrát soutěž na Kaggle v Pythonu

Connected

cvičení

Základní model založený na gradient boostingu

Teď si postavíme poslední základní model, tentokrát pomocí Random Forest. Ve videu jsi viděl/a výrazné zlepšení skóre při přechodu od skupinového základního modelu na Gradient Boosting. V tomto cvičení použiješ Random Forest z sklearn k dalšímu vylepšení tohoto skóre.

Cílem je vzít numerické příznaky a natrénovat model Random Forest bez jakéhokoli ladění. Poté budeš moci vytvořit predikce pro testovací data a ověřit výsledek na veřejném žebříčku (Public Leaderboard). Všimni si, že už máš k dispozici příznak "hour", který lze také použít jako vstup modelu.

Pokyny

100 XP
  • Přidej příznak "hour" do seznamu numerických příznaků.
  • Natrénuj RandomForestRegressor na trénovacích datech s numerickými příznaky a s "fare_amount" jako cílovou proměnnou.
  • Použij natrénovaný model Random Forest k vytvoření predikcí na testovacích datech.