1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Předpovídání CTR pomocí Machine Learning v Pythonu

Connected

cvičení

Výběr modelu

Regularizace i křížová validace jsou výkonné nástroje při výběru modelu. Regularizace pomáhá předcházet přetrénování a křížová validace zajišťuje, že jsou modely správně vyhodnoceny. V tomto cvičení použiješ regularizaci a křížovou validaci dohromady a zjistíš, zda se modely od sebe výrazně liší. Budeš počítat pouze přesnost (precision), i když stejné cvičení snadno zopakuješ i pro recall a další vyhodnocovací metriky.

X_train, y_train, X_test, y_test jsou dostupné v tvém pracovním prostoru. K dispozici jsou také pandas jako pd, numpy jako np a sklearn. Z sklearn.metrics jsou dostupné funkce precision_score() a recall_score(), z sklearn.model_selection pak KFold() a cross_val_score().

Pokyny

100 XP
  • Nastav K-fold křížovou validaci se čtyřmi rozděleními pomocí parametru n_splits a přiřaď ji do proměnné k-fold.
  • Vytvoř klasifikátor rozhodovacího stromu.
  • Pomocí k_fold spusť křížovou validaci a vyhodnoť přesnost (precision) a recall svého modelu rozhodovacího stromu pro zadanou hodnotu max_depth.