1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Supervised Learning with scikit-learn

Connected

Cvičení

Křížová validace pro R-squared

Křížová validace je klíčový přístup k vyhodnocování modelu. Maximalizuje množství dat, která jsou modelu k dispozici – model se totiž nejen trénuje, ale také testuje na všech dostupných datech.

V tomto cvičení sestavíš model lineární regrese a poté pomocí 6-násobné křížové validace vyhodnotíš jeho přesnost při předpovídání prodejů na základě výdajů na reklamu na sociálních sítích. Zobrazíš také jednotlivé skóre pro každý ze šesti foldů.

Dataset sales_df je rozdělený na y pro cílovou proměnnou a X pro příznaky a je předem načtený. LinearRegression je importovaný z sklearn.linear_model.

Pokyny

100 XP
  • Importuj KFold a cross_val_score.
  • Vytvoř kf zavoláním KFold(), nastav počet rozdělení na šest, shuffle na True a seed na 5.
  • Proveď křížovou validaci pomocí reg na X a y a předej kf parametru cv.
  • Vypiš cv_scores.