1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Dealing with Missing Data in Python

Connected

cvičení

Porovnání a výběr nejlepšího upraveného R-squared

Při analýze imputovaných DataFramů na lineárním modelu nás zajímá skóre upraveného R-squared (\(adj.R^2\)), které vyjadřuje, jak dobře model data vystihuje.

V tomto cvičení porovnáš skóre \(adj.R^2\) lineárních modelů (pro každý z imputovaných datasetů), které jsi vytvořil/a dříve – konkrétně lm_mean, lm_KNN a lm_MICE.

Nejprve přehledně vypíšeš jejich atributy rsquared_adj (vytvořením DataFrame) a nakonec vybereš model s nejvyšším \(adj.R^2\).

Výše zmíněné modely jsou pro tebe již načteny jako lm_mean, lm_KNN a lm_MICE.

Instrukce 1/2

undefined XP
  • 1
    • Použij atribut .rsquared_adj na každém z modelů \(-\) lm_mean, lm_KNN a lm_MICE – a vytvoř tak rsquared_df.
  • 2
    • Pomocí funkce max() zjisti nejlepší R-squared z rsquared_df. Část key=rsquared_df.get zajistí načtení příslušného skóre.