1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Supervised Learning with scikit-learn

Connected

cvičení

Regrese s kategorickými příznaky

Teď, když máš vytvořený music_dummies s binárními příznaky pro každý žánr skladby, je čas sestavit model ridge regrese pro předpověď popularity písní.

music_dummies je předem načtený spolu s Ridge, cross_val_score, numpy jako np a objektem KFold uloženým jako kf.

Model bude hodnocen pomocí průměrné hodnoty RMSE. Nejdříve ale budeš muset převést skóre jednotlivých foldů na kladné hodnoty a vypočítat jejich odmocninu. Tato metrika ukazuje průměrnou chybu předpovědí modelu, takže ji lze porovnat se směrodatnou odchylkou cílové proměnné—"popularity".

Pokyny

100 XP
  • Vytvoř X obsahující všechny příznaky z music_dummies a y tvořené sloupcem "popularity".
  • Vytvoř instanci modelu ridge regrese a nastav alpha na hodnotu 0.2.
  • Proveď křížovou validaci na X a y pomocí ridge modelu, nastav cv na kf a jako metriku hodnocení použij zápornou střední kvadratickou chybu.
  • Vypiš hodnoty RMSE tak, že záporné scores převedeš na kladné a vypočítáš jejich odmocninu.