1. Learn
  2. /
  3. Cursuri
  4. /
  5. Învățare supravegheată cu scikit-learn

Connected

exercițiu

Regresie cu caracteristici categorice

Acum că ai creat music_dummies, care conține caracteristici binare pentru genul fiecărei melodii, este timpul să construiești un model de regresie ridge pentru a prezice popularitatea melodiilor.

music_dummies a fost preîncărcat pentru tine, împreună cu Ridge, cross_val_score, numpy importat ca np și un obiect KFold stocat ca kf.

Modelul va fi evaluat prin calcularea RMSE mediu, dar mai întâi va trebui să convertești scorurile pentru fiecare fold la valori pozitive și să extragi rădăcina pătrată. Această metrică arată eroarea medie a predicțiilor modelului și poate fi comparată cu abaterea standard a variabilei țintă—"popularity".

Instrucțiuni

100 XP
  • Creează X, care să conțină toate caracteristicile din music_dummies, și y, format din coloana "popularity".
  • Instanțiază un model de regresie ridge, setând alpha egal cu 0.2.
  • Efectuează validarea încrucișată pe X și y folosind modelul ridge, setând cv egal cu kf și folosind eroarea medie pătratică negativă ca metrică de evaluare.
  • Afișează valorile RMSE convertind scores negative la pozitive și extragând rădăcina pătrată.