1. Nauka
  2. /
  3. Kursy
  4. /
  5. Nadzorowane uczenie maszynowe z scikit-learn

Connected

ćwiczenie

Regresja z cechami kategorycznymi

Masz już gotowy zbiór music_dummies z binarnymi cechami dla każdego gatunku muzycznego – czas zbudować model regresji grzbietowej (ridge regression) do przewidywania popularności piosenek.

Zbiór music_dummies został wstępnie załadowany razem z Ridge, cross_val_score, numpy jako np oraz obiektem KFold zapisanym jako kf.

Model zostanie oceniony na podstawie średniego RMSE. Najpierw musisz przekształcić wyniki dla każdego podziału na wartości dodatnie i wyciągnąć z nich pierwiastek kwadratowy. Ta metryka pokazuje średni błąd prognoz modelu, dzięki czemu można ją porównać z odchyleniem standardowym zmiennej docelowej—"popularity".

Instrukcje

100 XP
  • Utwórz X zawierające wszystkie cechy ze zbioru music_dummies oraz y odpowiadające kolumnie "popularity".
  • Zainicjuj model regresji grzbietowej, ustawiając alpha na 0.2.
  • Przeprowadź walidację krzyżową na X i y z użyciem modelu ridge, ustawiając cv na kf i stosując ujemny błąd średniokwadratowy jako metrykę oceny.
  • Wyświetl wartości RMSE, zamieniając ujemne scores na dodatnie i wyciągając z nich pierwiastek kwadratowy.