Modelowanie bez normalizacji

Sprawdźmy, co może się stać z dokładnością modelu, gdy spróbujesz trenować go na danych bez wcześniejszej standaryzacji.

Pracujemy tu na podzbiorze zbioru danych wine. Jedna z kolumn, Proline, ma wyjątkowo wysoką wariancję w porównaniu z pozostałymi kolumnami. To klasyczny przykład sytuacji, w której przydaje się technika taka jak normalizacja logarytmiczna – nauczysz się jej w następnej sekcji.

Proces trenowania modelu w scikit-learn powinien być ci już znany, więc nie będziemy wchodzić w szczegóły. Masz do dyspozycji gotowy model k-najbliższych sąsiadów (knn) oraz zbiory X i y potrzebne do dopasowania i oceny modelu.

Podziel zbiory X i y na zbiory treningowy i testowy, dbając o równomierne rozłożenie etykiet klas w obu zbiorach.
Dopasuj model knn do cech i etykiet ze zbioru treningowego.
Wydrukuj dokładność modelu knn na zbiorze testowym, korzystając z metody .score().

ćwiczenie

Modelowanie bez normalizacji

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie