1. Nauka
  2. /
  3. Kursy
  4. /
  5. Preprocessing w uczeniu maszynowym w Pythonie

Connected

ćwiczenie

Modelowanie bez normalizacji

Sprawdźmy, co może się stać z dokładnością modelu, gdy spróbujesz trenować go na danych bez wcześniejszej standaryzacji.

Pracujemy tu na podzbiorze zbioru danych wine. Jedna z kolumn, Proline, ma wyjątkowo wysoką wariancję w porównaniu z pozostałymi kolumnami. To klasyczny przykład sytuacji, w której przydaje się technika taka jak normalizacja logarytmiczna – nauczysz się jej w następnej sekcji.

Proces trenowania modelu w scikit-learn powinien być ci już znany, więc nie będziemy wchodzić w szczegóły. Masz do dyspozycji gotowy model k-najbliższych sąsiadów (knn) oraz zbiory X i y potrzebne do dopasowania i oceny modelu.

Instrukcje

100 XP
  • Podziel zbiory X i y na zbiory treningowy i testowy, dbając o równomierne rozłożenie etykiet klas w obu zbiorach.
  • Dopasuj model knn do cech i etykiet ze zbioru treningowego.
  • Wydrukuj dokładność modelu knn na zbiorze testowym, korzystając z metody .score().