1. Learn
  2. /
  3. Курси
  4. /
  5. Передобробка для машинного навчання в Python

Connected

вправа

Моделювання без нормалізації

Подивімося, що може статися з точністю вашої моделі, якщо ви спробуєте моделювати дані без попередньої стандартизації.

Тут наведено підмножину набору даних wine. Одна з колонок, Proline, має надзвичайно велику дисперсію порівняно з іншими. Це приклад ситуації, де стане у пригоді логнормалізація, про яку ви дізнаєтеся в наступному розділі.

Процес навчання моделей у scikit-learn уже має бути вам знайомий, тож не заглиблюватимемося в деталі. У вас уже є модель k-ближчих сусідів (knn), а також множини X і y, необхідні для навчання та оцінювання.

Інструкції

100 XP
  • Розбийте множини X і y на тренувальну та тестову вибірки, забезпечивши рівномірний розподіл міток класів в обох вибірках.
  • Навчіть модель knn на тренувальних ознаках і мітках.
  • Виведіть точність моделі knn на тестовій вибірці за допомогою методу .score().