1. Learn
  2. /
  3. Курси
  4. /
  5. Передобробка для машинного навчання в Python

Connected

вправа

Стратифікована вибірка

Тепер ви знаєте, що розподіл міток класів у стовпці category_desc набору даних volunteer є нерівномірним. Якщо ви хочете навчити модель передбачати category_desc, потрібно подбати, щоб модель навчалася на вибірці, яка репрезентує весь набір даних. Стратифікована вибірка — це спосіб цього досягти!

Інструкції

100 XP
  • Створіть датафрейм ознак X з усіма стовпцями, окрім category_desc.
  • Створіть датафрейм міток y зі стовпця category_desc.
  • Розбийте X і y на тренувальну та тестову вибірки, забезпечивши, щоб розподіл класів у мітках був однаковим в обох вибірках.
  • Надрукуйте мітки та їх кількості в y_train за допомогою .value_counts().