1. Learn
  2. /
  3. Курси
  4. /
  5. Передобробка для машинного навчання в Python

Connected

вправа

Вибір релевантних ознак

У цій вправі ви визначите надлишкові стовпці в наборі даних volunteer і виконаєте відбір ознак, щоб отримати DataFrame лише з релевантними ознаками.

Наприклад, якщо ви дослідите набір даних volunteer у консолі, побачите три ознаки, пов'язані з місцем розташування: locality, region і postalcode. Вони містять споріднену інформацію, тож логічно залишити лише одну з них.

Приділіть трохи часу, щоб переглянути ознаки volunteer у консолі, і спробуйте визначити надлишкові ознаки.

Інструкції

100 XP
  • Створіть список назв надлишкових стовпців і збережіть його у змінній to_drop:
    • Із усіх ознак, пов'язаних із місцем розташування, залиште лише postalcode.
    • Ознаки, що пройшли інженерію ознак, також є надлишковими.
  • Вилучіть зі «стисненого» набору даних стовпці зі списку to_drop.
  • Виведіть .head() датафрейму volunteer_subset, щоб побачити вибрані стовпці.