1. Learn
  2. /
  3. Курси
  4. /
  5. Машинне навчання з деревоподібними моделями в Python

Connected

вправа

Навчіть своє перше дерево класифікації

У цій вправі ви працюватимете з Wisconsin Breast Cancer Dataset з репозиторію машинного навчання UCI. Ви передбачатимете, чи є пухлина злоякісною (malignant), чи доброякісною (benign) на основі двох ознак: середнього радіуса пухлини (radius_mean) та середньої кількості увігнутих точок (concave points_mean).

Набір даних уже завантажено у ваш робочий простір і поділено на 80% тренувальних та 20% тестових даних. Матриці ознак збережено в X_train і X_test, а масиви міток — у y_train і y_test, де клас 1 відповідає злоякісній пухлині, а клас 0 — доброякісній. Щоб отримати відтворювані результати, ми також визначили змінну SEED, значення якої дорівнює 1.

Інструкції

100 XP
  • Імпортуйте DecisionTreeClassifier з sklearn.tree.

  • Створіть екземпляр DecisionTreeClassifier dt з максимальною глибиною 6.

  • Навчіть dt на тренувальній вибірці.

  • Передбачте мітки тестової вибірки та збережіть результат у y_pred.