1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning with Tree-Based Models in Python

Connected

cvičení

Natrénuj svůj první klasifikační strom

V tomto cvičení budeš pracovat s datasetem Wisconsin Breast Cancer Dataset z repozitáře UCI machine learning. Budeš předpovídat, zda je nádor maligní, nebo benigní, a to na základě dvou příznaků: průměrného poloměru nádoru (radius_mean) a průměrného počtu konkávních bodů (concave points_mean).

Dataset je již načtený v tvém pracovním prostředí a je rozdělený na 80 % trénovací a 20 % testovací sadu. Matice příznaků jsou přiřazeny do proměnných X_train a X_test, pole štítků pak do y_train a y_test, kde třída 1 odpovídá malignímu nádoru a třída 0 odpovídá benignímu nádoru. Pro zajištění reprodukovatelných výsledků je také definována proměnná SEED s hodnotou 1.

Pokyny

100 XP
  • Importuj DecisionTreeClassifier z modulu sklearn.tree.

  • Vytvoř instanci DecisionTreeClassifier s názvem dt s maximální hloubkou rovnou 6.

  • Natrénuj model dt na trénovací sadě.

  • Předpověz štítky testovací sady a výsledek ulož do proměnné y_pred.