BaşlayınÜcretsiz Başlayın

İlk sınıflandırma ağacını eğit

Bu egzersizde UCI Machine Learning deposundan Wisconsin Breast Cancer Dataset ile çalışacaksın. Tümörün kötü huylu (malignant) mu yoksa iyi huylu (benign) mu olduğunu iki özelliğe göre tahmin edeceksin: tümörün ortalama yarıçapı (radius_mean) ve ortalama içbükey nokta sayısı (concave points_mean).

Veri kümesi çalışma alanına zaten yüklendi ve %80 eğitim, %20 test olarak ayrıldı. Özellik matrisleri X_train ve X_test değişkenlerine, etiket dizileri ise y_train ve y_test değişkenlerine atanmıştır. Burada sınıf 1 kötü huylu tümöre, sınıf 0 ise iyi huylu tümöre karşılık gelir. Yeniden üretilebilir sonuçlar elde etmek için ayrıca değeri 1 olan SEED adlı bir değişken tanımladık.

Bu egzersiz

Python ile Ağaç Tabanlı Modellerle Machine Learning

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • sklearn.tree içinden DecisionTreeClassifier'ı içe aktar.

  • Maksimum derinliği 6 olan bir DecisionTreeClassifier örneği dt oluştur.

  • dt'yi eğitim kümesine sığdır.

  • Test kümesi etiketlerini tahmin et ve sonucu y_pred değişkenine ata.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Import DecisionTreeClassifier from sklearn.tree
from ____.____ import ____

# Instantiate a DecisionTreeClassifier 'dt' with a maximum depth of 6
dt = ____(____=____, random_state=SEED)

# Fit dt to the training set
____.____(____, ____)

# Predict test set labels
y_pred = ____.____(____)
print(y_pred[0:5])
Kodu Düzenle ve Çalıştır