Karar ağaçları

Bu egzersizdeki görevin, scikit-learn ile birlikte gelen breast cancer veri kümesi üzerinde scikit-learn'ün DecisionTreeClassifier sınıfını kullanarak basit bir karar ağacı oluşturmak.

Bu veri kümesi, meme biyopsilerinden elde edilen tek tek tümörlerin çeşitli boyutsal sayısal ölçümlerini (örneğin çevre ve doku yapısı) ve tek bir sonuç değerini (tümör kötü huylu mu, iyi huylu mu) içerir.

Örnekler (ölçümler) X içine, tümör başına hedef değerler ise y içine önceden yüklendi. Şimdi tüm veri kümesini eğitim ve test kümelerine ayırmalı ve ardından bir DecisionTreeClassifier eğitmelisin. max_depth adlı bir parametre belirleyeceksin. Bu modelde değiştirilebilecek birçok başka parametre daha var; hepsine buradan bakabilirsin.

Bu egzersiz, kursun bir parçasıdır

XGBoost ile Aşırı Gradyan Artırma

Kursa Göz Atın

Egzersiz talimatları

Şunları içe aktar:
- sklearn.model_selection içinden train_test_split.
- sklearn.tree içinden DecisionTreeClassifier.
Verinin %20'si test için kullanılacak şekilde eğitim ve test kümeleri oluştur. random_state olarak 123 kullan.
dt_clf_4 adlı bir DecisionTreeClassifier örneğini max_depth değeri 4 olacak şekilde başlat. Bu parametre, bir yaprak düğüme ulaşmadan önce yapabileceğin ardışık bölünme sayısının en yüksek değerini belirtir.
Sınıflandırıcıyı eğitim kümesine uydur ve test kümesinin etiketlerini tahmin et.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Import the necessary modules
____
____

# Create the training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=____)

# Instantiate the classifier: dt_clf_4
dt_clf_4 = ____

# Fit the classifier to the training set
____

# Predict the labels of the test set: y_pred_4
y_pred_4 = ____

# Compute the accuracy of the predictions: accuracy
accuracy = float(np.sum(y_pred_4==y_test))/y_test.shape[0]
print("accuracy:", accuracy)

Kodu Düzenle ve Çalıştır