Karar ağaçları
Bu egzersizdeki görevin, scikit-learn ile birlikte gelen breast cancer veri kümesi üzerinde scikit-learn'ün DecisionTreeClassifier sınıfını kullanarak basit bir karar ağacı oluşturmak.
Bu veri kümesi, meme biyopsilerinden elde edilen tek tek tümörlerin çeşitli boyutsal sayısal ölçümlerini (örneğin çevre ve doku yapısı) ve tek bir sonuç değerini (tümör kötü huylu mu, iyi huylu mu) içerir.
Örnekler (ölçümler) X içine, tümör başına hedef değerler ise y içine önceden yüklendi. Şimdi tüm veri kümesini eğitim ve test kümelerine ayırmalı ve ardından bir DecisionTreeClassifier eğitmelisin. max_depth adlı bir parametre belirleyeceksin. Bu modelde değiştirilebilecek birçok başka parametre daha var; hepsine buradan bakabilirsin.
Bu egzersiz
XGBoost ile Aşırı Gradyan Artırma
kursunun bir parçasıdırEgzersiz talimatları
- Şunları içe aktar:
sklearn.model_selectioniçindentrain_test_split.sklearn.treeiçindenDecisionTreeClassifier.
- Verinin %20'si test için kullanılacak şekilde eğitim ve test kümeleri oluştur.
random_stateolarak123kullan. dt_clf_4adlı birDecisionTreeClassifierörneğinimax_depthdeğeri4olacak şekilde başlat. Bu parametre, bir yaprak düğüme ulaşmadan önce yapabileceğin ardışık bölünme sayısının en yüksek değerini belirtir.- Sınıflandırıcıyı eğitim kümesine uydur ve test kümesinin etiketlerini tahmin et.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import the necessary modules
____
____
# Create the training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=____)
# Instantiate the classifier: dt_clf_4
dt_clf_4 = ____
# Fit the classifier to the training set
____
# Predict the labels of the test set: y_pred_4
y_pred_4 = ____
# Compute the accuracy of the predictions: accuracy
accuracy = float(np.sum(y_pred_4==y_test))/y_test.shape[0]
print("accuracy:", accuracy)