Eğitim/test ayrımı + doğruluk hesaplama
churn_df veri kümesiyle verilerini eğitim ve test setlerine ayırma pratiği yapma zamanı!
Özellikleri içeren X ve hedef değişkeni içeren y için NumPy dizileri senin için oluşturuldu.
Bu egzersiz
scikit-learn ile Supervised Learning
kursunun bir parçasıdırEgzersiz talimatları
sklearn.model_selectioniçindentrain_test_split'i içe aktar.Xvey'yi eğitim ve test setlerine ayır;test_size'ı %20'ye eşitle,random_state'i42yap ve hedef etiket oranlarının orijinal veri kümesini yansıtmasını sağla.knnmodelini eğitim verilerine uydur.- Modelin test verisi için doğruluğunu hesapla ve yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import the module
from ____ import ____
X = churn_df.drop("churn", axis=1).values
y = churn_df["churn"].values
# Split into training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=____, stratify=____)
knn = KNeighborsClassifier(n_neighbors=5)
# Fit the classifier to the training data
____
# Print the accuracy
print(knn.score(____, ____))