Pembagian train/test + menghitung akurasi
Sekarang saatnya berlatih membagi data Anda menjadi himpunan pelatihan dan pengujian dengan himpunan data churn_df!
Array NumPy telah disiapkan untuk Anda yang berisi fitur sebagai X dan variabel target sebagai y.
Latihan ini adalah bagian dari kursus
Supervised Learning dengan scikit-learn
Petunjuk latihan
- Impor
train_test_splitdarisklearn.model_selection. - Bagi
Xdanymenjadi himpunan pelatihan dan pengujian, tetapkantest_sizesebesar 20%,random_stateke42, dan pastikan proporsi label target mencerminkan himpunan data asli. - Latih model
knnpada data pelatihan. - Hitung dan cetak akurasi model untuk data pengujian.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import the module
from ____ import ____
X = churn_df.drop("churn", axis=1).values
y = churn_df["churn"].values
# Split into training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=____, stratify=____)
knn = KNeighborsClassifier(n_neighbors=5)
# Fit the classifier to the training data
____
# Print the accuracy
print(knn.score(____, ____))