Hyperparameter KNN
Untuk menerapkan konsep yang dipelajari pada latihan sebelumnya, praktik yang baik adalah mencoba penerapan pada algoritme baru. Algoritme k-nearest neighbors tidak sepopuler dulu, tetapi masih bisa menjadi pilihan yang sangat baik untuk data yang memiliki kelompok-kelompok dengan perilaku serupa. Apakah ini berlaku pada pengguna kartu kredit kita?
Pada latihan ini Anda akan mencoba beberapa nilai berbeda untuk salah satu hyperparameter inti pada algoritme KNN dan membandingkan kinerjanya.
Anda akan memiliki:
- DataFrame
X_train,X_test,y_train,y_test
Latihan ini adalah bagian dari kursus
Penyetelan Hyperparameter di Python
Petunjuk latihan
- Bangun estimator KNN untuk nilai
n_neighborsberikut [5,10,20]. - Latih masing-masing pada data pelatihan dan hasilkan prediksi.
- Dapatkan skor akurasi untuk setiap model dan cetak hasilnya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Build a knn estimator for each value of n_neighbours
knn_5 = KNeighborsClassifier(n_neighbors=____)
knn_10 = KNeighborsClassifier(n_neighbors=____)
knn_20 = KNeighborsClassifier(n_neighbors=____)
# Fit each to the training data & produce predictions
knn_5_predictions = knn_5.fit(_____, _____).predict(_____)
knn_10_predictions = knn_10.fit(_____, _____).predict(_____)
knn_20_predictions = knn_20.fit(_____, _____).predict(_____)
# Get an accuracy score for each of the models
knn_5_accuracy = accuracy_score(y_test, _____)
knn_10_accuracy = accuracy_score(y_test, _____)
knn_20_accuracy = accuracy_score(y_test, _____)
print("The accuracy of 5, 10, 20 neighbours was {}, {}, {}".format(_____, _____, _____))