KNN pada data yang didiskalakan
Skor akurasi pada himpunan data wine tanpa penskalaan sudah cukup baik, tetapi mari kita lihat apa yang dapat Anda capai dengan standardisasi. Sekali lagi, model knn serta data dan label X dan y telah disiapkan untuk Anda.
Latihan ini adalah bagian dari kursus
Prapemrosesan untuk Machine Learning di Python
Petunjuk latihan
- Buat metode
StandardScaler(), simpan ke dalam variabel bernamascaler. - Skala fitur latih dan uji, dengan hati-hati agar tidak menimbulkan kebocoran data.
- Latih model
knnpada data latih yang sudah diskalakan. - Evaluasi kinerja model dengan menghitung akurasi himpunan uji.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)
# Instantiate a StandardScaler
scaler = ____
# Scale the training and test features
X_train_scaled = ____.____(____)
X_test_scaled = ____.____(____)
# Fit the k-nearest neighbors model to the training data
____.____(____, ____)
# Score the model on the test data
print(____.____(____, ____))