KNN pada data yang didiskalakan

Skor akurasi pada himpunan data wine tanpa penskalaan sudah cukup baik, tetapi mari kita lihat apa yang dapat Anda capai dengan standardisasi. Sekali lagi, model knn serta data dan label X dan y telah disiapkan untuk Anda.

Latihan ini merupakan bagian dari kursus

Prapemrosesan untuk Machine Learning di Python

Lihat Kursus

Instruksi latihan

Buat metode StandardScaler(), simpan ke dalam variabel bernama scaler.
Skala fitur latih dan uji, dengan hati-hati agar tidak menimbulkan kebocoran data.
Latih model knn pada data latih yang sudah diskalakan.
Evaluasi kinerja model dengan menghitung akurasi himpunan uji.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)

# Instantiate a StandardScaler
scaler = ____

# Scale the training and test features
X_train_scaled = ____.____(____)
X_test_scaled = ____.____(____)

# Fit the k-nearest neighbors model to the training data
____.____(____, ____)

# Score the model on the test data
print(____.____(____, ____))

Edit dan Jalankan Kode