MulaiMulai sekarang secara gratis

KNN pada data yang didiskalakan

Skor akurasi pada himpunan data wine tanpa penskalaan sudah cukup baik, tetapi mari kita lihat apa yang dapat Anda capai dengan standardisasi. Sekali lagi, model knn serta data dan label X dan y telah disiapkan untuk Anda.

Latihan ini adalah bagian dari kursus

Prapemrosesan untuk Machine Learning di Python

Lihat Kursus

Petunjuk latihan

  • Buat metode StandardScaler(), simpan ke dalam variabel bernama scaler.
  • Skala fitur latih dan uji, dengan hati-hati agar tidak menimbulkan kebocoran data.
  • Latih model knn pada data latih yang sudah diskalakan.
  • Evaluasi kinerja model dengan menghitung akurasi himpunan uji.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)

# Instantiate a StandardScaler
scaler = ____

# Scale the training and test features
X_train_scaled = ____.____(____)
X_test_scaled = ____.____(____)

# Fit the k-nearest neighbors model to the training data
____.____(____, ____)

# Score the model on the test data
print(____.____(____, ____))
Edit dan Jalankan Kode