MulaiMulai sekarang secara gratis

Memodelkan himpunan data UFO, bagian 1

Dalam latihan ini, Anda akan membangun model k-nearest neighbor untuk memprediksi negara tempat penampakan UFO terjadi. Himpunan data X berisi kolom detik yang dinormalisasi log, kolom tipe yang di-one-hot encode, serta bulan dan tahun saat penampakan terjadi. Label y adalah kolom negara yang sudah di-encode, di mana 1 adalah "us" dan 0 adalah "ca".

Latihan ini adalah bagian dari kursus

Prapemrosesan untuk Machine Learning di Python

Lihat Kursus

Petunjuk latihan

  • Cetak .columns dari himpunan X.
  • Bagi himpunan X dan y, pastikan distribusi kelas label sama pada himpunan latih dan uji, serta gunakan random_state bernilai 42.
  • Latih knn pada data latih.
  • Cetak akurasi himpunan uji dari model knn.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Take a look at the features in the X set of data
print(____)

# Split the X and y sets
X_train, X_test, y_train, y_test = ____

# Fit knn to the training sets
knn.____

# Print the score of knn on the test sets
print(____)
Edit dan Jalankan Kode