Memodelkan himpunan data UFO, bagian 1
Dalam latihan ini, Anda akan membangun model k-nearest neighbor untuk memprediksi negara tempat penampakan UFO terjadi. Himpunan data X berisi kolom detik yang dinormalisasi log, kolom tipe yang di-one-hot encode, serta bulan dan tahun saat penampakan terjadi. Label y adalah kolom negara yang sudah di-encode, di mana 1 adalah "us" dan 0 adalah "ca".
Latihan ini adalah bagian dari kursus
Prapemrosesan untuk Machine Learning di Python
Petunjuk latihan
- Cetak
.columnsdari himpunanX. - Bagi himpunan
Xdany, pastikan distribusi kelas label sama pada himpunan latih dan uji, serta gunakanrandom_statebernilai42. - Latih
knnpada data latih. - Cetak akurasi himpunan uji dari model
knn.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Take a look at the features in the X set of data
print(____)
# Split the X and y sets
X_train, X_test, y_train, y_test = ____
# Fit knn to the training sets
knn.____
# Print the score of knn on the test sets
print(____)