1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tiền xử lý cho Machine Learning bằng Python

Connected

Bài tập

Mô hình hóa bộ dữ liệu UFO, phần 1

Trong bài tập này, bạn sẽ xây dựng một mô hình k-nearest neighbor để dự đoán quốc gia nơi xảy ra quan sát UFO. Tập X chứa cột số giây đã được log-normalized, các cột loại (type) đã one-hot encode, cùng với tháng và năm khi quan sát diễn ra. Nhãn y là cột quốc gia đã được mã hóa, trong đó 1 là "us" và 0 là "ca".

Hướng dẫn

100 XP
  • In ra .columns của tập X.
  • Chia tập X và y, đảm bảo phân phối lớp của nhãn giống nhau giữa tập huấn luyện và tập kiểm tra, và dùng random_state bằng 42.
  • Fit knn với dữ liệu huấn luyện.
  • In độ chính xác trên tập kiểm tra của mô hình knn.