1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Luyện tập câu hỏi phỏng vấn Machine Learning bằng Python

Connected

Bài tập

Phân cụm K-means

Trong bối cảnh phỏng vấn Machine Learning, bạn có thể được hỏi cách sử dụng đầu ra từ K-means để đánh giá xem đây có phải là thuật toán tốt nhất hay không.

Trong bài tập này, bạn sẽ thực hành phân cụm K-means. Sử dụng thuộc tính .inertia_ để so sánh các mô hình với số cụm khác nhau, k. Bạn cũng sẽ dùng thông tin này để đánh giá số cụm trong bài tiếp theo.

Hãy nhớ rằng biến mục tiêu trong tập dữ liệu diabetes là progression.

Vị trí hiện tại trong pipeline:

Machine learning pipeline

Hướng dẫn 1/4

undefined XP
  • 1
    • Tạo ma trận đặc trưng X bằng cách loại bỏ biến mục tiêu progression và fit dữ liệu vào đối tượng k-means đã khởi tạo.
  • 2
    • Khởi tạo k-means với 5 cụm và in inertia của nó.
  • 3
    • Fit ma trận đặc trưng với k-means 10 cụm và in inertia của nó.
  • 4
    • Fit ma trận đặc trưng với k-means 20 cụm và in inertia của nó.