1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Bảo mật dữ liệu và Ẩn danh trong Python

Connected

Bài tập

Tạo bộ dữ liệu cho phân loại

Tìm một bộ dữ liệu thực tế đáp ứng mọi tổ hợp tiêu chí mong muốn có thể rất phức tạp và, nếu được thu thập, có thể phát sinh lo ngại về quyền riêng tư. Giải pháp là bạn có thể dùng các bộ tạo dữ liệu để cho ra gần đúng tốt với dữ liệu thế giới thực.

Trong bài tập này, bạn sẽ tạo một bộ dữ liệu lớn cho bài toán phân loại 3 lớp. Để dễ trực quan hóa dữ liệu được tạo dưới dạng biểu đồ phân tán, một hàm tùy chỉnh đã được cung cấp là plot_data_points().

Hướng dẫn

100 XP
  • Import hàm tương ứng từ sklearn.datasets để tạo bộ dữ liệu phân loại.
  • Tạo 5000 mẫu với 4 đặc trưng, 1 cụm mỗi lớp, 3 lớp, và độ tách lớp 2.
  • In kích thước (shape) của dữ liệu đã tạo.
  • Xem biểu đồ phân tán kết quả.