1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Spark SQL bằng Python

Connected

Bài tập

Huấn luyện bộ phân loại

DataFrame df_trainset bạn đã tạo ở bài trước đang có sẵn. Giờ bạn sẽ dùng nó để huấn luyện một Logistic Regression Classifier.

Hướng dẫn

100 XP
  • Import Logistic Regression Classifier.
  • Khởi tạo bộ phân loại. Đặt số vòng lặp tối đa là 100, tham số regularization là 0.4, và tham số elastic net là 0.0.
  • Huấn luyện bộ phân loại trên tập train.
  • In ra số vòng lặp huấn luyện.