1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Spark SQL bằng Python

Connected

Bài tập

Dự đoán trên dữ liệu kiểm thử

Một mô hình logistic đã được fit là df_fitted đã có sẵn. Một dataframe df_testset chứa dữ liệu kiểm thử cho mô hình này cũng đã có. Biến fields có sẵn, chứa danh sách ['prediction', 'label', 'endword', 'doc', 'probability']; biến này được dùng để chỉ định các trường dự đoán sẽ in ra.

Hướng dẫn

100 XP
  • Áp dụng mô hình lên dữ liệu trong df_testset.
  • In "incorrect" nếu dự đoán không khớp với nhãn.