1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. Phân tích Marketing: Dự đoán Khách hàng Rời bỏ bằng Python

Connected

अभ्यास

Tính accuracy

Sau khi đã chia dữ liệu thành tập huấn luyện và tập kiểm tra, bạn có thể huấn luyện mô hình trên dữ liệu training và sau đó dự đoán nhãn cho dữ liệu test. Đây chính là những gì bạn sẽ thực hành trong bài này.

Đến giờ, bạn đã dùng Logistic Regression và Decision Trees. Ở đây, bạn sẽ dùng RandomForestClassifier, có thể hiểu là một tập hợp (ensemble) của nhiều Decision Trees và thường cho hiệu suất tốt hơn một Decision Tree đơn lẻ.

Kết quả từ các bài trước đã được giữ lại, và các tập huấn luyện/kiểm tra có sẵn trong các biến X_train, X_test, y_train, và y_test.

निर्देश

100 XP
  • Import RandomForestClassifier từ sklearn.ensemble.
  • Khởi tạo một RandomForestClassifier và gán vào clf.
  • Huấn luyện clf với dữ liệu huấn luyện: X_train và y_train.
  • Tính accuracy của clf trên dữ liệu kiểm tra bằng phương thức .score().