MulaiMulai sekarang secara gratis

Melatih Naive Bayes dengan pemilihan fitur

Sekarang Anda akan menjalankan kembali model klasifikasi teks Naive Bayes yang Anda jalankan di akhir Bab 3 dengan pilihan seleksi dari latihan sebelumnya: kolom title dan category_desc dari himpunan data volunteer.

Latihan ini adalah bagian dari kursus

Prapemrosesan untuk Machine Learning di Python

Lihat Kursus

Petunjuk latihan

  • Gunakan train_test_split() pada vektor teks filtered_text, label y (yaitu label category_desc), dan teruskan himpunan y ke parameter stratify, karena kita memiliki distribusi kelas yang tidak seimbang.
  • Fit model Naive Bayes nb ke X_train dan y_train.
  • Hitung akurasi himpunan uji dari nb.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Split the dataset according to the class distribution of category_desc
X_train, X_test, y_train, y_test = ____(____.toarray(), ____, stratify=____, random_state=42)

# Fit the model to the training data
nb.____

# Print out the model's accuracy
print(nb.____)
Edit dan Jalankan Kode