Melatih Naive Bayes dengan pemilihan fitur
Sekarang Anda akan menjalankan kembali model klasifikasi teks Naive Bayes yang Anda jalankan di akhir Bab 3 dengan pilihan seleksi dari latihan sebelumnya: kolom title dan category_desc dari himpunan data volunteer.
Latihan ini adalah bagian dari kursus
Prapemrosesan untuk Machine Learning di Python
Petunjuk latihan
- Gunakan
train_test_split()pada vektor teksfiltered_text, labely(yaitu labelcategory_desc), dan teruskan himpunanyke parameterstratify, karena kita memiliki distribusi kelas yang tidak seimbang. - Fit model Naive Bayes
nbkeX_traindany_train. - Hitung akurasi himpunan uji dari
nb.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Split the dataset according to the class distribution of category_desc
X_train, X_test, y_train, y_test = ____(____.toarray(), ____, stratify=____, random_state=42)
# Fit the model to the training data
nb.____
# Print out the model's accuracy
print(nb.____)