Membangun model pada himpunan data UFO, bagian 2
Terakhir, Anda akan membangun model menggunakan vektor teks yang telah dibuat, desc_tfidf, dengan menggunakan daftar filtered_words untuk membuat vektor teks terfilter. Mari kita lihat apakah Anda bisa memprediksi type dari penampakan berdasarkan teks. Anda akan menggunakan model Naive Bayes untuk ini.
Latihan ini adalah bagian dari kursus
Prapemrosesan untuk Machine Learning di Python
Petunjuk latihan
- Saring vektor
desc_tfidfdengan memberikan daftarfiltered_wordske indeks. - Bagi fitur
filtered_textdany, pastikan distribusi kelas seimbang pada himpunan latih dan uji; gunakanrandom_statesebesar42. - Gunakan
.fit()pada modelnbuntuk melatihX_traindany_train. - Cetak
.score()dari modelnbpada himpunanX_testdany_test.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Use the list of filtered words we created to filter the text vector
filtered_text = ____[:, list(____)]
# Split the X and y sets using train_test_split, setting stratify=y
X_train, X_test, y_train, y_test = ____(____.toarray(), ____, ____, random_state=42)
# Fit nb to the training sets
____
# Print the score of nb on the test sets
____