Membangun model pada himpunan data UFO, bagian 2

Terakhir, Anda akan membangun model menggunakan vektor teks yang telah dibuat, desc_tfidf, dengan menggunakan daftar filtered_words untuk membuat vektor teks terfilter. Mari kita lihat apakah Anda bisa memprediksi type dari penampakan berdasarkan teks. Anda akan menggunakan model Naive Bayes untuk ini.

Latihan ini adalah bagian dari kursus

Prapemrosesan untuk Machine Learning di Python

Lihat Kursus

Petunjuk latihan

Saring vektor desc_tfidf dengan memberikan daftar filtered_words ke indeks.
Bagi fitur filtered_text dan y, pastikan distribusi kelas seimbang pada himpunan latih dan uji; gunakan random_state sebesar 42.
Gunakan .fit() pada model nb untuk melatih X_train dan y_train.
Cetak .score() dari model nb pada himpunan X_test dan y_test.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Use the list of filtered words we created to filter the text vector
filtered_text = ____[:, list(____)]

# Split the X and y sets using train_test_split, setting stratify=y 
X_train, X_test, y_train, y_test = ____(____.toarray(), ____, ____, random_state=42)

# Fit nb to the training sets
____

# Print the score of nb on the test sets
____

Edit dan Jalankan Kode