Meningkatkan model Anda
Tugas Anda pada latihan ini adalah menguji beberapa nilai alpha yang berbeda menggunakan vektor Tfidf untuk menentukan apakah ada kombinasi yang performanya lebih baik.
Himpunan latih dan uji telah dibuat, dan tfidf_vectorizer, tfidf_train, serta tfidf_test telah dihitung.
Latihan ini adalah bagian dari kursus
Pengantar Natural Language Processing di Python
Petunjuk latihan
- Buat daftar nilai alpha yang akan dicoba menggunakan
np.arange(). Nilainya harus berkisar dari0hingga1dengan langkah0.1. - Buat fungsi
train_and_predict()yang menerima satu argumen:alpha. Fungsi tersebut harus:- Menginstansiasi pengklasifikasi
MultinomialNBdenganalpha=alpha. - Melatihnya pada data latih.
- Menghitung prediksi pada data uji.
- Menghitung dan mengembalikan skor akurasi.
- Menginstansiasi pengklasifikasi
- Dengan menggunakan
forloop, cetakalpha,score, dan sebuah baris baru di antaranya. Gunakan fungsitrain_and_predict()Anda untuk menghitungscore. Apakah skornya berubah seiring perubahan alpha? Berapa nilai alpha terbaik?
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create the list of alphas: alphas
alphas = ____
# Define train_and_predict()
def ____(____):
# Instantiate the classifier: nb_classifier
nb_classifier = ____
# Fit to the training data
____
# Predict the labels: pred
pred = ____
# Compute accuracy: score
score = ____
return score
# Iterate over the alphas and print the corresponding score
for alpha in alphas:
print('Alpha: ', alpha)
print('Score: ', ____)
print()