MulaiMulai sekarang secara gratis

Meningkatkan model Anda

Tugas Anda pada latihan ini adalah menguji beberapa nilai alpha yang berbeda menggunakan vektor Tfidf untuk menentukan apakah ada kombinasi yang performanya lebih baik.

Himpunan latih dan uji telah dibuat, dan tfidf_vectorizer, tfidf_train, serta tfidf_test telah dihitung.

Latihan ini adalah bagian dari kursus

Pengantar Natural Language Processing di Python

Lihat Kursus

Petunjuk latihan

  • Buat daftar nilai alpha yang akan dicoba menggunakan np.arange(). Nilainya harus berkisar dari 0 hingga 1 dengan langkah 0.1.
  • Buat fungsi train_and_predict() yang menerima satu argumen: alpha. Fungsi tersebut harus:
    • Menginstansiasi pengklasifikasi MultinomialNB dengan alpha=alpha.
    • Melatihnya pada data latih.
    • Menghitung prediksi pada data uji.
    • Menghitung dan mengembalikan skor akurasi.
  • Dengan menggunakan for loop, cetak alpha, score, dan sebuah baris baru di antaranya. Gunakan fungsi train_and_predict() Anda untuk menghitung score. Apakah skornya berubah seiring perubahan alpha? Berapa nilai alpha terbaik?

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create the list of alphas: alphas
alphas = ____

# Define train_and_predict()
def ____(____):
    # Instantiate the classifier: nb_classifier
    nb_classifier = ____
    # Fit to the training data
    ____
    # Predict the labels: pred
    pred = ____
    # Compute accuracy: score
    score = ____
    return score

# Iterate over the alphas and print the corresponding score
for alpha in alphas:
    print('Alpha: ', alpha)
    print('Score: ', ____)
    print()
Edit dan Jalankan Kode