Modelini geliştirme
Bu egzersizde görevin, Tfidf vektörlerini kullanarak birkaç farklı alpha seviyesi denemek ve daha iyi performans veren bir kombinasyon olup olmadığını bulmak.
Eğitim ve test kümeleri oluşturuldu; tfidf_vectorizer, tfidf_train ve tfidf_test hesaplandı.
Bu egzersiz
Python ile Doğal Dil İşlemeye Giriş
kursunun bir parçasıdırEgzersiz talimatları
- Denenecek alpha değerlerinin bir listesini
np.arange()ile oluştur. Değerler0ile1arasında,0.1adımlarla artmalı. - Tek argüman alan
train_and_predict()adlı bir fonksiyon oluştur:alpha. Fonksiyon şunları yapmalı:alpha=alphaile birMultinomialNBsınıflandırıcısı başlat.- Onu eğitim verisine fit et.
- Test verisi üzerinde tahminler üret.
- Doğruluk skorunu hesaplayıp döndür.
- Bir
fordöngüsü kullanarakalpha,scoreve aralarına bir satır sonu gelecek şekilde yazdır. Skoru hesaplamak içintrain_and_predict()fonksiyonunu kullan. Skor alpha ile birlikte değişiyor mu? En iyi alpha hangisi?
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create the list of alphas: alphas
alphas = ____
# Define train_and_predict()
def ____(____):
# Instantiate the classifier: nb_classifier
nb_classifier = ____
# Fit to the training data
____
# Predict the labels: pred
pred = ____
# Compute accuracy: score
score = ____
return score
# Iterate over the alphas and print the corresponding score
for alpha in alphas:
print('Alpha: ', alpha)
print('Score: ', ____)
print()