UFO veri kümesini modelleme, bölüm 2
Son olarak, oluşturduğumuz metin vektörünü, desc_tfidf'i, filtered_words listesini kullanarak filtrelenmiş bir metin vektörü oluşturup bir modelde kullanacaksın. Metne bakarak gözlemin type değerini tahmin edebiliyor musun görelim. Bunun için bir Naive Bayes modeli kullanacaksın.
Bu egzersiz
Python'da Machine Learning için Ön İşleme
kursunun bir parçasıdırEgzersiz talimatları
- Dizin içine
filtered_wordslistesini geçirerekdesc_tfidfvektörünü filtrele. filtered_textözellikleri vey'yi, eğitim ve test kümelerinde sınıf dağılımı eşit olacak şekilde ayır;random_stateolarak42kullan.nbmodelinin.fit()metodunu kullanarakX_trainvey_trainile modeli eğit.nbmodelininX_testvey_testüzerindeki.score()değerini yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Use the list of filtered words we created to filter the text vector
filtered_text = ____[:, list(____)]
# Split the X and y sets using train_test_split, setting stratify=y
X_train, X_test, y_train, y_test = ____(____.toarray(), ____, ____, random_state=42)
# Fit nb to the training sets
____
# Print the score of nb on the test sets
____