BaşlayınÜcretsiz Başlayın

UFO veri kümesini modelleme, bölüm 2

Son olarak, oluşturduğumuz metin vektörünü, desc_tfidf'i, filtered_words listesini kullanarak filtrelenmiş bir metin vektörü oluşturup bir modelde kullanacaksın. Metne bakarak gözlemin type değerini tahmin edebiliyor musun görelim. Bunun için bir Naive Bayes modeli kullanacaksın.

Bu egzersiz

Python'da Machine Learning için Ön İşleme

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Dizin içine filtered_words listesini geçirerek desc_tfidf vektörünü filtrele.
  • filtered_text özellikleri ve y'yi, eğitim ve test kümelerinde sınıf dağılımı eşit olacak şekilde ayır; random_state olarak 42 kullan.
  • nb modelinin .fit() metodunu kullanarak X_train ve y_train ile modeli eğit.
  • nb modelinin X_test ve y_test üzerindeki .score() değerini yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Use the list of filtered words we created to filter the text vector
filtered_text = ____[:, list(____)]

# Split the X and y sets using train_test_split, setting stratify=y 
X_train, X_test, y_train, y_test = ____(____.toarray(), ____, ____, random_state=42)

# Fit nb to the training sets
____

# Print the score of nb on the test sets
____
Kodu Düzenle ve Çalıştır