BaşlayınÜcretsiz Başlayın

Lojistik regresyon ve özellik seçimi

Bu egzersizde, film yorumu duygu analizine ait veri kümesinde L1 düzenlileştirme kullanarak özellik seçimi yapacağız. Özellikler ve hedefler senin için X_train ve y_train içinde yüklendi.

Önkoşul derste ele aldığımız scikit-learn GridSearchCV() ile en iyi C değerini arayacağız.

Bu egzersiz

Python'da Lineer Sınıflandırıcılar

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • L1 düzenlileştirme kullanan bir lojistik regresyon nesnesi oluştur.
  • Çapraz doğrulama hatasını en aza indiren C değerini bul.
  • Bu C değeri için seçilen özelliklerin sayısını yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Specify L1 regularization
lr = LogisticRegression(solver='liblinear', ____)

# Instantiate the GridSearchCV object and run the search
searcher = GridSearchCV(lr, {'C':[0.001, 0.01, 0.1, 1, 10]})
searcher.fit(X_train, y_train)

# Report the best parameters
print("Best CV params", searcher.best_params_)

# Find the number of nonzero coefficients (selected features)
best_lr = searcher.best_estimator_
coefs = best_lr.____
print("Total number of features:", coefs.size)
print("Number of selected features:", np.count_nonzero(coefs))
Kodu Düzenle ve Çalıştır