1. Nauka
  2. /
  3. Kursy
  4. /
  5. End-to-End Machine Learning

Connected

ćwiczenie

Selekcja cech

Przygotowując dane do modelowania, warto zadbać o to, by model dysponował zestawem przydatnych cech, na podstawie których będzie stawiać prognozy (lub diagnozy). Aby cechy były użyteczne, muszą uchwycić istotne właściwości zbioru danych o chorobach serca w sposób ortogonalny – więcej danych nie zawsze oznacza lepsze wyniki!

Do wyboru przydatnych cech możesz użyć modułu sklearn.feature_selection.SelectFromModel. SelectFromModel stosuje metodę siłową, która wykorzystuje model RandomForestClassifier do znalezienia najważniejszych cech potrzebnych do diagnozy chorób serca.

RandomForestClassifier został już zaimportowany, a cechy i etykiety zbioru danych o chorobach serca są dostępne odpowiednio jako X_train i y_train.

Instrukcje 1/4

undefined XP
    1
    2
    3
    4
  • Zdefiniuj klasyfikator lasu losowego z parametrami n_jobs = -1, class_weight = 'balanced' oraz max_depth = 5, a następnie przeprowadź selekcję cech na heart_disease_df przy użyciu .fit().