Lasy losowe

Lasy losowe (random forests) to klasyczna i skuteczna metoda zespołowa, która łączy pojedyncze drzewa decyzyjne za pomocą agregacji bootstrapowej (tzw. bagging). Dwa główne hiperparametry tego modelu to liczba drzew oraz maksymalna głębokość każdego z nich. W tym ćwiczeniu zaimplementujesz i ocenisz prosty klasyfikator oparty na lasach losowych z ustalonymi wartościami hiperparametrów.

W przestrzeni roboczej dostępne są: X_train, y_train, X_test, y_test. Załadowane są również biblioteki pandas jako pd, numpy jako np oraz sklearn. Do dyspozycji masz także klasę RandomForestClassifier() z modułu sklearn.ensemble, a także funkcje roc_curve() i auc() z modułu sklearn.metrics.

Utwórz klasyfikator lasów losowych z 50 drzewami i maksymalną głębokością równą 5.
Wytrenuj klasyfikator, a następnie pobierz prawdopodobieństwa za pomocą .predict_proba() oraz predykcje za pomocą .predict() dla danych testowych.
Wyznacz pole pod krzywą ROC: najpierw użyj funkcji roc_curve(), aby obliczyć fpr i tpr, a następnie zastosuj auc() na wynikach.
Oblicz precyzję i czułość klasyfikatora.

ćwiczenie

Lasy losowe

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie