1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przewidywanie CTR z użyciem uczenia maszynowego w Pythonie

Connected

ćwiczenie

Lasy losowe

Lasy losowe (random forests) to klasyczna i skuteczna metoda zespołowa, która łączy pojedyncze drzewa decyzyjne za pomocą agregacji bootstrapowej (tzw. bagging). Dwa główne hiperparametry tego modelu to liczba drzew oraz maksymalna głębokość każdego z nich. W tym ćwiczeniu zaimplementujesz i ocenisz prosty klasyfikator oparty na lasach losowych z ustalonymi wartościami hiperparametrów.

W przestrzeni roboczej dostępne są: X_train, y_train, X_test, y_test. Załadowane są również biblioteki pandas jako pd, numpy jako np oraz sklearn. Do dyspozycji masz także klasę RandomForestClassifier() z modułu sklearn.ensemble, a także funkcje roc_curve() i auc() z modułu sklearn.metrics.

Instrukcje

100 XP
  • Utwórz klasyfikator lasów losowych z 50 drzewami i maksymalną głębokością równą 5.
  • Wytrenuj klasyfikator, a następnie pobierz prawdopodobieństwa za pomocą .predict_proba() oraz predykcje za pomocą .predict() dla danych testowych.
  • Wyznacz pole pod krzywą ROC: najpierw użyj funkcji roc_curve(), aby obliczyć fpr i tpr, a następnie zastosuj auc() na wynikach.
  • Oblicz precyzję i czułość klasyfikatora.