Náhodné lesy

Náhodné lesy (Random Forests) jsou klasická a výkonná metoda ensemblového učení, která kombinuje jednotlivé rozhodovací stromy prostřednictvím bootstrap agregace (zkráceně bagging). Mezi dva hlavní hyperparametry tohoto typu modelu patří počet stromů a maximální hloubka každého stromu. V tomto cvičení implementuješ a vyhodnotíš jednoduchý klasifikátor náhodného lesa s pevně stanovenými hodnotami hyperparametrů.

V pracovním prostředí máš k dispozici X_train, y_train, X_test, y_test. Dostupné jsou také pandas jako pd, numpy jako np a sklearn. K dispozici jsou rovněž RandomForestClassifier() z sklearn.ensemble a funkce roc_curve() a auc() z sklearn.metrics.

Vytvoř klasifikátor náhodného lesa s 50 stromy a maximální hloubkou 5.
Natrénuj klasifikátor, získej skóre pravděpodobností pomocí .predict_proba() a predikce pomocí .predict() pro testovací data.
Vyhodnoť AUC ROC křivky pro klasifikátor – nejprve pomocí roc_curve() vypočítej fpr a tpr, a pak na výsledku zavolej auc().
Vyhodnoť přesnost (precision) a úplnost (recall) klasifikátoru.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

cvičení