1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Předpovídání CTR pomocí Machine Learning v Pythonu

Connected

cvičení

Náhodné lesy

Náhodné lesy (Random Forests) jsou klasická a výkonná metoda ensemblového učení, která kombinuje jednotlivé rozhodovací stromy prostřednictvím bootstrap agregace (zkráceně bagging). Mezi dva hlavní hyperparametry tohoto typu modelu patří počet stromů a maximální hloubka každého stromu. V tomto cvičení implementuješ a vyhodnotíš jednoduchý klasifikátor náhodného lesa s pevně stanovenými hodnotami hyperparametrů.

V pracovním prostředí máš k dispozici X_train, y_train, X_test, y_test. Dostupné jsou také pandas jako pd, numpy jako np a sklearn. K dispozici jsou rovněž RandomForestClassifier() z sklearn.ensemble a funkce roc_curve() a auc() z sklearn.metrics.

Pokyny

100 XP
  • Vytvoř klasifikátor náhodného lesa s 50 stromy a maximální hloubkou 5.
  • Natrénuj klasifikátor, získej skóre pravděpodobností pomocí .predict_proba() a predikce pomocí .predict() pro testovací data.
  • Vyhodnoť AUC ROC křivky pro klasifikátor – nejprve pomocí roc_curve() vypočítej fpr a tpr, a pak na výsledku zavolej auc().
  • Vyhodnoť přesnost (precision) a úplnost (recall) klasifikátoru.