1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Předpovídání CTR pomocí Machine Learning v Pythonu

Connected

cvičení

Regularizace

Regularizace je proces přidávání informací do modelu za účelem prevence přetrénování. Je důležitá pro zlepšení evaluačních metrik, které jsi viděl/a dříve v této kapitole. V tomto cvičení budeš měnit parametr maximální hloubky rozhodovacího stromu a sledovat, jak to ovlivní výsledky klasifikace.

V pracovním prostředí máš k dispozici proměnné X_train, y_train, X_test, y_test. K dispozici jsou také pandas jako pd, numpy jako np a sklearn. Navíc jsou dostupné funkce confusion_matrix(), precision_score() a recall_score() z sklearn.metrics.

Pokyny

100 XP
  • Vytvoř různé rozhodovací stromy tak, že budeš měnit maximální hloubku každého stromu.
  • Každý strom natrénuj a vytvoř předpovědi na testovacích datech.
  • Pro každý strom vyhodnoť matici záměn, přesnost (precision) a úplnost (recall).