Rozhodovací strom

V předchozích třech kapitolách sis osvojil/a celou řadu technik, které ti pomůžou zvládnout mnoho aspektů pohovoru z oblasti Machine Learning. V této kapitole se seznámíš s různými způsoby, jak zajistit, aby byl jakýkoliv model – ať už ho máš vytvořit nebo o něm diskutovat – dobře generalizovatelný, správně vyhodnocený a vhodně vybraný z možných alternativ.

V tomto cvičení se ponoříš do ladění hyperparametrů rozhodovacího stromu na datasetu loan_data. Budeš ladit parametr min_samples_split, což je minimální počet vzorků potřebných k vytvoření dalšího binárního větvení, a max_depth, který určuje maximální hloubku stromu. Čím hlubší strom, tím více větvení a tím více informací o datech zachytí.

Matice příznaků X a cílový vektor y jsou již naimportovány.

Všimni si, že opět procházíš všemi kroky pipeline strojového učení!

Machine learning pipeline

1
- Importuj správnou funkci pro klasifikátor rozhodovacího stromu a rozděl data na trénovací a testovací sadu.
- Vytvoř instanci klasifikátoru rozhodovacího stromu, natrénuj ho, proveď predikci a vypiš přesnost.

2
- Importuj správnou funkci pro křížově validovaný grid search.
- Vytvoř instanci klasifikátoru rozhodovacího stromu a použij ho spolu s mřížkou parametrů ke křížově validovanému grid searchi.
- Natrénuj model a vypiš metriky jeho vyhodnocení.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Instrukce 1/2

cvičení