1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Procvičování otázek k pohovorům z oblasti Machine Learning v Pythonu

Connected

cvičení

Rozhodovací strom

V předchozích třech kapitolách sis osvojil/a celou řadu technik, které ti pomůžou zvládnout mnoho aspektů pohovoru z oblasti Machine Learning. V této kapitole se seznámíš s různými způsoby, jak zajistit, aby byl jakýkoliv model – ať už ho máš vytvořit nebo o něm diskutovat – dobře generalizovatelný, správně vyhodnocený a vhodně vybraný z možných alternativ.

V tomto cvičení se ponoříš do ladění hyperparametrů rozhodovacího stromu na datasetu loan_data. Budeš ladit parametr min_samples_split, což je minimální počet vzorků potřebných k vytvoření dalšího binárního větvení, a max_depth, který určuje maximální hloubku stromu. Čím hlubší strom, tím více větvení a tím více informací o datech zachytí.

Matice příznaků X a cílový vektor y jsou již naimportovány.

Všimni si, že opět procházíš všemi kroky pipeline strojového učení!

Machine learning pipeline

Instrukce 1/2

undefined XP
  • 1
    • Importuj správnou funkci pro klasifikátor rozhodovacího stromu a rozděl data na trénovací a testovací sadu.
    • Vytvoř instanci klasifikátoru rozhodovacího stromu, natrénuj ho, proveď predikci a vypiš přesnost.
  • 2
    • Importuj správnou funkci pro křížově validovaný grid search.
    • Vytvoř instanci klasifikátoru rozhodovacího stromu a použij ho spolu s mřížkou parametrů ke křížově validovanému grid searchi.
    • Natrénuj model a vypiš metriky jeho vyhodnocení.