1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Ensemble Methods in Python

Connected

cvičení

Trénování s bootstrappingem

Teď si sestavíme "slabý" klasifikátor rozhodovacího stromu a natrénujeme ho na vzorku trénovací sady vybraném s opakováním. Pomůže ti to pochopit, co se děje v každé iteraci baggingového ensemblu.

Pro výběr vzorku použiješ metodu .sample() z pandas, která má parametr replace. Například následující řádek kódu vybere vzorek s opakováním z celého DataFrame df:

df.sample(frac=1.0, replace=True, random_state=42)

Pokyny

100 XP
  • Vytvoř vzorek s opakováním (replace=True) z celé (frac=1.0) trénovací sady X_train.
  • Sestav klasifikátor rozhodovacího stromu s parametrem max_depth = 4.
  • Natrénuj model na vybraných trénovacích datech.