1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Ensemble Methods in Python

Connected

cvičení

Předpovídání úmrtí v GoT

Cílová proměnná sice neobsahuje žádné chybějící hodnoty, jiné příznaky ale ano. Protože se tento kurz nezaměřuje na čištění a předzpracování dat, postarali jsme se o následující kroky za tebe:

  • Hodnoty NA byly nahrazeny hodnotou 0.
  • Záporné hodnoty věku byly nahrazeny hodnotou 0.
  • Hodnoty NA věku byly nahrazeny průměrem.

Teď sestavíme ensemble model pomocí techniky průměrování. Byly připraveny tyto individuální modely:

  • Logistická regrese (clf_lr).
  • Rozhodovací strom (clf_dt).
  • Metoda podpůrných vektorů (clf_svm).

Protože je cílová proměnná binární, mohou mít všechny tyto modely dobré individuální výsledky. Tvým úkolem je zkombinovat je pomocí průměrování. Vzpomeň si z videa, že to je totéž jako přístup soft votingu – proto stále použiješ VotingClassifier().

Pokyny

100 XP
  • Sestav seznam tuplů ve formátu (řetězec, estimátor). Použij 'lr' pro clf_lr, 'dt' pro clf_dt a 'svm' pro clf_svm.
  • Sestav průměrovací klasifikátor s názvem clf_avg. Nezapomeň zadat argument pro parametr voting.