1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Ensemble Methods in Python

Connected

cvičení

Složitější baggingový model

Teď, když jsi prozkoumal/a data o polovodičích, sestavíme baggingový klasifikátor pro predikci štítku 'Pass/Fail' na základě vstupních příznaků.

Předzpracovaná datová sada je v tvém pracovním prostoru dostupná jako uci_secom a trénovací i testovací sady jsou již připravené.

Protože cílová třída je silně nevyvážená, použij jako základní estimátor logistickou regresi s parametrem "balanced".

Dobu výpočtu pro LogisticRegression zkrátíme pomocí parametru solver='liblinear', který je rychlejší než výchozí optimalizátor.

Pokyny

100 XP
  • Vytvoř instanci logistické regrese jako základní klasifikátor s parametry: class_weight='balanced', solver='liblinear' a random_state=42.
  • Sestav baggingový klasifikátor s logistickou regresí jako základním estimátorem, nastav maximální počet příznaků na 10 a zahrň out-of-bag skóre.
  • Vypiš out-of-bag skóre a porovnej ho s přesností modelu.