1. Learn
  2. /
  3. Courses
  4. /
  5. Procvičování otázek k pohovorům z oblasti Machine Learning v Pythonu

Connected

Exercise

Techniky převzorkování

V předchozím cvičení jsi viděl/a, jak nevyvážené třídy mohou ovlivnit výsledky matice záměn. V tomto cvičení si procvičíš techniky převzorkování a prozkoumáš, jaký vliv mohou různé přístupy k převzorkování mít na dataset s nevyváženými třídami, jako je loan_data. Pomocí funkce resample() z knihovny sklearn se technika, při které přizpůsobujeme počet řádků majoritní třídě, nazývá upsampling, zatímco přizpůsobení počtu řádků minoritní třídě se nazývá downsampling.

Vytvoříš jak upsamplovanou, tak downsamplovanou verzi datasetu loan_data, na obě aplikuješ logistickou regresi a následně vyhodnotíš výsledky. Trénovací data a jejich popisky odpovídající hodnotě deny jsou podmnožinou obsahující pouze minoritní třídu, popisky approve pak odpovídají majoritní třídě.

Objekt train/test split pro tvorbu predikcí je uložen v pracovním prostředí jako X_test a můžeš ho v cvičeních rovnou použít.

Instructions 1/3

undefined XP
  • 1
    • Vytvoř upsamplovanou minoritní třídu o délce majoritní třídy a obě spoj (tato část je již hotová).
    • Vytvoř downsamplovanou majoritní třídu o délce minoritní třídy a obě spoj (tato část je již hotová).
  • 2
    • Vytvoř upsamplovanou matici příznaků a pole cílové proměnné.
    • Vytvoř instanci modelu logistické regrese, natrénuj ho a proveď predikci s X_test.
    • Vypiš hodnotící metriky.
  • 3
    • Vytvoř downsamplovanou matici příznaků a pole cílové proměnné.
    • Vytvoř instanci modelu logistické regrese, natrénuj ho a proveď predikci s X_test.
    • Vypiš hodnotící metriky.