1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Procvičování otázek k pohovorům z oblasti Machine Learning v Pythonu

Connected

cvičení

Jednoduchá imputace

Jak jsi viděl/a v předchozím cvičení, mazání dat může dataset příliš zmenšit. V kontextu přijímacího pohovoru to může vést ke zkresleným výsledkům tvého modelu strojového učení.

Dynamičtějším způsobem, jak pracovat s chybějícími hodnotami, je jejich imputace. V Pythonu to lze provést různými způsoby – v tomto cvičení použiješ funkci SimpleImputer() z modulu sklearn.impute na dataset loan_data.

Potom využiješ pandas a numpy k převedení imputovaného datasetu na DataFrame.

Všimni si, že do pipeline jsou nyní přidány 2 kroky – Instantiate a Fit: Machine learning pipeline

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Vyber numerické sloupce z loan_data a přiřaď je do proměnné numeric_cols.