1. Learn
  2. /
  3. Courses
  4. /
  5. Procvičování otázek k pohovorům z oblasti Machine Learning v Pythonu

Connected

Exercise

Iterativní imputace

V předchozím cvičení jsi pro chybějící hodnoty v loan_data použil/a imputaci průměrem. Na pohovoru pro Machine Learning se ale pravděpodobně setkáš s dotazy na dynamičtější techniky imputace, které využívají ostatní příznaky v datasetu.

V tomto cvičení si procvičíš přístup založený na strojovém učení: chybějící hodnoty budeme imputovat jako funkci zbývajících příznaků pomocí IterativeImputer() z sklearn.impute. Jde o multivariátní imputátor, který odhaduje každý příznak na základě všech ostatních metodou „round-robin".

Upozorňujeme, že tato funkce je stále považována za experimentální – více informací najdeš v dokumentaci.

V pipeline se nacházíš na stejném místě jako dříve:

Machine learning pipeline

Instructions 1/4

undefined XP
    1
    2
    3
    4
  • Vyber numerické sloupce z loan_data a přiřaď je do proměnné numeric_cols.