1. Learn
  2. /
  3. Cursuri
  4. /
  5. Gestionarea datelor lipsă în Python

Connected

exercițiu

Imputarea valorilor categoriale cu KNN

După ce toate coloanele categoriale din DataFrame au fost convertite la valori ordinale, DataFrame-ul este pregătit pentru imputare. Imputarea cu modele statistice precum K-Nearest Neighbors (KNN) oferă rezultate mai precise.

În acest exercițiu vei:

  1. Folosi funcția KNN() din fancyimpute pentru a imputa valorile lipsă din DataFrame-ul codat ordinal users.
  2. Converti valorile ordinale înapoi la categoriile corespunzătoare, folosind metoda .inverse_transform() a codorului ordinal.

Reține că ordinal_enc_dict stochează câte un OrdinalEncoder() din sklearn pentru fiecare coloană, iar DataFrame-ul users conține valorile codate (valorile ordinale) pentru fiecare coloană.

Funcția KNN(), dicționarul de OrdinalEncoder()-uri ordinal_enc_dict și DataFrame-ul users au fost deja încărcate pentru tine.

Instrucțiuni

100 XP
  • Imputează DataFrame-ul users folosind metoda fit_transform() a obiectului KNN_imputer. Valorile transformate sunt rotunjite pentru a obține numere întregi.
  • Iterează peste coloanele din users.
  • Selectează OrdinalEncoder()-ul coloanei din ordinal_enc_dict și aplică .inverse_transform() pe array-ul redimensionat reshaped.