1. Learn
  2. /
  3. Cursuri
  4. /
  5. Gestionarea datelor lipsă în Python

Connected

exercițiu

Imputare cu KNN

Seturile de date conțin aproape întotdeauna caracteristici corelate între ele. De aceea, este important să le luăm în considerare atunci când imputăm valorile lipsă. Modelele de învățare automată folosesc caracteristicile din DataFrame pentru a identifica corelații și tipare, apoi prezic valorile unei caracteristici selectate.

Unul dintre cele mai simple și mai eficiente modele este K Nearest Neighbors (K Cei Mai Apropiați Vecini). Acesta identifică „K" puncte cât mai similare cu punctele de date existente, pentru a imputa valorile lipsă.

În acest exercițiu, DataFrame-ul diabetes a fost deja încărcat pentru tine. Folosește pachetul fancyimpute pentru a imputa valorile lipsă din DataFrame-ul diabetes.

Instrucțiuni

100 XP
  • Importă KNN din fancyimpute.
  • Copiază diabetes în diabetes_knn_imputed.
  • Creează un obiect KNN() și atribuie-l variabilei knn_imputer.
  • Imputează DataFrame-ul diabetes_knn_imputed.