Imputare cu KNN

Seturile de date conțin aproape întotdeauna caracteristici corelate între ele. De aceea, este important să le luăm în considerare atunci când imputăm valorile lipsă. Modelele de învățare automată folosesc caracteristicile din DataFrame pentru a identifica corelații și tipare, apoi prezic valorile unei caracteristici selectate.

Unul dintre cele mai simple și mai eficiente modele este K Nearest Neighbors (K Cei Mai Apropiați Vecini). Acesta identifică „K" puncte cât mai similare cu punctele de date existente, pentru a imputa valorile lipsă.

În acest exercițiu, DataFrame-ul diabetes a fost deja încărcat pentru tine. Folosește pachetul fancyimpute pentru a imputa valorile lipsă din DataFrame-ul diabetes.

Importă KNN din fancyimpute.
Copiază diabetes în diabetes_knn_imputed.
Creează un obiect KNN() și atribuie-l variabilei knn_imputer.
Imputează DataFrame-ul diabetes_knn_imputed.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}exercițiu

Instrucțiuni

exercițiu