1. Învăţa
  2. /
  3. Courses
  4. /
  5. Preprocesare pentru Machine Learning în Python

Connected

exercise

Identificarea caracteristicilor pentru standardizare

În acest exercițiu, vei analiza varianța coloanelor din setul de date UFO pentru a determina ce caracteristici ar trebui standardizate. După ce examinezi varianța coloanelor seconds și minutes, vei observa că varianța coloanei seconds este extrem de mare. Deoarece seconds și minutes sunt corelate (o problemă pe care o vom rezolva la selectarea caracteristicilor pentru modelare), vom aplica normalizarea logaritmică coloanei seconds.

Instrucțiuni

100 XP
  • Calculează varianța coloanelor seconds și minutes și analizează cu atenție rezultatele.
  • Aplică normalizarea logaritmică coloanei seconds, transformând-o într-o nouă coloană numită seconds_log.
  • Afișează varianța coloanei seconds_log.