1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Preprocessing w uczeniu maszynowym w Pythonie

Connected

Exercise

Identyfikowanie cech do standaryzacji

W tym ćwiczeniu przeanalizujesz wariancję kolumn w zbiorze danych o UFO, aby określić, które cechy wymagają standaryzacji. Po przyjrzeniu się wariancjom kolumn seconds i minutes zauważysz, że wariancja kolumny seconds jest bardzo duża. Ponieważ seconds i minutes są ze sobą powiązane (tym problemem zajmiemy się podczas wyboru cech do modelowania), dokonamy logarytmicznej normalizacji kolumny seconds.

Instrukcje

100 XP
  • Oblicz wariancję kolumn seconds i minutes, a następnie uważnie przyjrzyj się wynikom.
  • Przeprowadź logarytmiczną normalizację kolumny seconds, zapisując wynik w nowej kolumnie o nazwie seconds_log.
  • Wyświetl wariancję kolumny seconds_log.