1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Preprocessing pro Machine Learning v Pythonu

Connected

Cvičení

Výběr příznaků pro standardizaci

V tomto cvičení prozkoumáš rozptyly sloupců v datasetu UFO a zjistíš, které příznaky by měly být standardizovány. Po zobrazení rozptylů sloupců seconds a minutes uvidíš, že rozptyl sloupce seconds je extrémně vysoký. Protože seconds a minutes spolu souvisí (tuto závislost vyřešíme při výběru příznaků pro modelování), provedeme logaritmickou normalizaci sloupce seconds.

Pokyny

100 XP
  • Vypočítej rozptyl sloupců seconds a minutes a pečlivě si prohlédni výsledky.
  • Proveď logaritmickou normalizaci sloupce seconds a výsledek ulož do nového sloupce s názvem seconds_log.
  • Vypiš rozptyl sloupce seconds_log.