1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Preprocessing pro Machine Learning v Pythonu

Connected

Cvičení

Modelování datasetu UFO, část 1

V tomto cvičení sestavíš model k nejbližších sousedů, který bude předpovídat, ve které zemi bylo pozorování UFO zaznamenáno. Dataset X obsahuje log-normalizovaný sloupec se sekundami, one-hot enkódované sloupce s typy pozorování a také měsíc a rok, kdy k pozorování došlo. Štítky y představují enkódovaný sloupec země, kde 1 odpovídá "us" a 0 odpovídá "ca".

Pokyny

100 XP
  • Vypiš .columns datasetu X.
  • Rozděl datasety X a y tak, aby rozložení tříd štítků bylo stejné v trénovací i testovací sadě, a použij random_state s hodnotou 42.
  • Natrénuj model knn na trénovacích datech.
  • Vypiš přesnost modelu knn na testovací sadě.