1. Aprende
  2. /
  3. Cursos
  4. /
  5. Preprocessing pro Machine Learning v Pythonu

Connected

Ejercicio

Kódování kategorických proměnných – binární

Prohlédni si dataset hiking. Několik sloupců v něm vyžaduje kódování, než je bude možné použít v modelu – jedním z nich je sloupec Accessible. Accessible je binární příznak se dvěma hodnotami: Y nebo N, které je potřeba zakódovat na 1 a 0. K této transformaci použij metodu LabelEncoder z knihovny scikit-learn.

Instrucciones

100 XP
  • Ulož LabelEncoder() do proměnné s názvem enc.
  • Pomocí metody .fit_transform() encoderu zakóduj sloupec "Accessible" v datasetu hiking. Nový sloupec pojmenuj Accessible_enc.
  • Porovnej oba sloupce vedle sebe a podívej se, jak kódování dopadlo.