1. Learn
  2. /
  3. Cursuri
  4. /
  5. Gestionarea datelor lipsă în Python

Connected

exercițiu

Codificarea ordinală a unui DataFrame

Caracteristicile categoriale pot fi codificate prin două tehnici: codificarea one-hot și codificarea ordinală. În codificarea one-hot, fiecare categorie devine o coloană, iar coloana categoriei respective primește valoarea 1 pentru fiecare rând, celelalte primind 0. În codificarea ordinală, categoriile sunt mapate la valori întregi, începând de la 0 până la numărul de categorii.

În acest exercițiu, vei itera peste toate coloanele din DataFrame-ul users pentru a codifica ordinal categoriile. Vei stoca, de asemenea, un encoder pentru fiecare coloană într-un dicționar ordinal_enc_dict, astfel încât coloanele codificate să poată fi reconvertite la categoriile originale.

Instrucțiuni

100 XP
  • Definește un dicționar gol ordinal_enc_dict.
  • Creează un obiect Ordinal Encoder pentru fiecare coloană.
  • Selectează valorile non-nule ale coloanei din users și codifică-le.
  • Atribuie înapoi valorile codificate valorilor non-nule ale fiecărei coloane (col_name) din users.