1. Learn
  2. /
  3. Cursuri
  4. /
  5. Confidențialitatea datelor și anonimizarea în Python

Connected

exercițiu

Folosirea ierarhiilor pentru date categorice

În acest exercițiu, vei crea și utiliza ierarhii pentru a aplica generalizarea datelor pe coloana bachelors din setul de date US Adult Income.

Un dicționar inițial cu ierarhiile este disponibil sub numele hierarchies. Acesta conține trei categorii pentru tipurile de educație: Primary, Secondary și Higher; fiecare are o listă cu valorile corespunzătoare din date. Explorează-l în consola interactivă dacă dorești.

Vom crea un dicționar nou care va stoca informațiile generalizate despre educație și îl vom folosi pentru a înlocui valorile originale.

Setul de date este disponibil ca income_df.

Instrucțiuni

100 XP
  • Inițializează education_hierarchy ca un dicționar gol.
  • Completează bucla interioară pentru a atribui tipul de educație key ca valoare. De exemplu: {'Some-college': 'Higher education'}.
  • Aplică generalizarea ierarhiei educaționale pe coloana bachelors, atribuind rezultatul noii coloane bachelors_generalized.