LoslegenKostenlos loslegen

Namen mit faker entfernen

In dieser Übung arbeitest du mit dem Datensatz der NBA-Gehälter von 2018. Wären diese Daten nicht öffentlich, gäbe es ein hohes Risiko für einen Re-Identifikationsangriff. Da zum Beispiel nur ein „Aaron Brooks“ in der NBA spielt, ließen sich möglicherweise andere sensible Informationen wie sein genaues Jahresgehalt ableiten. Indem du persönliche Namen aus dem Datensatz entfernst, kannst du potenziellen Schaden für die betroffenen Personen vermeiden.

Die Methode .name() generiert zufällige Namen, darunter auch weibliche. Zusätzlich wirst du auch Namen nur eines Geschlechts erzeugen.

Das DataFrame wurde als nba geladen.

Diese Übung ist Teil des Kurses

Datenschutz und Anonymisierung mit Python

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import the Faker class
____

# Initialize the generator
____
Code bearbeiten und ausführen