LoslegenKostenlos loslegen

DataFrames zusammenführen

In der letzten Übung hast du basierend auf Yelp einen Datensatz mit den Top 100 Cafés in New York City erstellt. Jetzt kombinierst du ihn mit demografischen Daten, um herauszufinden, welches Viertel die meisten guten Cafés pro Kopf hat.

Dafür wirst du zwei Datensätze mit der DataFrame-Methode merge() zusammenführen. Der erste, crosswalk, ist eine Zuordnungstabelle zwischen Postleitzahlen (ZIP Codes) und Public Use Micro Data Sample Areas (PUMAs). PUMAs sind Zusammenfassungen von Zensusgebieten und entsprechen ungefähr den Stadtvierteln von NYC. Anschließend fügst du pop_data hinzu, das für jede PUMA die Bevölkerungs­schätzungen von 2016 enthält.

pandas (als pd) wurde importiert, ebenso wie der DataFrame cafes aus der letzten Übung.

Diese Übung ist Teil des Kurses

Vereinfachte Datenaufnahme mit pandas

Kurs anzeigen

Interaktive Übung

In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.

Übung starten