DataFrames zusammenführen

In der letzten Übung hast du basierend auf Yelp einen Datensatz mit den Top 100 Cafés in New York City erstellt. Jetzt kombinierst du ihn mit demografischen Daten, um herauszufinden, welches Viertel die meisten guten Cafés pro Kopf hat.

Dafür wirst du zwei Datensätze mit der DataFrame-Methode merge() zusammenführen. Der erste, crosswalk, ist eine Zuordnungstabelle zwischen Postleitzahlen (ZIP Codes) und Public Use Micro Data Sample Areas (PUMAs). PUMAs sind Zusammenfassungen von Zensusgebieten und entsprechen ungefähr den Stadtvierteln von NYC. Anschließend fügst du pop_data hinzu, das für jede PUMA die Bevölkerungsschätzungen von 2016 enthält.

pandas (als pd) wurde importiert, ebenso wie der DataFrame cafes aus der letzten Übung.

Diese Übung ist Teil des Kurses

<Kurs>Vereinfachte Datenaufnahme mit pandas</Kurs>

Kurs ansehen

Interaktive praktische Übung

Verwandle Theorie mit einer unserer interaktiven Übungen in die Praxis

Übung starten