Fusionner des DataFrames

Dans le dernier exercice, vous avez construit un jeu de données des 100 meilleurs cafés de New York d’après Yelp. Vous allez maintenant le combiner avec des données démographiques pour déterminer quel quartier compte le plus de bons cafés par habitant.

Pour cela, vous allez fusionner deux jeux de données avec la méthode merge() d’un DataFrame. Le premier, crosswalk, est une table de correspondance entre les codes ZIP et les Public Use Micro Data Sample Areas (PUMA), qui sont des agrégats de secteurs de recensement et correspondent à peu près aux quartiers de NYC. Ensuite, vous fusionnerez pop_data, qui contient les estimations de population 2016 pour chaque PUMA.

pandas (sous l’alias pd) a été importé, tout comme le dataframe cafes du dernier exercice.

Cet exercice fait partie du cours

<cours>Ingestion de données simplifiée avec pandas</cours>

Voir le cours

Exercice interactif pratique

Transformez la théorie en action avec l’un de nos exercices interactifs

Commencer l’exercice