Vérifier la correspondance des données

Forcer vos données dans l’emplacement data ne fonctionne pas, car vous perdez la correspondance correcte entre les lignes et les objets spatiaux. Comment ajouter les données de revenu aux données de polygones ? La fonction merge() du package sp est conçue précisément pour cela.

Vous avez peut-être déjà vu merge() avec des data frames. sp::merge() a pratiquement la même structure, mais vous lui passez un objet Spatial*** et un data frame, et elle renvoie un nouvel objet Spatial*** dont l’emplacement des données est désormais la fusion de l’emplacement d’origine et du data frame. Pour réaliser cette fusion, il faut que l’objet spatial et le data frame possèdent chacun une colonne d’identifiants sur laquelle faire l’appariement.

nyc_tracts et nyc_income contiennent tous deux des colonnes avec des identifiants de « tract », ce qui en fait d’excellents candidats pour fusionner les deux jeux de données. Cependant, il est toujours recommandé de vérifier que les identifiants proposés sont uniques et qu’il existe une correspondance pour chaque ligne dans les deux jeux de données.

Vérifions cela avant de passer à la fusion.

Cet exercice fait partie du cours

<cours>Visualiser des données géospatiales avec R</cours>

Instructions de l’exercice

Utilisez any() avec duplicated() sur nyc_income$tract pour vérifier que chaque ligne de nyc_income a un identifiant de tract unique.
Utilisez any() avec duplicated() sur nyc_tracts$TRACTCE pour vérifier que chaque ligne de nyc_tracts a un identifiant de tract unique.
Utilisez all() sur nyc_tracts$TRACTCE %in% nyc_income$tract pour vérifier que les tracts de nyc_tracts sont tous présents dans nyc_income.
Utilisez all() sur nyc_income$tract %in% nyc_tracts$TRACTCE pour vérifier que les tracts de nyc_income sont tous présents dans nyc_tracts.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Check for duplicates in nyc_income


# Check for duplicates in nyc_tracts


# Check nyc_tracts in nyc_income


# Check nyc_income in nyc_tracts

Modifier et exécuter le code

Cet exercice fait partie du cours

<cours>Visualiser des données géospatiales avec R</cours>

IntermédiaireNiveau de compétence

4.6+

Commencer le cours gratuitement

Nous allons commencer en affichant des données spatiales — des ventes immobilières dans une petite ville américaine — avec ggplot2, et nous vous présenterons le package ggmap comme moyen rapide d’ajouter un contexte spatial à vos graphiques. Nous verrons ce qui rend les données spatiales particulières et présenterons les types courants de données spatiales que nous utiliserons tout au long du cours.

Exercise 1: Introduction aux données spatiales Exercise 2: Récupérer une carte d’arrière-plan Exercise 3: Tout rassembler Exercise 4: Comprendre grâce aux esthétiques Exercise 5: Options utiles de get_map() et ggmap()Exercise 6: Différentes cartes Exercise 7: Tirer parti des atouts de ggplot2 Exercise 8: Une alternative rapide Exercise 9: Types courants de données spatiales Exercise 10: Tracer des polygones Exercise 11: Carte choroplèthe Exercise 12: Données raster sous forme de carte thermique

Vous pouvez aller loin avec des données spatiales stockées dans des data frames, mais c’est plus simple si elles sont conservées dans des objets spatiaux dédiés. Dans ce chapitre, nous vous présenterons les classes d’objets spatiaux fournies par le package sp, en particulier pour les données de points et de polygones. Vous apprendrez à explorer et à sous-ensemble ces objets en travaillant sur une carte du monde. Récompense à la clé : nous vous montrerons le package tmap, qui exige des objets spatiaux en entrée, mais rend la création de cartes très facile ! Vous terminerez en réalisant une carte de la population mondiale.

Exercise 1: Introduction aux objets sp Exercise 2: Découvrons un objet spatial Exercise 3: Que contient un objet spatial ?Exercise 4: Un objet spatial plus complexe Exercise 5: sp et S4 Exercise 6: Parcourir la hiérarchie Exercise 7: Encore plus loin dans le terrier du lapin Exercise 8: Plus de classes et de méthodes sp Exercise 9: Sous-ensembles par index Exercise 10: Accéder aux données dans les objets sp Exercise 11: Sous-ensemble basé sur des attributs de données Exercise 12: tmap, un package qui fonctionne avec des objets sp Exercise 13: Introduction à tmap Exercise 14: Construire un graphique par couches Exercise 15: Pourquoi le Groenland est-il si grand ?Exercise 16: Enregistrer un graphique tmap

Le package sp propose quelques classes pour les données raster, mais le package raster offre des classes plus pratiques. Vous découvrirez ces classes et leurs avantages, puis apprendrez à les afficher. Les exemples poursuivent le thème de la population du chapitre 2, mais avec des jeux de données beaucoup plus détaillés, à la fois spatialement et démographiquement. Dans la deuxième partie du chapitre, vous aborderez la couleur — un élément essentiel de toute visualisation, et particulièrement important pour les cartes.

Exercise 1: Le package raster Exercise 2: Qu’est-ce qu’un objet raster ?Exercise 3: Quelques méthodes utiles Exercise 4: Un objet plus complexe Exercise 5: Un package qui utilise des objets Raster Exercise 6: Échelles de couleurs Exercise 7: Choisir la bonne palette Exercise 8: Ajouter une palette de couleurs continue personnalisée aux graphiques ggplot2 Exercise 9: Palette personnalisée dans tmap Exercise 10: Pour aller plus loin sur les échelles de couleurs Exercise 11: Exemple d’échelle par intervalles Exercise 12: Exemple d’échelle divergente Exercise 13: Un exemple qualitatif

Dans ce chapitre, vous suivrez la création d’une visualisation depuis des fichiers de données spatiales bruts jusqu’à l’ajout d’un crédit sur une carte. Au passage, vous apprendrez à lire des données spatiales dans R, à mieux comprendre les projections et systèmes de référence de coordonnées, à ajouter des données supplémentaires à un objet spatial, ainsi que quelques astuces pour peaufiner vos cartes.

Exercise 1: Importer des données spatiales Exercise 2: Lecture d’un shapefile Exercise 3: Lire un fichier raster Exercise 4: Obtenir des données avec un package Exercise 5: Systèmes de référence de coordonnées Exercise 6: Fusionner des données avec des SCR/projections différents Exercise 7: Conversion d’un SCR/projection à un autre Exercise 8: Ajouter des données à des objets spatiaux Exercise 9: La mauvaise méthode Exercise 10: Vérifier la correspondance des données

Exercice actuel

Exercise 11: Fusionner des attributs de données Exercise 12: Un premier tracé Exercise 13: Peaufiner une carte Exercise 14: Filtrer les quartiers Exercise 15: Ajouter des étiquettes de quartiers Exercise 16: Nettoyer la légende et quelques derniers ajustements Exercise 17: Conclusion