CommencerCommencer gratuitement

Trouver une observation sans correspondance

Les left joins sont très utiles pour vérifier vos hypothèses sur un jeu de données et garantir l’intégrité de vos données.

Par exemple, la table inventories contient une colonne version, utilisée lorsqu’un kit LEGO subit une modification ou une mise à niveau. On pourrait supposer que tous les sets (qui se joignent bien avec inventories) ont au moins une version 1. Testons cette hypothèse dans l’exercice suivant.

Cet exercice fait partie du cours

Assembler des données avec dplyr

Afficher le cours

Instructions

  • Utilisez un left_join pour joindre sets et inventory_version_1 via leur colonne commune.
  • Appliquez filter pour les lignes où la colonne version vaut NA en utilisant is.na.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

inventory_version_1 <- inventories %>%
  filter(version == 1)

# Join versions to sets
sets %>%
  ___ %>%
  # Filter for where version is na
  ___
Modifier et exécuter le code