CommencerCommencer gratuitement

Agréger des ensembles pour observer leurs différences

Pour comparer deux ensembles spécifiques et les types de pièces LEGO qui les composent, nous devons agréger les données par thèmes distincts. Comme vu dans la vidéo, nous voulons également ajouter une colonne pour comprendre la fraction de pièces spécifiques appartenant à chaque ensemble, plutôt que de ne regarder que les nombres de pièces.

La table inventory_parts_themes a été préchargée pour vous.

inventory_parts_themes <- inventories %>%
  inner_join(inventory_parts, by = c("id" = "inventory_id")) %>%
  arrange(desc(quantity)) %>%
  select(-id, -version) %>%
  inner_join(sets, by = "set_num") %>%
  inner_join(themes, by = c("theme_id" = "id"), suffix = c("_set", "_theme"))

Cet exercice fait partie du cours

Assembler des données avec dplyr

Afficher le cours

Instructions

  • Ajoutez un filtre pour le thème "Batman" afin de créer l’objet batman_colors.
  • Ajoutez une colonne fraction à batman_colors qui affiche le total divisé par la somme du total.
  • Répétez les étapes pour filtrer et agréger les données des ensembles "Star Wars" afin de créer l’objet star_wars_colors.
  • Ajoutez une colonne fraction à star_wars_colors pour afficher la fraction du total.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

batman_colors <- inventory_parts_themes %>%
  # Filter the inventory_parts_themes table for the Batman theme
  filter(name_theme == ___) %>%
  group_by(color_id) %>%
  summarize(total = sum(quantity)) %>%
  # Add a fraction column of the total divided by the sum of the total 
  mutate(___)

# Filter and aggregate the Star Wars set data; add a fraction column
star_wars_colors <- inventory_parts_themes %>%
  ___
	

Modifier et exécuter le code