Agréger des ensembles pour observer leurs différences
Pour comparer deux ensembles spécifiques et les types de pièces LEGO qui les composent, nous devons agréger les données par thèmes distincts. Comme vu dans la vidéo, nous voulons également ajouter une colonne pour comprendre la fraction de pièces spécifiques appartenant à chaque ensemble, plutôt que de ne regarder que les nombres de pièces.
La table inventory_parts_themes a été préchargée pour vous.
inventory_parts_themes <- inventories %>%
inner_join(inventory_parts, by = c("id" = "inventory_id")) %>%
arrange(desc(quantity)) %>%
select(-id, -version) %>%
inner_join(sets, by = "set_num") %>%
inner_join(themes, by = c("theme_id" = "id"), suffix = c("_set", "_theme"))
Cet exercice fait partie du cours
Assembler des données avec dplyr
Instructions
- Ajoutez un filtre pour le thème
"Batman"afin de créer l’objetbatman_colors. - Ajoutez une colonne
fractionàbatman_colorsqui affiche le total divisé par la somme du total. - Répétez les étapes pour filtrer et agréger les données des ensembles
"Star Wars"afin de créer l’objetstar_wars_colors. - Ajoutez une colonne
fractionàstar_wars_colorspour afficher la fraction du total.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
batman_colors <- inventory_parts_themes %>%
# Filter the inventory_parts_themes table for the Batman theme
filter(name_theme == ___) %>%
group_by(color_id) %>%
summarize(total = sum(quantity)) %>%
# Add a fraction column of the total divided by the sum of the total
mutate(___)
# Filter and aggregate the Star Wars set data; add a fraction column
star_wars_colors <- inventory_parts_themes %>%
___