1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Joining Data with dplyr

Connected

Cvičení

Agregace sad pro porovnání jejich rozdílů

Abychom mohli porovnat dvě konkrétní sady a typy LEGO dílků, ze kterých se skládají, budeme muset data agregovat do samostatných témat. Navíc, jak jsme viděli ve videu, přidáme sloupec, který nám ukáže podíly jednotlivých dílků v každé sadě – nestačí nám totiž jen absolutní počty.

Tabulka inventory_parts_themes je pro tebe předem připravena.

inventory_parts_themes <- inventories %>%
  inner_join(inventory_parts, by = c("id" = "inventory_id")) %>%
  arrange(desc(quantity)) %>%
  select(-id, -version) %>%
  inner_join(sets, by = "set_num") %>%
  inner_join(themes, by = c("theme_id" = "id"), suffix = c("_set", "_theme"))

Pokyny

100 XP
  • Přidej filtr pro téma "Batman" a vytvoř tak objekt batman_colors.
  • Přidej do batman_colors sloupec fraction, který zobrazí celkový počet vydělený součtem všech celkových počtů.
  • Zopakuj stejné kroky pro filtrování a agregaci dat sady "Star Wars" a vytvoř objekt star_wars_colors.
  • Přidej do star_wars_colors sloupec fraction, který zobrazí podíl z celkového počtu.