1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Práce s chybějícími daty v R

Connected

cvičení

Skupinové souhrny chybějících hodnot

Teď, když umíš vytvořit nabular data, pojďme je využít k prozkoumání datasetu. Vypočítáme souhrnné statistiky podle toho, zda v jiné proměnné chybí hodnoty.

Postupujeme takto:

  • Nejdřív pomocí bind_shadow() převedeme data na nabular data.

  • Pak provedeme souhrny dat pomocí group_by() a summarize() — vypočítáme průměr a směrodatnou odchylku funkcemi mean() a sd().

Pokyny

100 XP
  • Pro dataset oceanbuoys:

  • Zavolej bind_shadow(), pak group_by() podle chybějících hodnot vlhkosti (humidity_NA) a pomocí summarize() z dplyr vypočítej průměr a směrodatnou odchylku pro vítr ve směru východ–západ (wind_ew).

  • Zopakuj totéž, ale tentokrát spočítej souhrny pro vítr ve směru sever–jih (wind_ns).