1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Vizualizace velkých dat s Trelliscope v R

Connected

cvičení

Vztah mezi délkou jízdy a celkovým jízdným

Dá se předpokládat, že existuje vztah mezi celkovým jízdným a délkou jízdy. Protože datových bodů je příliš mnoho na to, abychom použili bodový graf, prozkoumáme tento vztah pomocí hexagonového grafu.

V pracovním prostředí máš k dispozici datovou sadu tx.

Pokyny

100 XP
  • Použij hexagonové biny k vizualizaci bivariátního rozdělení proměnných total_amount (osa y) a trip_duration (osa x).
  • Nastav argument bins funkce geom_hex() na hodnotu 75.
  • Protože jsou obě proměnné výrazně zešikmené, přeškáluj osy x i y na logaritmickou základnu 10. Tato transformace vygeneruje několik varování týkajících se malého počtu záznamů s nulovou délkou jízdy nebo výší jízdného.