MulaiMulai sekarang secara gratis

Membandingkan distribusi ongkos berdasarkan jenis pembayaran

Kita telah melihat bahwa tidak ada tip untuk pembayaran tunai. Apakah ini berarti orang yang membayar tunai tidak memberi tip, atau berarti tip tidak tercatat saat orang membayar dengan tunai? Untuk rute yang serupa, kita berharap distribusi total ongkos identik terlepas dari jenis pembayaran. Dalam latihan ini, kita akan membuat plot kuantil yang membandingkan distribusi total ongkos menurut jenis pembayaran dan membandingkannya dengan plot asli pada facet yang berbeda.

Sebuah himpunan data amount_compare telah dibuat untuk Anda yang berisi variabel payment_type, amount, dan amount_type. amount_type membedakan antara nilai yang merefleksikan total pembayaran vs. pembayaran tanpa tip.

Latihan ini adalah bagian dari kursus

Visualizing Big Data with Trelliscope in R

Lihat Kursus

Petunjuk latihan

  • Periksa himpunan data amount_compare sebelum menyelesaikan latihan dengan mencetaknya ke konsol untuk memahami strukturnya agar membantu spesifikasi plot.
  • Gunakan geom_qq() untuk membuat plot kuantil dari total ongkos, amount. Pastikan untuk menetapkan distribution = stats::qunif.
  • Pastikan plot kuantil terpisah dibuat untuk setiap jenis pembayaran dengan memberi color berdasarkan jenis pembayaran sehingga setiap distribusi ditumpangkan pada plot yang sama.
  • Tampilkan perbandingan distribusi untuk setiap amount_type dengan melakukan faceting.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

library(ggplot2)
library(dplyr)
library(tidyr)

# Get data ready to plot
amount_compare <- tx_pop %>%
  mutate(total_no_tip = total_amount - tip_amount) %>%
  select(total_amount, total_no_tip, payment_type) %>%
  pivot_longer(!payment_type, names_to = "amount_type", values_to = "amount")

# Quantile plot
ggplot(___, aes(sample = ___, color = ___)) +
  geom_qq(distribution = ___, shape = 21) +
  facet_wrap(~ ___) +
  ylim(c(3, 20))
Edit dan Jalankan Kode