Membandingkan distribusi ongkos berdasarkan jenis pembayaran
Kita telah melihat bahwa tidak ada tip untuk pembayaran tunai. Apakah ini berarti orang yang membayar tunai tidak memberi tip, atau berarti tip tidak tercatat saat orang membayar dengan tunai? Untuk rute yang serupa, kita berharap distribusi total ongkos identik terlepas dari jenis pembayaran. Dalam latihan ini, kita akan membuat plot kuantil yang membandingkan distribusi total ongkos menurut jenis pembayaran dan membandingkannya dengan plot asli pada facet yang berbeda.
Sebuah himpunan data amount_compare telah dibuat untuk Anda yang berisi variabel payment_type, amount, dan amount_type. amount_type membedakan antara nilai yang merefleksikan total pembayaran vs. pembayaran tanpa tip.
Latihan ini adalah bagian dari kursus
Visualizing Big Data with Trelliscope in R
Petunjuk latihan
- Periksa himpunan data
amount_comparesebelum menyelesaikan latihan dengan mencetaknya ke konsol untuk memahami strukturnya agar membantu spesifikasi plot. - Gunakan
geom_qq()untuk membuat plot kuantil dari total ongkos,amount. Pastikan untuk menetapkandistribution = stats::qunif. - Pastikan plot kuantil terpisah dibuat untuk setiap jenis pembayaran dengan memberi
colorberdasarkan jenis pembayaran sehingga setiap distribusi ditumpangkan pada plot yang sama. - Tampilkan perbandingan distribusi untuk setiap
amount_typedengan melakukan faceting.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
library(ggplot2)
library(dplyr)
library(tidyr)
# Get data ready to plot
amount_compare <- tx_pop %>%
mutate(total_no_tip = total_amount - tip_amount) %>%
select(total_amount, total_no_tip, payment_type) %>%
pivot_longer(!payment_type, names_to = "amount_type", values_to = "amount")
# Quantile plot
ggplot(___, aes(sample = ___, color = ___)) +
geom_qq(distribution = ___, shape = 21) +
facet_wrap(~ ___) +
ylim(c(3, 20))