Confrontare la distribuzione della tariffa per tipo di pagamento
Abbiamo visto che non ci sono mance per i pagamenti in contanti. Significa che chi paga in contanti non lascia la mancia, oppure che le mance non vengono registrate quando si paga in contanti? Per percorsi simili, ci aspetteremmo che le distribuzioni della tariffa totale siano identiche indipendentemente dal tipo di pagamento. In questo esercizio, creeremo un grafico dei quantili per confrontare la distribuzione della tariffa totale in base al tipo di pagamento e lo confronteremo con il grafico originale in un'altra faccetta.
Per te è stato creato un insieme di dati amount_compare che contiene le variabili payment_type, amount e amount_type. amount_type distingue tra valori che rappresentano un pagamento totale e un pagamento senza mancia.
Questo esercizio fa parte del corso
Visualizzare Big Data con Trelliscope in R
Istruzioni dell'esercizio
- Ispeziona l'insieme di dati
amount_compareprima di completare l'esercizio stampandolo in console per capirne la struttura e agevolare la specifica del grafico. - Usa
geom_qq()per creare un grafico dei quantili dell’importo totale della tariffa,amount. Assicurati di specificaredistribution = stats::qunif. - Assicurati che vengano creati grafici dei quantili separati per ciascun tipo di pagamento impostando
colorsul tipo di pagamento, in modo che ogni distribuzione sia sovrapposta nello stesso grafico. - Mostra i confronti tra distribuzioni per ciascun
amount_typeusando il faceting.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
library(ggplot2)
library(dplyr)
library(tidyr)
# Get data ready to plot
amount_compare <- tx_pop %>%
mutate(total_no_tip = total_amount - tip_amount) %>%
select(total_amount, total_no_tip, payment_type) %>%
pivot_longer(!payment_type, names_to = "amount_type", values_to = "amount")
# Quantile plot
ggplot(___, aes(sample = ___, color = ___)) +
geom_qq(distribution = ___, shape = 21) +
facet_wrap(~ ___) +
ylim(c(3, 20))