IniziaInizia gratis

Confrontare la distribuzione della tariffa per tipo di pagamento

Abbiamo visto che non ci sono mance per i pagamenti in contanti. Significa che chi paga in contanti non lascia la mancia, oppure che le mance non vengono registrate quando si paga in contanti? Per percorsi simili, ci aspetteremmo che le distribuzioni della tariffa totale siano identiche indipendentemente dal tipo di pagamento. In questo esercizio, creeremo un grafico dei quantili per confrontare la distribuzione della tariffa totale in base al tipo di pagamento e lo confronteremo con il grafico originale in un'altra faccetta.

Per te è stato creato un insieme di dati amount_compare che contiene le variabili payment_type, amount e amount_type. amount_type distingue tra valori che rappresentano un pagamento totale e un pagamento senza mancia.

Questo esercizio fa parte del corso

Visualizzare Big Data con Trelliscope in R

Visualizza il corso

Istruzioni dell'esercizio

  • Ispeziona l'insieme di dati amount_compare prima di completare l'esercizio stampandolo in console per capirne la struttura e agevolare la specifica del grafico.
  • Usa geom_qq() per creare un grafico dei quantili dell’importo totale della tariffa, amount. Assicurati di specificare distribution = stats::qunif.
  • Assicurati che vengano creati grafici dei quantili separati per ciascun tipo di pagamento impostando color sul tipo di pagamento, in modo che ogni distribuzione sia sovrapposta nello stesso grafico.
  • Mostra i confronti tra distribuzioni per ciascun amount_type usando il faceting.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

library(ggplot2)
library(dplyr)
library(tidyr)

# Get data ready to plot
amount_compare <- tx_pop %>%
  mutate(total_no_tip = total_amount - tip_amount) %>%
  select(total_amount, total_no_tip, payment_type) %>%
  pivot_longer(!payment_type, names_to = "amount_type", values_to = "amount")

# Quantile plot
ggplot(___, aes(sample = ___, color = ___)) +
  geom_qq(distribution = ___, shape = 21) +
  facet_wrap(~ ___) +
  ylim(c(3, 20))
Modifica ed esegui il codice