Distribution du montant des courses en taxi
Voyons combien coûtent les trajets en taxi à New York et affichons un histogramme du montant total de la course. Comme cette variable est probablement très asymétrique, nous allons représenter l’axe des x en échelle logarithmique.
Le jeu de données tx est déjà chargé pour vous.
Cet exercice fait partie du cours
Visualiser des Big Data avec Trelliscope en R
Instructions
- Représentez la distribution du montant total de la course,
total_amount, avecgeom_histogram(). - À la dernière ligne, appliquez une échelle logarithmique base 10 à l’axe des x avec
scale_x_log10(). Notez qu’un message d’avertissement indiquera que 62 points ont un montant total de 0 $: ces points sont ignorés, car le logarithme n’est pas défini.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
library(ggplot2)
# Create a histogram of total_amount
ggplot(___, aes(___)) +
___ +
___