CommencerCommencer gratuitement

Contraintes sur la durée des trajets

Des valeurs hors plage peuvent fausser une analyse, il est donc important de les détecter dès le départ. Dans cet exercice, vous allez examiner de plus près la colonne duration_min. Les vélos ne peuvent pas être utilisés pendant plus de 24 heures, soit 1440 minutes d’affilée, mais des problèmes sur certains vélos ont entraîné un enregistrement incorrect de l’heure de retour.

Dans cet exercice, vous remplacerez les données erronées par la limite de plage (1440 minutes). Vous pourriez tout aussi bien remplacer ces valeurs par des NA.

dplyr, assertive et ggplot2 sont chargés et bike_share_rides est disponible.

Cet exercice fait partie du cours

Nettoyer des données avec R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create breaks
breaks <- c(___, 0, 1440, ___)

# Create a histogram of duration_min
ggplot(___, aes(___)) +
  ___(breaks = ___)
Modifier et exécuter le code