CommencerCommencer gratuitement

Convertir des chaînes de caractères en facteurs

Même si nous aimerions parfois passer directement à la visualisation et au modeling, il faut en général nettoyer un peu les données avant. Ce chapitre vous guidera pas à pas pour recréer un graphique FiveThirtyEight à partir du jeu de données original, flying_etiquette. Nous allons commencer par restreindre le jeu de données aux répondant·e·s qui nous intéressent et convertir certaines colonnes en facteurs.

Dans le code, vous verrez que nous avons mis des accents graves autour du nom de colonne. C’est nécessaire lorsqu’il y a des espaces dans les noms de colonnes ! En général, nous remplaçons ces espaces par des underscores pour éviter cela, mais ici nous les conservons, car nous allons bientôt les représenter graphiquement.

Cet exercice fait partie du cours

Données catégorielles dans le Tidyverse

Afficher le cours

Instructions

  • Convertissez toutes les colonnes de type caractère en colonnes de type facteur.
  • Excluez les personnes ayant répondu « Never » à la question demandant si elles ont déjà pris l’avion.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

flying_etiquette %>%
    # Change characters to factors
    mutate(across(___(___), as.factor)) %>%
    # Filter out those who have never flown on a plane
    ___(`How often do you travel by plane?` != ___)
Modifier et exécuter le code