Convertir des chaînes de caractères en facteurs
Même si nous aimerions parfois passer directement à la visualisation et au modeling, il faut en général nettoyer un peu les données avant. Ce chapitre vous guidera pas à pas pour recréer un graphique FiveThirtyEight à partir du jeu de données original, flying_etiquette. Nous allons commencer par restreindre le jeu de données aux répondant·e·s qui nous intéressent et convertir certaines colonnes en facteurs.
Dans le code, vous verrez que nous avons mis des accents graves autour du nom de colonne. C’est nécessaire lorsqu’il y a des espaces dans les noms de colonnes ! En général, nous remplaçons ces espaces par des underscores pour éviter cela, mais ici nous les conservons, car nous allons bientôt les représenter graphiquement.
Cet exercice fait partie du cours
Données catégorielles dans le Tidyverse
Instructions
- Convertissez toutes les colonnes de type caractère en colonnes de type facteur.
- Excluez les personnes ayant répondu « Never » à la question demandant si elles ont déjà pris l’avion.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
flying_etiquette %>%
# Change characters to factors
mutate(across(___(___), as.factor)) %>%
# Filter out those who have never flown on a plane
___(`How often do you travel by plane?` != ___)