col_types
Vous pouvez aussi préciser les types des colonnes du data frame importé avec col_types. S’il est défini à NULL (valeur par défaut), les fonctions du package readr essaient de détecter automatiquement les bons types. Vous pouvez définir manuellement les types avec une chaîne de caractères, où chaque lettre indique la classe de la colonne : c pour character, d pour double, i pour integer et l pour logical. _ permet d’ignorer entièrement la colonne.
potatoes.txt (view), un fichier plat avec des enregistrements séparés par des tabulations et sans noms de colonnes, est de nouveau disponible dans votre espace de travail.
Cet exercice fait partie du cours
Introduction à l’importation de données dans R
Instructions
- Dans le deuxième appel à
read_tsv(), modifiez l’argumentcol_typespour importer toutes les colonnes en tant que caractères (c). Stockez le data frame obtenu danspotatoes_char. - Affichez la structure de
potatoes_charet vérifiez que tous les types de colonnes sontchr, l’abréviation decharacter.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Column names
properties <- c("area", "temp", "size", "storage", "method",
"texture", "flavor", "moistness")
# Import all data, but force all columns to be character: potatoes_char
potatoes_char <- read_tsv("potatoes.txt", col_types = "iiiiiddd", col_names = properties)
# Print out structure of potatoes_char
___