Spécifier les classes de colonnes
L’argument colClasses de fread() vous permet d’indiquer explicitement la classe des colonnes. Vous pouvez préciser les classes sous forme de vecteur de caractères (comme dans les fonctions de base R telles que read.csv()):
colClasses = c("integer", rep("factor", 3), "character")
Cependant, ce format vous oblige à définir la classe de toutes les colonnes. Cela peut poser problème si le fichier contient de nombreuses colonnes et que vous souhaitez n’indiquer explicitement le type que pour certaines d’entre elles, en laissant les autres par défaut. Pour cela, vous pouvez utiliser un format en liste, plus pratique :
colClasses = list(factor = 2:4)
Ici, les colonnes deux à quatre sont importées comme facteurs et les autres utilisent les valeurs par défaut de fread().
Cet exercice fait partie du cours
Manipulation de données avec data.table en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import using read.csv with defaults
base_r_defaults <- ___("sample.csv")
___(base_r_defaults)