Gérer les valeurs manquantes
Les valeurs manquantes sont souvent encodées de différentes manières. Dans certains fichiers, -9999 signifie une valeur manquante et, dans d’autres, elles peuvent être encodées sous la forme #$##. Vous pouvez utiliser l’argument na.strings pour indiquer à fread() quelles valeurs doivent être traitées comme manquantes.
Vous allez importer le fichier suivant :
id,name,val1,val2
9002019291929192,Robert Whitaker,,44
9200129401349301 ,Elisa Waters,289,##
9200149429834456 , Karla Schmidt,458,29
Les valeurs manquantes sont encodées sous la forme "##". Notez que fread() gère par défaut un champ vide ,, comme NA.
Cet exercice fait partie du cours
Manipulation de données avec data.table en R
Instructions
Importez correctement le fichier sample.csv afin que "##" soit traité comme une valeur manquante et importé en tant que NA.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import the file using na.strings
missing_values <- ___
missing_values