CommencerCommencer gratuitement

Gérer les valeurs manquantes

Les valeurs manquantes sont souvent encodées de différentes manières. Dans certains fichiers, -9999 signifie une valeur manquante et, dans d’autres, elles peuvent être encodées sous la forme #$##. Vous pouvez utiliser l’argument na.strings pour indiquer à fread() quelles valeurs doivent être traitées comme manquantes.

Vous allez importer le fichier suivant :

id,name,val1,val2
9002019291929192,Robert Whitaker,,44
9200129401349301 ,Elisa Waters,289,##
9200149429834456 , Karla Schmidt,458,29

Les valeurs manquantes sont encodées sous la forme "##". Notez que fread() gère par défaut un champ vide ,, comme NA.

Cet exercice fait partie du cours

Manipulation de données avec data.table en R

Afficher le cours

Instructions

Importez correctement le fichier sample.csv afin que "##" soit traité comme une valeur manquante et importé en tant que NA.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import the file using na.strings
missing_values <- ___
missing_values
Modifier et exécuter le code