Omgaan met ontbrekende waarden
Ontbrekende waarden worden vaak op verschillende manieren gecodeerd. In sommige bestanden betekent -9999 een ontbrekende waarde en in andere kunnen ze gecodeerd zijn als #$##. Met het argument na.strings kun je fread() vertellen welke waarden als ontbrekend moeten worden gezien.
Je gaat het volgende bestand importeren:
id,name,val1,val2
9002019291929192,Robert Whitaker,,44
9200129401349301 ,Elisa Waters,289,##
9200149429834456 , Karla Schmidt,458,29
De ontbrekende waarden zijn gecodeerd als "##". Let op: fread() behandelt een leeg veld ,, standaard als NA.
Deze oefening maakt deel uit van de cursus
Gegevens manipuleren met data.table in R
Oefeninstructies
Importeer het bestand sample.csv zo dat "##" als ontbrekende waarde wordt gezien en als NA wordt ingelezen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the file using na.strings
missing_values <- ___
missing_values