Aan de slagGa gratis aan de slag

Omgaan met ontbrekende waarden

Ontbrekende waarden worden vaak op verschillende manieren gecodeerd. In sommige bestanden betekent -9999 een ontbrekende waarde en in andere kunnen ze gecodeerd zijn als #$##. Met het argument na.strings kun je fread() vertellen welke waarden als ontbrekend moeten worden gezien.

Je gaat het volgende bestand importeren:

id,name,val1,val2
9002019291929192,Robert Whitaker,,44
9200129401349301 ,Elisa Waters,289,##
9200149429834456 , Karla Schmidt,458,29

De ontbrekende waarden zijn gecodeerd als "##". Let op: fread() behandelt een leeg veld ,, standaard als NA.

Deze oefening maakt deel uit van de cursus

Gegevens manipuleren met data.table in R

Cursus bekijken

Oefeninstructies

Importeer het bestand sample.csv zo dat "##" als ontbrekende waarde wordt gezien en als NA wordt ingelezen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import the file using na.strings
missing_values <- ___
missing_values
Code bewerken en uitvoeren