Aan de slagGa gratis aan de slag

De gevaren van mean-imputatie ruiken

Een van de meest gebruikte imputatiemethoden is mean-imputatie, waarbij missende waarden in een variabele worden vervangen door het gemiddelde van de waargenomen waarden in die variabele. In veel gevallen is deze simpele aanpak echter een slechte keuze. Soms kan een snelle blik op de data je al waarschuwen voor de risico’s van mean-imputatie.

In dit hoofdstuk werk je met een steekproef van de Tropical Atmosphere Ocean (tao)-projectdata. De gegevensset bestaat uit atmosferische metingen die in twee verschillende perioden op vijf verschillende locaties zijn gedaan. De data zit in het VIM-pakket.

In deze oefening maak je kennis met de data en voer je een eenvoudige analyse uit die laat zien wat de gevolgen van mean-imputatie kunnen zijn. Laten we de tao-data bekijken!

Deze oefening maakt deel uit van de cursus

Omgaan met missende data met imputaties in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Print first 10 observations
___(tao, ___)
Code bewerken en uitvoeren