Imputation mit linearer Regression
Manchmal kannst du mit Fachwissen, früheren Studien oder einfach gesundem Menschenverstand die Beziehungen zwischen den Variablen in deinen Daten beschreiben. In solchen Fällen ist modellbasierte Imputation eine gute Lösung: Sie erlaubt dir, jede Variable anhand eines statistischen Modells zu imputieren, das du selbst festlegen kannst – inklusive der Annahmen darüber, wie sich die Variablen gegenseitig beeinflussen.
Für stetige Variablen ist lineare Regression eine beliebte Wahl. Sie beschränkt dich aber nicht auf lineare Zusammenhänge! Du kannst in den Prädiktoren jederzeit ein Quadrat oder den Logarithmus einer Variablen aufnehmen. In dieser Übung arbeitest du mit dem Paket simputation, führst eine einzelne Imputation per linearer Regression auf den tao-Daten durch und analysierst die Ergebnisse. Probieren wir’s aus!
Diese Übung ist Teil des Kurses
<Kurs>Fehlende Daten mit Imputationen in R behandeln</Kurs>Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Load the simputation package
___
# Impute air_temp and humidity with linear regression
formula <- ____
tao_imp <- ___(tao, formula)