LoslegenKostenlos loslegen

Imputation mit linearer Regression

Manchmal kannst du mit Fachwissen, früheren Studien oder einfach gesundem Menschenverstand die Beziehungen zwischen den Variablen in deinen Daten beschreiben. In solchen Fällen ist modellbasierte Imputation eine gute Lösung: Sie erlaubt dir, jede Variable anhand eines statistischen Modells zu imputieren, das du selbst festlegen kannst – inklusive der Annahmen darüber, wie sich die Variablen gegenseitig beeinflussen.

Für stetige Variablen ist lineare Regression eine beliebte Wahl. Sie beschränkt dich aber nicht auf lineare Zusammenhänge! Du kannst in den Prädiktoren jederzeit ein Quadrat oder den Logarithmus einer Variablen aufnehmen. In dieser Übung arbeitest du mit dem Paket simputation, führst eine einzelne Imputation per linearer Regression auf den tao-Daten durch und analysierst die Ergebnisse. Probieren wir’s aus!

Diese Übung ist Teil des Kurses

Fehlende Daten mit Imputationen in R behandeln

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Load the simputation package
___

# Impute air_temp and humidity with linear regression
formula <- ____
tao_imp <- ___(tao, formula)
Code bearbeiten und ausführen