Einfache logistische Regressionsmodelle erstellen
Der Datensatz donors
enthält 93.462 Beispiele von Personen, die einen Spendenaufruf für gelähmte Militärveteranen verschickt haben. Die Spalte donated
ist 1
, wenn die Person auf das Mailing hin gespendet hat, und 0
, wenn nicht. Dieses binäre Ergebnis wird die abhängige Variable für das logistische Regressionsmodell sein.
Die restlichen Spalten sind Merkmale der potenziellen Spender, die ihr Spendenverhalten beeinflussen können. Dies sind die unabhängigen Variablen des Modells.
Bei der Erstellung eines Regressionsmodells ist es oft hilfreich, eine Hypothese darüber aufzustellen, welche unabhängigen Variablen die abhängige Variable vorhersagen werden. Die Spalte bad_address
, die bei einer ungültigen Postanschrift auf 1
und ansonsten auf 0
gesetzt ist, scheint die Chancen auf eine Spende zu verringern. Ähnlich könnte man vermuten, dass religiöses Interesse (interest_religion
) und Interesse an Veteranenangelegenheiten (interest_veterans
) mit einer höheren Spendenbereitschaft verbunden sind.
In dieser Übung wirst du diese drei Faktoren nutzen, um ein einfaches Modell des Spendenverhaltens zu erstellen. Der Datensatz donors
steht dir zur Verfügung.
Diese Übung ist Teil des Kurses
Überwachtes Lernen in R: Klassifikation
Anleitung zur Übung
Untersuche
donors
mit der Funktionstr()
.Zähle die Anzahl der Vorkommen jeder Ebene der Variable
donated
mit der Funktiontable()
.Passe ein logistisches Regressionsmodell mit Hilfe der Formelschnittstelle mit den drei zuvor beschriebenen unabhängigen Variablen an.
Rufe
glm()
mit der Formel als erstem Argument und dem Datenrahmen alsdata
Argument auf.Speichere das Ergebnis als
donation_model
.
Fasse das Modellobjekt mit
summary()
zusammen.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Examine the dataset to identify potential independent variables
# Explore the dependent variable
# Build the donation model
donation_model <- glm(___,
data = ___, family = "___")
# Summarize the model results