LoslegenKostenlos loslegen

Einfache logistische Regressionsmodelle erstellen

Der Datensatz donors enthält 93.462 Beispiele von Personen, die einen Spendenaufruf für gelähmte Militärveteranen verschickt haben. Die Spalte donated ist 1, wenn die Person auf das Mailing hin gespendet hat, und 0, wenn nicht. Dieses binäre Ergebnis wird die abhängige Variable für das logistische Regressionsmodell sein.

Die restlichen Spalten sind Merkmale der potenziellen Spender, die ihr Spendenverhalten beeinflussen können. Dies sind die unabhängigen Variablen des Modells.

Bei der Erstellung eines Regressionsmodells ist es oft hilfreich, eine Hypothese darüber aufzustellen, welche unabhängigen Variablen die abhängige Variable vorhersagen werden. Die Spalte bad_address, die bei einer ungültigen Postanschrift auf 1 und ansonsten auf 0 gesetzt ist, scheint die Chancen auf eine Spende zu verringern. Ähnlich könnte man vermuten, dass religiöses Interesse (interest_religion) und Interesse an Veteranenangelegenheiten (interest_veterans) mit einer höheren Spendenbereitschaft verbunden sind.

In dieser Übung wirst du diese drei Faktoren nutzen, um ein einfaches Modell des Spendenverhaltens zu erstellen. Der Datensatz donors steht dir zur Verfügung.

Diese Übung ist Teil des Kurses

Überwachtes Lernen in R: Klassifikation

Kurs anzeigen

Anleitung zur Übung

  • Untersuche donors mit der Funktion str().

  • Zähle die Anzahl der Vorkommen jeder Ebene der Variable donated mit der Funktion table().

  • Passe ein logistisches Regressionsmodell mit Hilfe der Formelschnittstelle mit den drei zuvor beschriebenen unabhängigen Variablen an.

    • Rufe glm() mit der Formel als erstem Argument und dem Datenrahmen als data Argument auf.

    • Speichere das Ergebnis als donation_model.

  • Fasse das Modellobjekt mit summary() zusammen.

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Examine the dataset to identify potential independent variables


# Explore the dependent variable


# Build the donation model
donation_model <- glm(___, 
                      data = ___, family = "___")

# Summarize the model results
Code bearbeiten und ausführen