Wie beeinflusst der Darlehenszweck den ausbezahlten Betrag?
In der letzten Übung haben wir die Variable purpose auf vier sinnvollere Kategorien reduziert und purpose_recode genannt. Als Data Scientist bei Lending Club könnten wir ein Experiment entwerfen, um zu untersuchen, wie der Darlehenszweck den ausbezahlten Betrag beeinflusst – also das Geld, das tatsächlich an die Antragstellerin oder den Antragsteller ausgezahlt wird.
Denk daran: Für einen ANOVA‑Test ist die Nullhypothese, dass alle durchschnittlichen Auszahlungsbeträge über die Stufen von purpose_recode hinweg gleich sind. Die Alternativhypothese besagt, dass mindestens eine Stufe von purpose_recode einen anderen Mittelwert hat. Ohne Post-hoc-Analyse wissen wir jedoch nicht, welche. Daher ist es hilfreich zu verstehen, wie ANOVA-Ergebnisse in R als Objekt gespeichert werden.
Diese Übung ist Teil des Kurses
Versuchsplanung in R
Anleitung zur Übung
- Verwende
lm(), um zu untersuchen, wiepurpose_recodefunded_amntbeeinflusst. Speichere das Modell in einem Objekt namenspurpose_recode_model. - Verwende
summary(), umpurpose_recode_modelzu untersuchen. Das sind die Ergebnisse der linearen Regression. - Rufe
anova()aufpurpose_recode_modelauf. Speichere das Ergebnis in einem Objekt namenspurpose_recode_anova. Gib es aus, indem du es eintippst. - Untersuche abschließend die Klasse von
purpose_recode_anova.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Build a linear regression model, purpose_recode_model
___ <- lm(funded_amnt ~ ___, data = ___)
# Examine results of purpose_recode_model
___(purpose_recode_model)
# Get anova results and save as purpose_recode_anova
___ <- anova(___)
# Print purpose_recode_anova
___
# Examine class of purpose_recode_anova
class(___)