Hoe beïnvloedt het leendoel het toegekende bedrag?
In de vorige oefening hebben we de variabele purpose teruggebracht tot 4 overzichtelijke categorieën en deze purpose_recode genoemd. Als data scientist bij Lending Club wil je misschien een experiment opzetten om te onderzoeken hoe het leendoel het toegekende bedrag beïnvloedt, oftewel het bedrag dat daadwerkelijk aan de aanvrager is uitgekeerd.
Onthoud dat bij een ANOVA-toets de nulhypothese is dat alle gemiddelde toegekende bedragen gelijk zijn over de niveaus van purpose_recode. De alternatieve hypothese is dat minstens één niveau van purpose_recode een ander gemiddelde heeft. Zonder post-hocanalyse weten we echter niet welke. Het is daarom handig om te weten hoe ANOVA-resultaten als object in R worden opgeslagen.
Deze oefening maakt deel uit van de cursus
Experimenteel ontwerp in R
Oefeninstructies
- Gebruik
lm()om te bekijken hoe de variabelepurpose_recodefunded_amntbeïnvloedt. Sla het model op als een object met de naampurpose_recode_model. - Gebruik
summary()ompurpose_recode_modelte onderzoeken. Dit zijn de resultaten van de lineaire regressie. - Roep
anova()aan oppurpose_recode_model. Sla dit op als een object met de naampurpose_recode_anova. Print het naar de console door het te typen. - Bekijk tot slot de class van
purpose_recode_anova.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Build a linear regression model, purpose_recode_model
___ <- lm(funded_amnt ~ ___, data = ___)
# Examine results of purpose_recode_model
___(purpose_recode_model)
# Get anova results and save as purpose_recode_anova
___ <- anova(___)
# Print purpose_recode_anova
___
# Examine class of purpose_recode_anova
class(___)