Comment l’objet du prêt influence-t-il le montant financé ?
Dans le dernier exercice, nous avons réduit la variable purpose à 4 catégories plus raisonnables et l’avons appelée purpose_recode. En tant que data scientist chez Lending Club, vous pourriez concevoir une expérience pour examiner comment l’objet du prêt influence le montant financé, c’est-à-dire la somme effectivement versée au demandeur.
Rappelez-vous que pour un test ANOVA, l’hypothèse nulle est que toutes les moyennes des montants financés sont égales entre les modalités de purpose_recode. L’hypothèse alternative est qu’au moins une modalité de purpose_recode a une moyenne différente. En revanche, sans analyse post hoc, nous ne saurons pas laquelle. Il est donc utile de comprendre comment les résultats de l’ANOVA sont stockés en tant qu’objet dans R.
Cet exercice fait partie du cours
Plan d’expériences en R
Instructions
- Utilisez
lm()pour étudier comment la variablepurpose_recodeaffectefunded_amnt. Enregistrez le modèle dans un objet appelépurpose_recode_model. - Utilisez
summary()pour examinerpurpose_recode_model. Ce sont les résultats de la régression linéaire. - Appelez
anova()surpurpose_recode_model. Enregistrez le résultat dans un objet appelépurpose_recode_anova. Affichez-le dans la console en le tapant. - Enfin, examinez la classe de
purpose_recode_anova.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Build a linear regression model, purpose_recode_model
___ <- lm(funded_amnt ~ ___, data = ___)
# Examine results of purpose_recode_model
___(purpose_recode_model)
# Get anova results and save as purpose_recode_anova
___ <- anova(___)
# Print purpose_recode_anova
___
# Examine class of purpose_recode_anova
class(___)