CommencerCommencer gratuitement

Comment l’objet du prêt influence-t-il le montant financé ?

Dans le dernier exercice, nous avons réduit la variable purpose à 4 catégories plus raisonnables et l’avons appelée purpose_recode. En tant que data scientist chez Lending Club, vous pourriez concevoir une expérience pour examiner comment l’objet du prêt influence le montant financé, c’est-à-dire la somme effectivement versée au demandeur.

Rappelez-vous que pour un test ANOVA, l’hypothèse nulle est que toutes les moyennes des montants financés sont égales entre les modalités de purpose_recode. L’hypothèse alternative est qu’au moins une modalité de purpose_recode a une moyenne différente. En revanche, sans analyse post hoc, nous ne saurons pas laquelle. Il est donc utile de comprendre comment les résultats de l’ANOVA sont stockés en tant qu’objet dans R.

Cet exercice fait partie du cours

Plan d’expériences en R

Afficher le cours

Instructions

  • Utilisez lm() pour étudier comment la variable purpose_recode affecte funded_amnt. Enregistrez le modèle dans un objet appelé purpose_recode_model.
  • Utilisez summary() pour examiner purpose_recode_model. Ce sont les résultats de la régression linéaire.
  • Appelez anova() sur purpose_recode_model. Enregistrez le résultat dans un objet appelé purpose_recode_anova. Affichez-le dans la console en le tapant.
  • Enfin, examinez la classe de purpose_recode_anova.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Build a linear regression model, purpose_recode_model
___ <- lm(funded_amnt ~ ___, data = ___)

# Examine results of purpose_recode_model
___(purpose_recode_model)

# Get anova results and save as purpose_recode_anova
___ <- anova(___)

# Print purpose_recode_anova
___

# Examine class of purpose_recode_anova
class(___)
Modifier et exécuter le code