CommencerCommencer gratuitement

Inférence sur les coefficients

En utilisant le jeu de données des restaurants italiens de NYC (compilé par Simon Sheather dans A Modern Approach to Regression with R), restNYC, vous allez étudier l’effet sur la significativité des coefficients lorsqu’il y a plusieurs variables dans le modèle. Rappelez-vous : la p-valeur associée à un coefficient est la probabilité des données observées en supposant que la variable en question est indépendante de la réponse ET que toutes les autres variables sont incluses dans le modèle.

Les informations suivantes concernent le jeu de données restNYC, déjà chargé dans votre espace de travail :

  • chaque ligne correspond à une enquête client réalisée dans des restaurants italiens de NYC
  • Price = prix (en $US) d’un dîner (pourboire et une boisson inclus)
  • Service = évaluation du service (de 1 à 30)
  • Food = évaluation de la cuisine (de 1 à 30)
  • Decor = évaluation du décor (de 1 à 30)

Cet exercice fait partie du cours

Inférence pour la régression linéaire en R

Afficher le cours

Instructions

  • Exécutez un lm puis tidy en régressant Price sur Service.
  • Exécutez un lm puis tidy en régressant Price sur Service, Food et Decor.
  • Qu’est-il arrivé à la significativité de Service lorsque des variables supplémentaires ont été ajoutées au modèle ?

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Output the first model


# Output the second model
Modifier et exécuter le code