Inférence sur les coefficients
En utilisant le jeu de données des restaurants italiens de NYC (compilé par Simon Sheather dans A Modern Approach to Regression with R), restNYC, vous allez étudier l’effet sur la significativité des coefficients lorsqu’il y a plusieurs variables dans le modèle. Rappelez-vous : la p-valeur associée à un coefficient est la probabilité des données observées en supposant que la variable en question est indépendante de la réponse ET que toutes les autres variables sont incluses dans le modèle.
Les informations suivantes concernent le jeu de données restNYC, déjà chargé dans votre espace de travail :
- chaque ligne correspond à une enquête client réalisée dans des restaurants italiens de NYC
- Price = prix (en $US) d’un dîner (pourboire et une boisson inclus)
- Service = évaluation du service (de 1 à 30)
- Food = évaluation de la cuisine (de 1 à 30)
- Decor = évaluation du décor (de 1 à 30)
Cet exercice fait partie du cours
Inférence pour la régression linéaire en R
Instructions
- Exécutez un
lmpuistidyen régressantPricesurService. - Exécutez un
lmpuistidyen régressantPricesurService,FoodetDecor. - Qu’est-il arrivé à la significativité de
Servicelorsque des variables supplémentaires ont été ajoutées au modèle ?
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Output the first model
# Output the second model