Influence

L'influence mesure dans quelle mesure un modèle changerait si chaque observation était exclue des calculs du modèle, une à la fois. En d'autres termes, elle mesure la différence entre la ligne de prédiction obtenue en effectuant une régression linéaire sur tous les points de données à l'exception de ce point, et celle obtenue en effectuant une régression linéaire sur l'ensemble des données.

L’indicateur standard de l'influence est la distance de Cook, qui calcule l'influence en fonction de la taille du résidu et du levier du point.

Vous pouvez observer ici le même modèle que précédemment : le prix des logements par rapport à la racine carrée de la distance par rapport à la station de métro la plus proche dans l'ensemble de données immobilières de Taïwan.

Veuillez estimer quelles observations auront, selon vous, une forte influence, puis déplacez le curseur pour découvrir la réponse.

Quelle affirmation est vraie ?

Cet exercice fait partie du cours

Introduction à la régression dans R

Afficher le cours

Exercice interactif pratique

Passez de la théorie à la pratique avec l’un de nos exercices interactifs

Commencer l’exercice

Cet exercice fait partie du cours

Introduction à la régression dans R

IntermédiaireNiveau de compétence

4.8+

Commencer le cours gratuitement

Vous apprendrez les principes fondamentaux de ce modèle statistique populaire, ce qu'est la régression et en quoi les régressions linéaires et logistiques diffèrent. Vous apprendrez ensuite à ajuster des modèles de régression linéaire simples avec des variables explicatives numériques et catégorielles, et à décrire la relation entre les variables de réponse et les variables explicatives à l'aide des coefficients du modèle.

Exercise 1: Une histoire de deux variables Exercise 2: Laquelle est la variable de réponse ?Exercise 3: Visualisation de deux variables Exercise 4: Ajustement d'une régression linéaire Exercise 5: Estimer l'ordonnée à l'origine Exercise 6: Estimer la pente Exercise 7: Régression linéaire avec lm()Exercise 8: Variables explicatives catégorielles Exercise 9: Visualisation numérique par rapport à catégorielle Exercise 10: Calcul des moyennes par catégorie Exercise 11: lm() avec une variable explicative catégorielle

Dans ce chapitre, vous découvrirez comment utiliser des modèles de régression linéaire pour établir des prévisions sur les prix de l'immobilier à Taïwan et les clics sur les publicités Facebook. Vous développerez également vos compétences en régression en vous familiarisant avec les objets modèles, en comprenant le concept de « régression vers la moyenne » et en apprenant à transformer les variables d'un ensemble de données.

Exercise 1: Faire des prévisions Exercise 2: Prévision des prix de l'immobilier Exercise 3: Visualisation des prévisions Exercise 4: Les limites de la prédiction Exercise 5: Utilisation des objets modèles Exercise 6: Extraction des éléments du modèle Exercise 7: Prévision manuelle des prix immobiliers Exercise 8: Utilisation du balai Exercise 9: Régression vers la moyenne Exercise 10: Home run !Exercise 11: Traçage de rendements consécutifs d'un portefeuille Exercise 12: Modélisation des rendements consécutifs Exercise 13: Transformer des variables Exercise 14: Transformation de la variable explicative Exercise 15: Transformer également la variable de réponse

Dans ce chapitre, vous apprendrez à poser des questions à votre modèle afin d'évaluer son adéquation. Vous apprendrez à quantifier l'ajustement d'un modèle de régression linéaire, à diagnostiquer les problèmes du modèle à l'aide de visualisations et à comprendre le levier et l'influence de chaque observation utilisée pour créer le modèle.

Exercise 1: Quantification de l'ajustement du modèle Exercise 2: Coefficient de détermination Exercise 3: Erreur type résiduelle Exercise 4: Visualisation de l'ajustement du modèle Exercise 5: Résidus par rapport aux valeurs ajustées Exercise 6: Graphique Q-Q des résidus Exercise 7: Échelle-position Exercise 8: Tracer des graphiques diagnostiques Exercise 9: Valeurs aberrantes, levier et influence Exercise 10: Levier Exercise 11: Influence

Exercice en cours

Exercise 12: Extraction du levier et de l’influence

Apprenez à ajuster des modèles de régression logistique. À l'aide de données réelles, vous évaluerez la probabilité qu'un client clôture son compte bancaire sous forme de probabilités de réussite et de rapports de cotes, et vous quantifierez les performances du modèle à l'aide de matrices de confusion.

Exercise 1: Pourquoi la régression logistique est-elle nécessaire ?Exercise 2: Analyse des variables explicatives Exercise 3: Visualisation des modèles linéaires et logistiques Exercise 4: Régression logistique avec glm()Exercise 5: Prévisions et rapports de cotes Exercise 6: Probabilités Exercise 7: Résultat le plus probable Exercise 8: Rapport de cotes Exercise 9: Rapport de cotes logarithmique Exercise 10: Quantification de l'ajustement de la régression logistique Exercise 11: Calcul de la matrice de confusion Exercise 12: Mesurer la performance du modèle logistique Exercise 13: Précision, sensibilité, spécificité Exercise 14: Félicitations