Vérifier les hypothèses de Pearson
Pour qu’une corrélation de Pearson soit adaptée, deux hypothèses doivent être respectées : linéarité et distribution normale.
Une entreprise souhaite calculer une corrélation de Pearson entre le temps passé sur un site web et le montant dépensé pour des achats sur ce site, en évaluant d’abord la corrélation sans tenir compte des groupes. Évaluez si une corrélation de Pearson est appropriée au regard des hypothèses de linéarité et de normalité à respecter.
Le package ggplot2 et le jeu de données SiteSales ont été chargés pour vous.
Cet exercice fait partie du cours
Tests A/B en R
Instructions
- Créez un nuage de points avec
AmountSpentsur l’axe des x etTimeSearchingsur l’axe des y pour évaluer la linéarité de la relation. - Utilisez
shapiro.test()pour déterminer siAmountSpentsuit une distribution normale. - Utilisez
shapiro.test()pour déterminer siTimeSearchingsuit une distribution normale.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Assess the assumption of linearity
ggplot(___) +
___
# Assess the normality of the `AmountSpent` variable
___
# Assess the normality of the `TimeSearching` variable
___