CommencerCommencer gratuitement

Vérifier les hypothèses de Pearson

Pour qu’une corrélation de Pearson soit adaptée, deux hypothèses doivent être respectées : linéarité et distribution normale.

Une entreprise souhaite calculer une corrélation de Pearson entre le temps passé sur un site web et le montant dépensé pour des achats sur ce site, en évaluant d’abord la corrélation sans tenir compte des groupes. Évaluez si une corrélation de Pearson est appropriée au regard des hypothèses de linéarité et de normalité à respecter.

Le package ggplot2 et le jeu de données SiteSales ont été chargés pour vous.

Cet exercice fait partie du cours

Tests A/B en R

Afficher le cours

Instructions

  • Créez un nuage de points avec AmountSpent sur l’axe des x et TimeSearching sur l’axe des y pour évaluer la linéarité de la relation.
  • Utilisez shapiro.test() pour déterminer si AmountSpent suit une distribution normale.
  • Utilisez shapiro.test() pour déterminer si TimeSearching suit une distribution normale.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Assess the assumption of linearity
ggplot(___) +
  ___

# Assess the normality of the `AmountSpent` variable
___

# Assess the normality of the `TimeSearching` variable
___
Modifier et exécuter le code