Corrélation et visualisation
On vous demande d’identifier si le temps que les personnes passent chaque jour à faire des recherches sur le site, TimeSearching, correspond au temps qu’elles passent chaque jour sur Internet, Time, en ignorant les groupes. Évaluez les hypothèses de linéarité et de normalité pour déterminer et exécuter la corrélation appropriée, ainsi que l’analyse de puissance, pour le jeu de données fourni.
Le jeu de données webdata et les packages nécessaires pwr et ggplot2 ont été chargés pour vous.
Cet exercice fait partie du cours
Tests A/B en R
Instructions
- Créez un nuage de points des variables, en plaçant
TimeSearchingsur l’axexetTimesur l’axey. - Évaluez l’hypothèse de normalité de
TimeSearchingetTime. - Exécutez la corrélation appropriée en utilisant
TimeSearchingcommexetTimecommeydu jeu de donnéeswebdata, stockez le résultat dansRcor, afin de déterminer si l’hypothèse nulle peut être rejetée. - Réalisez une analyse de puissance sur la corrélation, en appelant les valeurs disponibles depuis
Rcor, pour déterminer si le test de corrélation est fiable ; la taille d’échantillon du jeu de données est100
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a scatter plot relevant to the analyses
ggplot(___, aes(x = ___, y = ___)) +
___
# Assess the normality assumption
___
___
# Run the appropriate correlation
Rcor <- cor.test(___)
# Run a power analysis on the correlation
pwr.r.test(___)