Comprobar los supuestos de Pearson
Para que una correlación de Pearson sea adecuada, los datos deben cumplir dos supuestos: linealidad y distribución normal.
A una empresa le interesa calcular una correlación de Pearson entre el tiempo dedicado a navegar por una web y el dinero gastado en compras en esa misma web, evaluando primero la correlación sin tener en cuenta los grupos. Evalúa si una correlación de Pearson es apropiada dado que deben cumplirse los supuestos de linealidad y distribución normal.
El paquete ggplot2 y el conjunto de datos SiteSales ya se han cargado por ti.
Este ejercicio forma parte del curso
A/B Testing en R
Instrucciones del ejercicio
- Crea un diagrama de dispersión con
AmountSpenten el eje x yTimeSearchingen el eje y para evaluar la linealidad de la relación. - Usa
shapiro.test()para determinar siAmountSpentsigue una distribución normal. - Usa
shapiro.test()para determinar siTimeSearchingsigue una distribución normal.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Assess the assumption of linearity
ggplot(___) +
___
# Assess the normality of the `AmountSpent` variable
___
# Assess the normality of the `TimeSearching` variable
___