Beoordelen van Pearson-aannames
Voor een geschikte Pearson-correlatie moeten de data aan twee aannames voldoen: lineariteit en normaal verdeeld zijn.
Een bedrijf wil een Pearson-correlatie uitvoeren op de tijd die op een website wordt doorgebracht en het bedrag dat wordt uitgegeven aan aankopen op de website, en bekijkt eerst de correlatie zonder naar groepen te kijken. Beoordeel of een Pearson-correlatie geschikt is, gegeven de aannames van lineariteit en normale verdeling die moeten worden gehaald.
Het pakket ggplot2 en de gegevensset SiteSales zijn al voor je geladen.
Deze oefening maakt deel uit van de cursus
A/B-testen in R
Oefeninstructies
- Maak een spreidingsdiagram met
AmountSpentop de x-as enTimeSearchingop de y-as om de lineariteit van de relatie te beoordelen. - Gebruik
shapiro.test()om te bepalen ofAmountSpentnormaal verdeeld is. - Gebruik
shapiro.test()om te bepalen ofTimeSearchingnormaal verdeeld is.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Assess the assumption of linearity
ggplot(___) +
___
# Assess the normality of the `AmountSpent` variable
___
# Assess the normality of the `TimeSearching` variable
___