Aan de slagGa gratis aan de slag

Beoordelen van Pearson-aannames

Voor een geschikte Pearson-correlatie moeten de data aan twee aannames voldoen: lineariteit en normaal verdeeld zijn.

Een bedrijf wil een Pearson-correlatie uitvoeren op de tijd die op een website wordt doorgebracht en het bedrag dat wordt uitgegeven aan aankopen op de website, en bekijkt eerst de correlatie zonder naar groepen te kijken. Beoordeel of een Pearson-correlatie geschikt is, gegeven de aannames van lineariteit en normale verdeling die moeten worden gehaald.

Het pakket ggplot2 en de gegevensset SiteSales zijn al voor je geladen.

Deze oefening maakt deel uit van de cursus

A/B-testen in R

Cursus bekijken

Oefeninstructies

  • Maak een spreidingsdiagram met AmountSpent op de x-as en TimeSearching op de y-as om de lineariteit van de relatie te beoordelen.
  • Gebruik shapiro.test() om te bepalen of AmountSpent normaal verdeeld is.
  • Gebruik shapiro.test() om te bepalen of TimeSearching normaal verdeeld is.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Assess the assumption of linearity
ggplot(___) +
  ___

# Assess the normality of the `AmountSpent` variable
___

# Assess the normality of the `TimeSearching` variable
___
Code bewerken en uitvoeren