Correlatiecoëfficiënt
Correlatiecoëfficiënten geven een eerste inschatting voor een correlatietoets en kunnen worden gebruikt om te bepalen welk deel van de variantie in variabele x kan worden toegeschreven aan variabele y.
Een bedrijf met een website is geïnteresseerd in de activiteit van hun gebruikers en vermoedt dat de tijd die gebruikers besteden aan zoeken op de site positief correleert met de tijd die ze besteden aan afrekenen op de site. Beoordeel deze aanname van het bedrijf in de gegevensset webdata.
De gegevensset webdata en het pakket ggplot2 zijn voor je geladen.
Deze oefening maakt deel uit van de cursus
A/B-testen in R
Oefeninstructies
- Maak een spreidingsdiagram met
Timeop de x-as enTimeSearchingop de y-as. - Bepaal de correlatiecoëfficiënt van
TimeenTimeSearchingen sla deze op alscoeff. - Leid het aandeel variatie in
Timeaf dat kan worden toegeschreven aanTimeSearching.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a scatter plot
ggplot(___) +
___
# Determine the correlation coefficient
___
# Determine the proportion of variance
___