Correlatie en plotten
Je bent gevraagd te bepalen of de tijd die mensen dagelijks besteden aan het zoeken op de gegeven site, TimeSearching, overeenkomt met de tijd die ze dagelijks op internet doorbrengen, Time, waarbij je de groepen negeert. Beoordeel de aannames van lineariteit en normaliteit om te bepalen en de juiste correlatie en de poweranalyse uit te voeren voor de gegevensset die je hebt gekregen.
De webdata-gegevensset en de benodigde pakketten pwr en ggplot2 zijn voor je geladen.
Deze oefening maakt deel uit van de cursus
A/B-testen in R
Oefeninstructies
- Maak een spreidingsdiagram van de variabelen, met
TimeSearchingop dex-as enTimeop dey-as. - Beoordeel de normaliteitsaannames van
TimeSearchingenTime. - Voer de juiste correlatie uit met
TimeSearchingalsxenTimealsyuit dewebdata-gegevensset, sla op inRcor, om te bepalen of de nulhypothese kan worden verworpen. - Voer een poweranalyse uit op de correlatie, waarbij je beschikbare waarden uit
Rcorgebruikt om te bepalen of de correlatietest betrouwbaar is; de steekproefgrootte van de gegevensset is100
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a scatter plot relevant to the analyses
ggplot(___, aes(x = ___, y = ___)) +
___
# Assess the normality assumption
___
___
# Run the appropriate correlation
Rcor <- cor.test(___)
# Run a power analysis on the correlation
pwr.r.test(___)