Korrelation und Visualisierung
Du sollst herausfinden, ob die tägliche Zeit, die Personen mit der Suche auf der gegebenen Website verbringen (TimeSearching), mit der täglichen Internetnutzungszeit (Time) zusammenhängt, ohne Gruppen zu berücksichtigen. Prüfe die Annahmen von Linearität und Normalverteilung, um die passende Korrelation und die Power-Analyse für den gegebenen Datensatz durchzuführen.
Der Datensatz webdata sowie die benötigten Pakete pwr und ggplot2 wurden bereits geladen.
Diese Übung ist Teil des Kurses
A/B-Tests in R
Anleitung zur Übung
- Erstelle ein Streudiagramm der Variablen, mit
TimeSearchingauf der x-Achse undTimeauf der y-Achse. - Prüfe die Normalitätsannahme von
TimeSearchingundTime. - Führe die passende Korrelation mit
TimeSearchingalsxundTimealsyaus dem Datensatzwebdataaus, speichere sie inRcor, um zu prüfen, ob die Nullhypothese verworfen werden kann. - Führe eine Power-Analyse der Korrelation durch und nutze dabei verfügbare Werte aus
Rcor, um festzustellen, ob der Korrelations-Test zuverlässig ist; die Stichprobengröße des Datensatzes beträgt100
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a scatter plot relevant to the analyses
ggplot(___, aes(x = ___, y = ___)) +
___
# Assess the normality assumption
___
___
# Run the appropriate correlation
Rcor <- cor.test(___)
# Run a power analysis on the correlation
pwr.r.test(___)