Streudiagramm und Punkte
Ein idealer Start, um Daten für eine Regression zu beurteilen, ist ein Streudiagramm.
Ein Unternehmen hat erfasst, wie viel Zeit die Nutzer:innen ihrer Website mit dem Anschauen von Artikeln verbringen (Time) und möchte wissen, wie sich das auf die tägliche Suchzeit auf der Seite auswirkt (TimeSearching). Besonders interessiert sie, wie viel Zeit ein:e Nutzer:in auf der Seite verbringt, wenn er:sie 17 Minuten mit dem Anschauen von Artikeln verbracht hat.
Der Datensatz webdata wurde für dich geladen.
Diese Übung ist Teil des Kurses
A/B-Tests in R
Anleitung zur Übung
- Lade das Paket
ggplot2, um Grafiken zu erstellen. - Verwende die Formel der Regressionsgeraden, um die täglich auf der Seite verbrachte Zeit zu bestimmen und als
yhatzu speichern, wenn ein:e Nutzer:in täglich 17 Minuten im Internet verbringt, gegeben einem y-Achsenabschnitt von14.97und einer Steigung von0.42. - Erstelle ein Streudiagramm, das sich zur Beurteilung des Einflusses von
TimeaufTimeSearchingeignet, einschließlich sich schneidender Linien bei 17 (Zeit) und der vorhergesagten täglich auf der Seite verbrachten Zeit.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Call the ggplot package
___
# Derive predicted value
yhat <- ___
# Create the scatter plot
ggplot(___) +
___ +
___ +
___