LoslegenKostenlos starten

Streudiagramm und Punkte

Ein idealer Start, um Daten für eine Regression zu beurteilen, ist ein Streudiagramm.

Ein Unternehmen hat erfasst, wie viel Zeit die Nutzer:innen ihrer Website mit dem Anschauen von Artikeln verbringen (Time) und möchte wissen, wie sich das auf die tägliche Suchzeit auf der Seite auswirkt (TimeSearching). Besonders interessiert sie, wie viel Zeit ein:e Nutzer:in auf der Seite verbringt, wenn er:sie 17 Minuten mit dem Anschauen von Artikeln verbracht hat.

Der Datensatz webdata wurde für dich geladen.

Diese Übung ist Teil des Kurses

<Kurs>A/B-Tests in R</Kurs>
Kurs ansehen

Übungsanweisungen

  • Lade das Paket ggplot2, um Grafiken zu erstellen.
  • Verwende die Formel der Regressionsgeraden, um die täglich auf der Seite verbrachte Zeit zu bestimmen und als yhat zu speichern, wenn ein:e Nutzer:in täglich 17 Minuten im Internet verbringt, gegeben einem y-Achsenabschnitt von 14.97 und einer Steigung von 0.42.
  • Erstelle ein Streudiagramm, das sich zur Beurteilung des Einflusses von Time auf TimeSearching eignet, einschließlich sich schneidender Linien bei 17 (Zeit) und der vorhergesagten täglich auf der Seite verbrachten Zeit.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Call the ggplot package
___

# Derive predicted value
yhat <- ___

# Create the scatter plot
ggplot(___) + 
    ___ + 
    ___ + 
    ___
Code bearbeiten und ausführen