Aan de slagGa gratis aan de slag

Spreidingsdiagram en punten

Een goede manier om te beginnen met het beoordelen van gegevens voor een regressie is het maken van een spreidingsdiagram.

Een bedrijf heeft de tijd verzameld die gebruikers van hun website besteden aan het bekijken van artikelen, Time, en wil weten hoe dit de tijd beïnvloedt die hun gebruikers dagelijks op de site zoeken, TimeSearching, met in het bijzonder de vraag hoeveel tijd een gebruiker op de site doorbrengt wanneer die 17 minuten aan het bekijken van artikelen heeft besteed.

De gegevensset webdata is voor je geladen.

Deze oefening maakt deel uit van de cursus

A/B-testen in R

Cursus bekijken

Oefeninstructies

  • Laad het pakket ggplot2 om grafieken te maken.
  • Gebruik de formule van de regressielijn om te bepalen en op te slaan hoeveel tijd er dagelijks op de site wordt doorgebracht wanneer een gebruiker dagelijks 17 minuten op internet doorbrengt, als yhat, gegeven een y-intercept van 14.97 en een helling van 0.42.
  • Maak een spreidingsdiagram om het effect van Time op TimeSearching te beoordelen, inclusief snijlijnen bij tijd 17 en de voorspelde hoeveelheid tijd die dagelijks op de site wordt doorgebracht.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Call the ggplot package
___

# Derive predicted value
yhat <- ___

# Create the scatter plot
ggplot(___) + 
    ___ + 
    ___ + 
    ___
Code bewerken en uitvoeren