Spreidingsdiagram en punten
Een goede manier om te beginnen met het beoordelen van gegevens voor een regressie is het maken van een spreidingsdiagram.
Een bedrijf heeft de tijd verzameld die gebruikers van hun website besteden aan het bekijken van artikelen, Time, en wil weten hoe dit de tijd beïnvloedt die hun gebruikers dagelijks op de site zoeken, TimeSearching, met in het bijzonder de vraag hoeveel tijd een gebruiker op de site doorbrengt wanneer die 17 minuten aan het bekijken van artikelen heeft besteed.
De gegevensset webdata is voor je geladen.
Deze oefening maakt deel uit van de cursus
A/B-testen in R
Oefeninstructies
- Laad het pakket
ggplot2om grafieken te maken. - Gebruik de formule van de regressielijn om te bepalen en op te slaan hoeveel tijd er dagelijks op de site wordt doorgebracht wanneer een gebruiker dagelijks 17 minuten op internet doorbrengt, als
yhat, gegeven een y-intercept van14.97en een helling van0.42. - Maak een spreidingsdiagram om het effect van
TimeopTimeSearchingte beoordelen, inclusief snijlijnen bij tijd 17 en de voorspelde hoeveelheid tijd die dagelijks op de site wordt doorgebracht.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Call the ggplot package
___
# Derive predicted value
yhat <- ___
# Create the scatter plot
ggplot(___) +
___ +
___ +
___