Logistische plot
Logistische regressiemodellen beoordelen een binaire categorische afhankelijke variabele.
Een bedrijf heeft gegevens verzameld over of personen op een advertentie hebben geklikt, Click, en wil weten hoeveel tijd op de site is doorgebracht, TimeSearching, in relatie tot het klikken op de advertentie. Om de resultaten van het model te beschrijven aan de raad van bestuur, die wil weten of er op de advertentie wordt geklikt als er dagelijks 43 minuten op de site worden doorgebracht, maak je een spreidingsdiagram met relevante visuele aanwijzingen.
De webdata-gegevensset en het pakket ggplot2 zijn voor je geladen.
Deze oefening maakt deel uit van de cursus
A/B-testen in R
Oefeninstructies
- Sla de dagelijkse tijd op de site die is gebruikt om de kans op klikken te bepalen, 43, op als
TimeSearching. - Maak het spreidingsdiagram met de logistische regressielijn en geef het voorspeltijdstip aan met een zwarte lijn.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Set the value to predict
TimeSearching <- ___
# Plot the data
ggplot(webdata, aes(x = ___, y = ___)) +
geom_point() +
geom_smooth(method = ___,
method.args = ___)) +
geom_vline(xintercept = ___)