Nuage de points
Un excellent moyen de commencer à analyser les données pour une régression est de créer un nuage de points.
Une entreprise a recueilli le temps que les utilisateurs de son site passent à consulter des articles, Time, et souhaite comprendre l’impact de ce facteur sur le temps que ses utilisateurs passent à rechercher sur le site chaque jour, TimeSearching, avec un intérêt particulier pour le temps qu’un utilisateur passe sur le site lorsqu’il a passé 17 minutes à consulter des articles.
Le jeu de données webdata a été chargé pour vous.
Cet exercice fait partie du cours
Tests A/B en R
Instructions
- Chargez le package
ggplot2pour créer des graphiques. - Utilisez la formule de la droite de régression pour calculer et stocker, sous le nom
yhat, le temps passé quotidiennement sur le site lorsqu’un utilisateur passe 17 minutes par jour sur Internet, en considérant une ordonnée à l’origine de14.97et une pente de0.42. - Créez un nuage de points approprié pour évaluer l’effet de
TimesurTimeSearching, en incluant des lignes qui se coupent à 17 pour le temps et à la valeur prédite du temps passé quotidiennement sur le site.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Call the ggplot package
___
# Derive predicted value
yhat <- ___
# Create the scatter plot
ggplot(___) +
___ +
___ +
___