CommencerCommencer gratuitement

Nuage de points

Un excellent moyen de commencer à analyser les données pour une régression est de créer un nuage de points.

Une entreprise a recueilli le temps que les utilisateurs de son site passent à consulter des articles, Time, et souhaite comprendre l’impact de ce facteur sur le temps que ses utilisateurs passent à rechercher sur le site chaque jour, TimeSearching, avec un intérêt particulier pour le temps qu’un utilisateur passe sur le site lorsqu’il a passé 17 minutes à consulter des articles.

Le jeu de données webdata a été chargé pour vous.

Cet exercice fait partie du cours

Tests A/B en R

Afficher le cours

Instructions

  • Chargez le package ggplot2 pour créer des graphiques.
  • Utilisez la formule de la droite de régression pour calculer et stocker, sous le nom yhat, le temps passé quotidiennement sur le site lorsqu’un utilisateur passe 17 minutes par jour sur Internet, en considérant une ordonnée à l’origine de 14.97 et une pente de 0.42.
  • Créez un nuage de points approprié pour évaluer l’effet de Time sur TimeSearching, en incluant des lignes qui se coupent à 17 pour le temps et à la valeur prédite du temps passé quotidiennement sur le site.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Call the ggplot package
___

# Derive predicted value
yhat <- ___

# Create the scatter plot
ggplot(___) + 
    ___ + 
    ___ + 
    ___
Modifier et exécuter le code