ComenzarEmpieza gratis

Dispersión y puntos

Una forma ideal de empezar a evaluar los datos para una regresión es crear un diagrama de dispersión.

Una empresa ha recopilado el tiempo que los usuarios de su sitio web dedican a revisar artículos, Time, y quiere saber cómo esto afecta al tiempo que sus usuarios dedican a buscar en el sitio cada día, TimeSearching, con especial interés en saber cuánto tiempo pasa un usuario en el sitio cuando ha pasado 17 minutos revisando artículos.

El conjunto de datos webdata ya está cargado para ti.

Este ejercicio forma parte del curso

A/B Testing en R

Ver curso

Instrucciones del ejercicio

  • Carga el paquete ggplot2 para crear gráficos.
  • Usa la fórmula de la recta de regresión para calcular y almacenar como yhat el tiempo diario pasado en el sitio cuando un usuario dedica 17 minutos diarios en Internet, dado un intercepto en y de 14.97 y una pendiente de 0.42.
  • Crea un diagrama de dispersión adecuado para evaluar el impacto de Time sobre TimeSearching, incluyendo líneas que se crucen en el tiempo 17 y en la cantidad de tiempo diario predicha en el sitio.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Call the ggplot package
___

# Derive predicted value
yhat <- ___

# Create the scatter plot
ggplot(___) + 
    ___ + 
    ___ + 
    ___
Editar y ejecutar código