ComenzarEmpieza gratis

Sensibilidad a los valores atípicos

Cuando analizamos la relación entre más de una variable, la correlación es un gran punto de partida. Pero ¿qué tal se comporta la correlación con conjuntos de datos más interesantes? ¿Qué tan bien resiste los valores atípicos (outliers)?

En este ejercicio, representarás y calcularás la correlación para un conjunto de datos con un valor atípico y luego lo eliminarás para ver qué cambia. Al final, quieres evaluar cómo se comporta la correlación y sacar una conclusión sobre cuándo y dónde deberías usarla.

Se ha importado para ti una muestra del famoso Anscombe's quartet como la variable df, junto con todos los paquetes usados anteriormente en este capítulo.

Este ejercicio forma parte del curso

Practicando preguntas de entrevistas de estadística en Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Display the scatter plot of X and Y
plt.scatter(____, ____)
plt.show()
Editar y ejecutar código