Sensibilidad a los valores atípicos
Cuando analizamos la relación entre más de una variable, la correlación es un gran punto de partida. Pero ¿qué tal se comporta la correlación con conjuntos de datos más interesantes? ¿Qué tan bien resiste los valores atípicos (outliers)?
En este ejercicio, representarás y calcularás la correlación para un conjunto de datos con un valor atípico y luego lo eliminarás para ver qué cambia. Al final, quieres evaluar cómo se comporta la correlación y sacar una conclusión sobre cuándo y dónde deberías usarla.
Se ha importado para ti una muestra del famoso Anscombe's quartet como la variable df, junto con todos los paquetes usados anteriormente en este capítulo.
Este ejercicio forma parte del curso
Practicando preguntas de entrevistas de estadística en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Display the scatter plot of X and Y
plt.scatter(____, ____)
plt.show()