ComeçarComece de graça

Sensibilidade a outliers

Quando analisamos a relação entre mais de uma variável, a correlação é um ótimo começo. Mas como a correlação se sai em conjuntos de dados mais interessantes? Como ela se comporta na presença de outliers?

Neste exercício, você vai gerar o gráfico e calcular a correlação de um conjunto de dados com um outlier, depois removê-lo e ver o que muda. No fim, você quer observar como a correlação se comporta e chegar a uma conclusão sobre quando e onde deve usá-la.

Um conjunto de dados de exemplo do famoso quarteto de Anscombe foi importado para você na variável df, junto com todos os pacotes usados anteriormente neste capítulo.

Este exercício faz parte do curso

Praticando perguntas de entrevista de Estatística em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Display the scatter plot of X and Y
plt.scatter(____, ____)
plt.show()
Editar e executar o código