Examinando y, tc e cdl
Agora, você vai focar em tc, hdl e y para entender a relação entre algumas variáveis independentes e a variável dependente, a progressão da doença. O conjunto de dados de diabetes foi carregado como o DataFrame dia.
Mais adiante no curso, você vai usar uma simulação para medir o impacto dos preditores nas respostas, então ter uma compreensão inicial das relações entre as variáveis vai ajudar você a entender melhor os resultados da sua simulação depois!
As seguintes bibliotecas já foram importadas para você: pandas como pd, numpy como np, matplotlib.pyplot como plt e seaborn como sns.
Este exercício faz parte do curso
Simulações de Monte Carlo em Python
Instruções do exercício
- Use
.pairplot()para examinar visualmentetc,hdleyemdia. - Meça os coeficientes de correlação entre
tc,hdleyemdia.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a pairplot of tc, hdl, and y
____
plt.show()
# Calculate correlation coefficients
print(____)