Examinando tc, ldl e hdl
O conjunto de dados de diabetes, dia, será usado como exemplo do mundo real tanto neste capítulo quanto no próximo. Uma boa exploração de dados é a base para realizar simulações de Monte Carlo eficazes, então você vai continuar explorando os dados nos exercícios!
Neste exercício, o foco estará em três variáveis: tc, ldl e hdl. O DataFrame dia já foi carregado para você.
As seguintes bibliotecas já foram importadas: pandas como pd, numpy como np, matplotlib.pyplot como plt e seaborn como sns.
Este exercício faz parte do curso
Simulações de Monte Carlo em Python
Instruções do exercício
- Use a função
pairplot()doseabornpara examinar visualmente a relação entre as colunastc,ldlehdlemdia(nessa ordem). - Use o método
.corr()dopandaspara medir os coeficientes de correlação entretc,ldlehdlemdia(nessa ordem).
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a pairplot of tc, ldl, and hdl
____(dia[[____]])
plt.show()
# Calculate correlation coefficients
print(____)