Avaliando o ajuste de distribuição para a variável ldl
Neste exercício, você vai focar em uma variável do conjunto de dados de diabetes dia: o soro sanguíneo ldl. Você vai determinar se a distribuição normal ainda é uma boa escolha para ldl com base nas informações adicionais fornecidas por um teste de Kolmogorov–Smirnov.
O DataFrame dia já foi carregado para você. As seguintes bibliotecas também foram importadas: pandas como pd, numpy como np e scipy.stats como st.
Este exercício faz parte do curso
Simulações de Monte Carlo em Python
Instruções do exercício
- Defina uma lista chamada
list_of_distscontendo suas distribuições candidatas: Laplace, normal e exponencial (nesta ordem); use os nomes corretos descipy.stats. - Dentro do loop, ajuste os dados com a distribuição de probabilidade correspondente, salvando em
param. - Execute um teste de Kolmogorov–Smirnov para avaliar o ajuste, salvando os resultados em
result.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# List candidate distributions to evaluate
list_of_dists = [____]
for i in list_of_dists:
dist = getattr(st, i)
# Fit the data to the probability distribution
param = dist.____
# Perform the ks test to evaluate goodness-of-fit
result = ____
print(result)