ComeçarComece de graça

Avaliando o ajuste de distribuição para a variável ldl

Neste exercício, você vai focar em uma variável do conjunto de dados de diabetes dia: o soro sanguíneo ldl. Você vai determinar se a distribuição normal ainda é uma boa escolha para ldl com base nas informações adicionais fornecidas por um teste de Kolmogorov–Smirnov.

O DataFrame dia já foi carregado para você. As seguintes bibliotecas também foram importadas: pandas como pd, numpy como np e scipy.stats como st.

Este exercício faz parte do curso

Simulações de Monte Carlo em Python

Ver curso

Instruções do exercício

  • Defina uma lista chamada list_of_dists contendo suas distribuições candidatas: Laplace, normal e exponencial (nesta ordem); use os nomes corretos de scipy.stats.
  • Dentro do loop, ajuste os dados com a distribuição de probabilidade correspondente, salvando em param.
  • Execute um teste de Kolmogorov–Smirnov para avaliar o ajuste, salvando os resultados em result.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# List candidate distributions to evaluate
list_of_dists = [____]
for i in list_of_dists:
    dist = getattr(st, i)
    # Fit the data to the probability distribution
    param = dist.____
    # Perform the ks test to evaluate goodness-of-fit
    result = ____
    print(result)
Editar e executar o código