ComeçarComece gratuitamente

Avaliação do ajuste da distribuição para a variável ldl

Neste exercício, você se concentrará em uma variável do conjunto de dados de diabetes dia: o soro sanguíneo ldl. Você determinará se a distribuição normal ainda é uma boa opção para ldl com base nas informações adicionais fornecidas por um teste de Kolmogorov-Smirnov.

O DataFrame dia foi carregado para você. As seguintes bibliotecas também foram importadas: pandas como pd, numpy como np, e scipy.stats como st.

Este exercício faz parte do curso

Simulações de Monte Carlo em Python

Ver Curso

Instruções de exercício

  • Defina uma lista chamada list_of_dists que contenha suas distribuições candidatas: Laplace, normal e exponencial (nessa ordem); use os nomes corretos de scipy.stats.
  • Dentro do loop, ajuste os dados com a distribuição de probabilidade correspondente, salvando como param.
  • Realize um teste de Kolmogorov-Smirnov para avaliar a qualidade do ajuste, salvando os resultados em result.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# List candidate distributions to evaluate
list_of_dists = [____]
for i in list_of_dists:
    dist = getattr(st, i)
    # Fit the data to the probability distribution
    param = dist.____
    # Perform the ks test to evaluate goodness-of-fit
    result = ____
    print(result)
Editar e executar código