Transformações log e de potência

No último exercício, você comparou as distribuições de um conjunto de treino e de teste do loan_data. Isso é especialmente relevante em uma entrevista de Machine Learning, porque a distribuição observada indica se você precisa usar técnicas que aproximam as distribuições das variáveis de uma distribuição normal, para que as suposições de normalidade não sejam violadas.

Neste exercício, você vai usar as transformações log e de potência do módulo scipy.stats na variável Years of Credit History de loan_data, junto com a função distplot() do seaborn, que plota a distribuição e a estimativa de densidade por kernel (KDE).

Todos os pacotes necessários já foram importados para você.

Veja onde você está no pipeline:

Machine learning pipeline

Este exercicio faz parte do curso

Praticando perguntas de entrevista de Machine Learning em Python

Ver curso

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Subset loan_data
cr_yrs = ____['____']

# Histogram and kernel density estimate
plt.figure()
sns.____(____)
plt.show()

Editar e Executar Código