Explorando as variáveis explicativas
Quando a variável de resposta é lógica, todos os pontos estão nas linhas \(y=0\) e \(y=1\), o que dificulta a visualização do que está acontecendo. No vídeo, até que você visse a linha de tendência, não estava claro como a variável explicativa estava distribuída em cada linha. Isso pode ser resolvido com um histograma da variável explicativa, agrupada pela resposta.
Você usará esses histogramas para conhecer o conjunto de dados de rotatividade de serviços financeiros visto no vídeo.
churn
está disponível como um pandas
DataFrame.
Este exercício faz parte do curso
Introdução à regressão com statsmodels em Python
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Create the histograms of time_since_last_purchase split by has_churned
sns.____(____)
plt.show()