Explorar las variables explicativas
Cuando la variable de respuesta es lógica, todos los puntos caen en las líneas \(y=0\) y \(y=1\), lo que dificulta ver qué está pasando. En el vídeo, hasta que apareció la línea de tendencia, no estaba claro cómo se distribuía la variable explicativa en cada línea. Esto se puede resolver con un histograma de la variable explicativa, agrupado por la respuesta.
Usarás estos histogramas para familiarizarte con el conjunto de datos de abandono en servicios financieros que viste en el vídeo.
churn está disponible como un DataFrame de pandas.
Este ejercicio forma parte del curso
Introducción a la regresión con statsmodels en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create the histograms of time_since_last_purchase split by has_churned
sns.____(____)
plt.show()