Explora el conjunto de datos de compras de productos por cliente
Has explorado el conjunto de datos de compras por producto y cliente en el vídeo y ahora estás listo para trazar algunos gráficos exploratorios para entender la distribución de las variables y las relaciones entre ellas. Aquí, explorarás el conjunto de datos wholesale y dibujarás las relaciones por pares, así como las distribuciones estimadas de cada variable con la función pairplot de la biblioteca seaborn. Es un paso importante para explorar los tipos de distribución y las relaciones entre variables, y así decidir si hace falta más preprocesamiento de datos.
La biblioteca pandas está cargada como pd, seaborn como sns y matplotlib.pyplot como plt. Además, el conjunto de datos wholesale se ha cargado como un DataFrame de pandas.
Este ejercicio forma parte del curso
Machine Learning para marketing en Python
Instrucciones del ejercicio
- Imprime el encabezado del conjunto de datos
wholesale - Traza las relaciones por pares entre las variables
- Muestra el gráfico.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Print the header of the `wholesale` dataset
print(___.head())
# Plot the pairwise relationships between the variables
sns.pairplot(___, diag_kind='kde')
# Display the chart
plt.___()