Explore o conjunto de dados de compras de produtos por cliente
Você explorou o conjunto de dados de compras por cliente no exercício em vídeo e agora está pronto para criar alguns gráficos exploratórios para entender a distribuição das variáveis e os relacionamentos entre elas. Aqui, você vai explorar o conjunto de dados wholesale e traçar os relacionamentos par a par, além das distribuições estimadas de cada variável, usando a função pairplot da biblioteca seaborn. Essa é uma etapa importante para investigar os tipos de distribuição e os relacionamentos entre as variáveis, indicando a necessidade de mais pré-processamento dos dados.
A biblioteca pandas está carregada como pd, seaborn como sns e matplotlib.pyplot como plt. Além disso, o conjunto de dados wholesale foi carregado como um DataFrame do pandas.
Este exercício faz parte do curso
Machine Learning para Marketing em Python
Instruções do exercício
- Imprima o cabeçalho do conjunto de dados
wholesale - Plote os relacionamentos par a par entre as variáveis
- Exiba o gráfico.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Print the header of the `wholesale` dataset
print(___.head())
# Plot the pairwise relationships between the variables
sns.pairplot(___, diag_kind='kde')
# Display the chart
plt.___()