Entenda as diferenças entre variáveis
Agora, você vai analisar as médias e os desvios padrão de cada variável, visualizando-os em um gráfico de barras. Este é um passo complementar ao anterior, pois você vai explorar visualmente as diferenças nas escalas e variâncias das variáveis.
A biblioteca pandas está carregada como pd e matplotlib.pyplot como plt. Além disso, o conjunto de dados wholesale foi carregado como um DataFrame do pandas, enquanto as médias e os desvios padrão de cada coluna do conjunto wholesale foram carregados como Series do pandas chamadas averages e std_devs, respectivamente. Não deixe de explorá-los no console.
Este exercício faz parte do curso
Machine Learning para Marketing em Python
Instruções do exercício
- Crie uma lista com os nomes das colunas de
wholesalee outra com valores ordenados de 0 até o número de colunas emwholesale. - Plote
averagesem cinza estd_devsem laranja, ajustando o eixo x em 0.2. - Adicione
x_ixcomo marcações (ticks) ex_namescomo rótulos e gire-os em 90 graus. - Adicione a legenda e exiba o gráfico.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create column names list and same length integer list
x_names = wholesale.___
x_ix = np.arange(wholesale.shape[1])
# Plot the averages data in gray and standard deviations in orange
plt.bar(x=x_ix-___, height=averages, color='grey', label='Average', width=0.4)
plt.bar(x=x_ix+___, height=std_devs, color='orange', label='Standard Deviation', width=0.4)
# Add x-axis labels and rotate
plt.xticks(ticks=___, labels=x_names, rotation=90)
# Add the legend and display the chart
plt.legend()
plt.___()