ComeçarComece de graça

Entenda as diferenças entre variáveis

Agora, você vai analisar as médias e os desvios padrão de cada variável, visualizando-os em um gráfico de barras. Este é um passo complementar ao anterior, pois você vai explorar visualmente as diferenças nas escalas e variâncias das variáveis.

A biblioteca pandas está carregada como pd e matplotlib.pyplot como plt. Além disso, o conjunto de dados wholesale foi carregado como um DataFrame do pandas, enquanto as médias e os desvios padrão de cada coluna do conjunto wholesale foram carregados como Series do pandas chamadas averages e std_devs, respectivamente. Não deixe de explorá-los no console.

Este exercício faz parte do curso

Machine Learning para Marketing em Python

Ver curso

Instruções do exercício

  • Crie uma lista com os nomes das colunas de wholesale e outra com valores ordenados de 0 até o número de colunas em wholesale.
  • Plote averages em cinza e std_devs em laranja, ajustando o eixo x em 0.2.
  • Adicione x_ix como marcações (ticks) e x_names como rótulos e gire-os em 90 graus.
  • Adicione a legenda e exiba o gráfico.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create column names list and same length integer list
x_names = wholesale.___
x_ix = np.arange(wholesale.shape[1])

# Plot the averages data in gray and standard deviations in orange 
plt.bar(x=x_ix-___, height=averages, color='grey', label='Average', width=0.4)
plt.bar(x=x_ix+___, height=std_devs, color='orange', label='Standard Deviation', width=0.4)

# Add x-axis labels and rotate
plt.xticks(ticks=___, labels=x_names, rotation=90)

# Add the legend and display the chart
plt.legend()
plt.___()
Editar e executar o código