Comprender las diferencias entre variables

Ahora vas a analizar las medias y desviaciones estándar de cada variable representándolas en un diagrama de barras. Este paso complementa el anterior, ya que explorarás visualmente las diferencias en las escalas y varianzas de las variables.

La librería pandas está cargada como pd y matplotlib.pyplot como plt. Además, el conjunto de datos wholesale se ha cargado como un DataFrame de pandas, mientras que las medias y desviaciones estándar de cada columna de wholesale están cargadas como Series de pandas llamadas averages y std_devs, respectivamente. Asegúrate de explorarlas en la consola.

Este ejercicio forma parte del curso

Machine Learning para marketing en Python

Ver curso

Instrucciones del ejercicio

Crea una lista con los nombres de las columnas de wholesale y otra con los valores ordenados de 0 hasta el número de columnas en wholesale.
Representa averages en gris y std_devs en naranja, ajustando el eje x en 0.2.
Añade x_ix como marcas y x_names como etiquetas, y asegúrate de rotarlas 90 grados.
Añade la leyenda y muestra el gráfico.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create column names list and same length integer list
x_names = wholesale.___
x_ix = np.arange(wholesale.shape[1])

# Plot the averages data in gray and standard deviations in orange 
plt.bar(x=x_ix-___, height=averages, color='grey', label='Average', width=0.4)
plt.bar(x=x_ix+___, height=std_devs, color='orange', label='Standard Deviation', width=0.4)

# Add x-axis labels and rotate
plt.xticks(ticks=___, labels=x_names, rotation=90)

# Add the legend and display the chart
plt.legend()
plt.___()

Editar y ejecutar código