Comprender las diferencias entre variables
Ahora vas a analizar las medias y desviaciones estándar de cada variable representándolas en un diagrama de barras. Este paso complementa el anterior, ya que explorarás visualmente las diferencias en las escalas y varianzas de las variables.
La librería pandas está cargada como pd y matplotlib.pyplot como plt. Además, el conjunto de datos wholesale se ha cargado como un DataFrame de pandas, mientras que las medias y desviaciones estándar de cada columna de wholesale están cargadas como Series de pandas llamadas averages y std_devs, respectivamente. Asegúrate de explorarlas en la consola.
Este ejercicio forma parte del curso
Machine Learning para marketing en Python
Instrucciones del ejercicio
- Crea una lista con los nombres de las columnas de
wholesaley otra con los valores ordenados de 0 hasta el número de columnas enwholesale. - Representa
averagesen gris ystd_devsen naranja, ajustando el eje x en 0.2. - Añade
x_ixcomo marcas yx_namescomo etiquetas, y asegúrate de rotarlas 90 grados. - Añade la leyenda y muestra el gráfico.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create column names list and same length integer list
x_names = wholesale.___
x_ix = np.arange(wholesale.shape[1])
# Plot the averages data in gray and standard deviations in orange
plt.bar(x=x_ix-___, height=averages, color='grey', label='Average', width=0.4)
plt.bar(x=x_ix+___, height=std_devs, color='orange', label='Standard Deviation', width=0.4)
# Add x-axis labels and rotate
plt.xticks(ticks=___, labels=x_names, rotation=90)
# Add the legend and display the chart
plt.legend()
plt.___()