ComenzarEmpieza gratis

Comprender las diferencias entre variables

Ahora vas a analizar las medias y desviaciones estándar de cada variable representándolas en un diagrama de barras. Este paso complementa el anterior, ya que explorarás visualmente las diferencias en las escalas y varianzas de las variables.

La librería pandas está cargada como pd y matplotlib.pyplot como plt. Además, el conjunto de datos wholesale se ha cargado como un DataFrame de pandas, mientras que las medias y desviaciones estándar de cada columna de wholesale están cargadas como Series de pandas llamadas averages y std_devs, respectivamente. Asegúrate de explorarlas en la consola.

Este ejercicio forma parte del curso

Machine Learning para marketing en Python

Ver curso

Instrucciones del ejercicio

  • Crea una lista con los nombres de las columnas de wholesale y otra con los valores ordenados de 0 hasta el número de columnas en wholesale.
  • Representa averages en gris y std_devs en naranja, ajustando el eje x en 0.2.
  • Añade x_ix como marcas y x_names como etiquetas, y asegúrate de rotarlas 90 grados.
  • Añade la leyenda y muestra el gráfico.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create column names list and same length integer list
x_names = wholesale.___
x_ix = np.arange(wholesale.shape[1])

# Plot the averages data in gray and standard deviations in orange 
plt.bar(x=x_ix-___, height=averages, color='grey', label='Average', width=0.4)
plt.bar(x=x_ix+___, height=std_devs, color='orange', label='Standard Deviation', width=0.4)

# Add x-axis labels and rotate
plt.xticks(ticks=___, labels=x_names, rotation=90)

# Add the legend and display the chart
plt.legend()
plt.___()
Editar y ejecutar código