LoslegenKostenlos loslegen

Unterschiede in Variablen verstehen

Jetzt analysierst du die Mittelwerte und Standardabweichungen jeder Variable, indem du sie in einem Balkendiagramm darstellst. Das ergänzt den vorherigen Schritt: Du untersuchst visuell die Unterschiede in Skalierung und Varianz der Variablen.

Die Bibliothek pandas ist als pd geladen und matplotlib.pyplot als plt. Außerdem wurde der Datensatz wholesale als pandas DataFrame geladen, während die Mittelwerte und Standardabweichungen für jede Spalte von wholesale als pandas Series vorliegen, die jeweils averages und std_devs heißen. Schau sie dir in der Konsole an.

Diese Übung ist Teil des Kurses

Machine Learning für Marketing mit Python

Kurs anzeigen

Anleitung zur Übung

  • Erstelle eine Liste mit den Spaltennamen von wholesale und eine weitere mit sortierten Werten von 0 bis zur Anzahl der Spalten in wholesale.
  • Plotte averages in Grau und std_devs in Orange, passe die x-Achse um 0,2 an.
  • Füge x_ix als Ticks und x_names als Beschriftungen hinzu und drehe sie um 90 Grad.
  • Füge die Legende hinzu und zeige das Diagramm an.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create column names list and same length integer list
x_names = wholesale.___
x_ix = np.arange(wholesale.shape[1])

# Plot the averages data in gray and standard deviations in orange 
plt.bar(x=x_ix-___, height=averages, color='grey', label='Average', width=0.4)
plt.bar(x=x_ix+___, height=std_devs, color='orange', label='Standard Deviation', width=0.4)

# Add x-axis labels and rotate
plt.xticks(ticks=___, labels=x_names, rotation=90)

# Add the legend and display the chart
plt.legend()
plt.___()
Code bearbeiten und ausführen