Unterschiede in Variablen verstehen

Jetzt analysierst du die Mittelwerte und Standardabweichungen jeder Variable, indem du sie in einem Balkendiagramm darstellst. Das ergänzt den vorherigen Schritt: Du untersuchst visuell die Unterschiede in Skalierung und Varianz der Variablen.

Die Bibliothek pandas ist als pd geladen und matplotlib.pyplot als plt. Außerdem wurde der Datensatz wholesale als pandas DataFrame geladen, während die Mittelwerte und Standardabweichungen für jede Spalte von wholesale als pandas Series vorliegen, die jeweils averages und std_devs heißen. Schau sie dir in der Konsole an.

Diese Übung ist Teil des Kurses

<Kurs>Machine Learning für Marketing mit Python</Kurs>

Kurs ansehen

Übungsanweisungen

Erstelle eine Liste mit den Spaltennamen von wholesale und eine weitere mit sortierten Werten von 0 bis zur Anzahl der Spalten in wholesale.
Plotte averages in Grau und std_devs in Orange, passe die x-Achse um 0,2 an.
Füge x_ix als Ticks und x_names als Beschriftungen hinzu und drehe sie um 90 Grad.
Füge die Legende hinzu und zeige das Diagramm an.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create column names list and same length integer list
x_names = wholesale.___
x_ix = np.arange(wholesale.shape[1])

# Plot the averages data in gray and standard deviations in orange 
plt.bar(x=x_ix-___, height=averages, color='grey', label='Average', width=0.4)
plt.bar(x=x_ix+___, height=std_devs, color='orange', label='Standard Deviation', width=0.4)

# Add x-axis labels and rotate
plt.xticks(ticks=___, labels=x_names, rotation=90)

# Add the legend and display the chart
plt.legend()
plt.___()

Code bearbeiten und ausführen