Unterschiede in Variablen verstehen
Jetzt analysierst du die Mittelwerte und Standardabweichungen jeder Variable, indem du sie in einem Balkendiagramm darstellst. Das ergänzt den vorherigen Schritt: Du untersuchst visuell die Unterschiede in Skalierung und Varianz der Variablen.
Die Bibliothek pandas ist als pd geladen und matplotlib.pyplot als plt. Außerdem wurde der Datensatz wholesale als pandas DataFrame geladen, während die Mittelwerte und Standardabweichungen für jede Spalte von wholesale als pandas Series vorliegen, die jeweils averages und std_devs heißen. Schau sie dir in der Konsole an.
Diese Übung ist Teil des Kurses
Machine Learning für Marketing mit Python
Anleitung zur Übung
- Erstelle eine Liste mit den Spaltennamen von
wholesaleund eine weitere mit sortierten Werten von 0 bis zur Anzahl der Spalten inwholesale. - Plotte
averagesin Grau undstd_devsin Orange, passe die x-Achse um 0,2 an. - Füge
x_ixals Ticks undx_namesals Beschriftungen hinzu und drehe sie um 90 Grad. - Füge die Legende hinzu und zeige das Diagramm an.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create column names list and same length integer list
x_names = wholesale.___
x_ix = np.arange(wholesale.shape[1])
# Plot the averages data in gray and standard deviations in orange
plt.bar(x=x_ix-___, height=averages, color='grey', label='Average', width=0.4)
plt.bar(x=x_ix+___, height=std_devs, color='orange', label='Standard Deviation', width=0.4)
# Add x-axis labels and rotate
plt.xticks(ticks=___, labels=x_names, rotation=90)
# Add the legend and display the chart
plt.legend()
plt.___()