Arbeitslosigkeit von weißen und schwarzen Männern
In dieser Übung vergleichst du die Arbeitslosigkeit in Metropolregionen zwischen weißen und schwarzen Männern. msa_black_emp ist geladen. Ein neues DataFrame, msa_white_emp, mit Daten aus Tabelle C23002A der 5-jährigen ACS 2012 ist ebenfalls geladen. Die prozentuale Arbeitslosigkeit wurde bereits für dich berechnet. Du beschränkst beide DataFrames auf die interessierenden Spalten (die mit den Prozentwerten der männlichen Beschäftigung), verknüpfst die DataFrames und melt-est sie zu einem aufgeräumten DataFrame für die Visualisierung mit seaborn.
pandas und seaborn wurden mit den üblichen Aliassen geladen.
Diese Übung ist Teil des Kurses
Analyse von US-Volkszählungsdaten mit Python
Anleitung zur Übung
- Erstelle
tidy_white_emp, indem dumsa_white_empauf die Spalten"msa"und"pct_male_unemp"beschränkst, und benenne dann die zweite Spalte in"white"um - Führe
tidy_black_empundtidy_white_empüber die Spalte"msa"zusammen; weise das Ergebnistidy_empzu - Wende
meltauftidy_empan. Dievalue_varssollten die Namen der beiden Rassespalten sein; setzevar_nameauf"race"undvalue_nameauf"unemployment" - Zeichne Arbeitslosigkeit gegen Dissimilarität und bedinge nach „race“ mit dem Parameter
hue
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Restrict DataFrame to columns of interest, rename columns
tidy_black_emp = msa_black_emp[["msa", "D", "pct_male_unemp"]]
tidy_black_emp.columns = ["msa", "D", "black"]
tidy_white_emp = ____
tidy_white_emp.columns = ____
tidy_emp = ____
# Use melt to create tidy DataFrame
tidy_msa_emp = tidy_emp.melt(id_vars = ["msa", "D"],
value_vars = ____, var_name = ____,
value_name = ____)
# Visually compare male and female unemployment
sns.lmplot(____, data = tidy_msa_emp)
plt.show()