Werkloosheid onder witte en zwarte mannen
In deze oefening vergelijk je de werkloosheid in grootstedelijke gebieden tussen witte en zwarte mannen. msa_black_emp is al geladen. Er is ook een nieuw DataFrame, msa_white_emp, met gegevens uit tabel C23002A van de 2012 5-year ACS. Het percentage werkloosheid is al voor je berekend. Je beperkt beide DataFrames tot de relevante kolommen (degene met het percentage mannelijke werkloosheid), voegt de DataFrames samen en melt ze naar een netjes DataFrame voor visualisatie met seaborn.
pandas en seaborn zijn geladen met de gebruikelijke aliassen.
Deze oefening maakt deel uit van de cursus
US Census-gegevens analyseren in Python
Oefeninstructies
- Maak
tidy_white_empdoormsa_white_empte beperken tot de kolommen"msa"en"pct_male_unemp", en hernoem daarna de tweede kolom naar"white" - Merge
tidy_black_empentidy_white_empop de kolom"msa"; sla het resultaat op intidy_emp - Gebruik
meltoptidy_emp. Devalue_varsmoeten de namen van de twee kolommen met rassen zijn; zetvar_nameop"race"envalue_nameop"unemployment" - Plot werkloosheid versus dissimilarity, geconditioneerd op ras met de parameter
hue
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Restrict DataFrame to columns of interest, rename columns
tidy_black_emp = msa_black_emp[["msa", "D", "pct_male_unemp"]]
tidy_black_emp.columns = ["msa", "D", "black"]
tidy_white_emp = ____
tidy_white_emp.columns = ____
tidy_emp = ____
# Use melt to create tidy DataFrame
tidy_msa_emp = tidy_emp.melt(id_vars = ["msa", "D"],
value_vars = ____, var_name = ____,
value_name = ____)
# Visually compare male and female unemployment
sns.lmplot(____, data = tidy_msa_emp)
plt.show()