Aan de slagGa gratis aan de slag

Werkloosheid onder witte en zwarte mannen

In deze oefening vergelijk je de werkloosheid in grootstedelijke gebieden tussen witte en zwarte mannen. msa_black_emp is al geladen. Er is ook een nieuw DataFrame, msa_white_emp, met gegevens uit tabel C23002A van de 2012 5-year ACS. Het percentage werkloosheid is al voor je berekend. Je beperkt beide DataFrames tot de relevante kolommen (degene met het percentage mannelijke werkloosheid), voegt de DataFrames samen en melt ze naar een netjes DataFrame voor visualisatie met seaborn.

pandas en seaborn zijn geladen met de gebruikelijke aliassen.

Deze oefening maakt deel uit van de cursus

US Census-gegevens analyseren in Python

Cursus bekijken

Oefeninstructies

  • Maak tidy_white_emp door msa_white_emp te beperken tot de kolommen "msa" en "pct_male_unemp", en hernoem daarna de tweede kolom naar "white"
  • Merge tidy_black_emp en tidy_white_emp op de kolom "msa"; sla het resultaat op in tidy_emp
  • Gebruik melt op tidy_emp. De value_vars moeten de namen van de twee kolommen met rassen zijn; zet var_name op "race" en value_name op "unemployment"
  • Plot werkloosheid versus dissimilarity, geconditioneerd op ras met de parameter hue

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Restrict DataFrame to columns of interest, rename columns
tidy_black_emp = msa_black_emp[["msa", "D", "pct_male_unemp"]]
tidy_black_emp.columns = ["msa", "D", "black"]
tidy_white_emp = ____
tidy_white_emp.columns = ____
tidy_emp = ____

# Use melt to create tidy DataFrame
tidy_msa_emp = tidy_emp.melt(id_vars = ["msa", "D"], 
    value_vars = ____, var_name = ____, 
    value_name = ____)

# Visually compare male and female unemployment
sns.lmplot(____, data = tidy_msa_emp)
plt.show()
Code bewerken en uitvoeren