Chômage des hommes blancs et noirs
Dans cet exercice, vous allez comparer le chômage métropolitain entre les hommes blancs et noirs. msa_black_emp est chargé. Un nouveau DataFrame, msa_white_emp, contenant les données du tableau C23002A de l’ACS 2012 sur 5 ans, est également chargé. Le pourcentage de chômage a déjà été calculé pour vous. Vous allez restreindre les deux DataFrames aux colonnes d’intérêt (celles indiquant le pourcentage d’emplois masculins), fusionner les DataFrames, puis les transformer avec melt en un DataFrame ordonné (« tidy ») pour une visualisation avec seaborn.
pandas et seaborn ont été importés avec leurs alias habituels.
Cet exercice fait partie du cours
Analyzing US Census Data in Python
Instructions
- Créez
tidy_white_empen restreignantmsa_white_empaux colonnes"msa"et"pct_male_unemp", puis renommez la seconde colonne en"white" - Fusionnez
tidy_black_empettidy_white_empsur la colonne"msa"; affectez le résultat àtidy_emp - Appliquez
meltàtidy_emp. Lesvalue_varsdoivent être les noms des deux colonnes de race ; définissezvar_nameà"race"etvalue_nameà"unemployment" - Tracez le chômage en fonction de la dissimilarité, en conditionnant par race grâce au paramètre
hue
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Restrict DataFrame to columns of interest, rename columns
tidy_black_emp = msa_black_emp[["msa", "D", "pct_male_unemp"]]
tidy_black_emp.columns = ["msa", "D", "black"]
tidy_white_emp = ____
tidy_white_emp.columns = ____
tidy_emp = ____
# Use melt to create tidy DataFrame
tidy_msa_emp = tidy_emp.melt(id_vars = ["msa", "D"],
value_vars = ____, var_name = ____,
value_name = ____)
# Visually compare male and female unemployment
sns.lmplot(____, data = tidy_msa_emp)
plt.show()