CommencerCommencer gratuitement

Chômage des hommes blancs et noirs

Dans cet exercice, vous allez comparer le chômage métropolitain entre les hommes blancs et noirs. msa_black_emp est chargé. Un nouveau DataFrame, msa_white_emp, contenant les données du tableau C23002A de l’ACS 2012 sur 5 ans, est également chargé. Le pourcentage de chômage a déjà été calculé pour vous. Vous allez restreindre les deux DataFrames aux colonnes d’intérêt (celles indiquant le pourcentage d’emplois masculins), fusionner les DataFrames, puis les transformer avec melt en un DataFrame ordonné (« tidy ») pour une visualisation avec seaborn.

pandas et seaborn ont été importés avec leurs alias habituels.

Cet exercice fait partie du cours

Analyzing US Census Data in Python

Afficher le cours

Instructions

  • Créez tidy_white_emp en restreignant msa_white_emp aux colonnes "msa" et "pct_male_unemp", puis renommez la seconde colonne en "white"
  • Fusionnez tidy_black_emp et tidy_white_emp sur la colonne "msa" ; affectez le résultat à tidy_emp
  • Appliquez melt à tidy_emp. Les value_vars doivent être les noms des deux colonnes de race ; définissez var_name à "race" et value_name à "unemployment"
  • Tracez le chômage en fonction de la dissimilarité, en conditionnant par race grâce au paramètre hue

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Restrict DataFrame to columns of interest, rename columns
tidy_black_emp = msa_black_emp[["msa", "D", "pct_male_unemp"]]
tidy_black_emp.columns = ["msa", "D", "black"]
tidy_white_emp = ____
tidy_white_emp.columns = ____
tidy_emp = ____

# Use melt to create tidy DataFrame
tidy_msa_emp = tidy_emp.melt(id_vars = ["msa", "D"], 
    value_vars = ____, var_name = ____, 
    value_name = ____)

# Visually compare male and female unemployment
sns.lmplot(____, data = tidy_msa_emp)
plt.show()
Modifier et exécuter le code