Choix d'une hypothèse
Vous avez vu comment les visualisations peuvent être utilisées pour générer des hypothèses, ce qui en fait un élément essentiel de l'analyse exploratoire des données.
Dans cet exercice, vous créerez un diagramme à barres afin d'examiner les différences de salaires en fonction de la taille de l'entreprise et du statut par rapport à l'emploi. Pour référence, il y a quatre valeurs :
Valeur | Signification |
---|---|
CT |
Sous-traitant |
FL |
Freelance |
PT |
Temps partiel |
FT |
Temps plein |
pandas
a été importé sous le nom de pd
, matplotlib.pyplot
sous le nom de plt
, seaborn
sous le nom de sns
, et l'ensemble de données sur les salaires sous la forme d'un DataFrame pandas appelé salaries
.
Cet exercice fait partie du cours
Analyse de données exploratoires en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a bar plot of salary versus company size, factoring in employment status
sns.____(data=____, x="____", y="____", hue="____")
plt.show()