Ajuster une loi normale
Avec des jeux de données relativement petits, vous n’avez souvent pas assez d’observations pour tirer des conclusions solides. Toutefois, si vous pensez que les données suivent une loi normale, il peut être raisonnable d’ajuster une loi normale et de travailler avec celle-ci plutôt qu’avec les données brutes. Dans cet exercice, vous utiliserez les mêmes données concernant les pompiers hispaniques, que vous avez précédemment montré suivre une distribution normale au seuil de 5 %. Vous allez y ajuster une loi normale, puis l’utiliser pour estimer le pourcentage d’employés ayant moins de 10 ans d’ancienneté.
Ce DataFrame est déjà chargé dans salary_df. Les packages pandas (pd), NumPy (np), Matplotlib (plt) et le module stats de SciPy sont également chargés.
Cet exercice fait partie du cours
Fondements de l’inférence en Python
Instructions
- Ajustez une loi normale sur la colonne
Years of Employmentet enregistrez la moyenne et l’écart type obtenus. - Utilisez cette moyenne et cet écart type dans une CDF normale pour estimer le pourcentage d’employés ayant moins de dix ans d’expérience.
- Affichez ce pourcentage.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Fit a normal distribution to the data
mu, std = ____
# Compute the percentage of employees with less than 10 years experience
percent = stats.____(____, loc=____, scale=____)
# Print out this percentage
____