CommencerCommencer gratuitement

Ajuster une loi normale

Avec des jeux de données relativement petits, vous n’avez souvent pas assez d’observations pour tirer des conclusions solides. Toutefois, si vous pensez que les données suivent une loi normale, il peut être raisonnable d’ajuster une loi normale et de travailler avec celle-ci plutôt qu’avec les données brutes. Dans cet exercice, vous utiliserez les mêmes données concernant les pompiers hispaniques, que vous avez précédemment montré suivre une distribution normale au seuil de 5 %. Vous allez y ajuster une loi normale, puis l’utiliser pour estimer le pourcentage d’employés ayant moins de 10 ans d’ancienneté.

Ce DataFrame est déjà chargé dans salary_df. Les packages pandas (pd), NumPy (np), Matplotlib (plt) et le module stats de SciPy sont également chargés.

Cet exercice fait partie du cours

Fondements de l’inférence en Python

Afficher le cours

Instructions

  • Ajustez une loi normale sur la colonne Years of Employment et enregistrez la moyenne et l’écart type obtenus.
  • Utilisez cette moyenne et cet écart type dans une CDF normale pour estimer le pourcentage d’employés ayant moins de dix ans d’expérience.
  • Affichez ce pourcentage.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Fit a normal distribution to the data
mu, std = ____

# Compute the percentage of employees with less than 10 years experience
percent = stats.____(____, loc=____, scale=____)

# Print out this percentage
____
Modifier et exécuter le code