Anpassen einer Normalverteilung
Bei relativ kleinen Datensätzen hast du oft nicht genug Daten für eine fundierte Inferenz. Wenn du jedoch vermutest, dass die Daten einer Normalverteilung folgen, kann es sinnvoll sein, eine Normalverteilung zu fitten und damit zu arbeiten – statt mit den Rohdaten. In dieser Übung arbeitest du mit denselben Daten zu hispanischen Feuerwehrleuten, für die du zuvor gezeigt hast, dass sie auf dem 5-%-Niveau normalverteilt sind. Du passt eine Normalverteilung an und nutzt sie, um den Prozentsatz der Mitarbeitenden zu ermitteln, die voraussichtlich weniger als 10 Jahre Berufserfahrung haben.
Dieses DataFrame wurde dir als salary_df geladen. Die Pakete pandas als pd, NumPy als np, Matplotlib als plt und das stats-Paket aus SciPy sind ebenfalls bereits geladen.
Diese Übung ist Teil des Kurses
Grundlagen der Inferenz in Python
Anleitung zur Übung
- Fitte eine Normalverteilung an die Spalte
Years of Employmentund speichere den resultierenden Mittelwert und die Standardabweichung. - Verwende diesen Mittelwert und diese Standardabweichung in einer normalen CDF, um den Prozentsatz der Mitarbeitenden mit weniger als zehn Jahren Erfahrung zu schätzen.
- Gib diesen Prozentsatz aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Fit a normal distribution to the data
mu, std = ____
# Compute the percentage of employees with less than 10 years experience
percent = stats.____(____, loc=____, scale=____)
# Print out this percentage
____