Statistiques inférentielles
Pour collecter des données essentielles de santé liées au suivi de l’indice de masse corporelle des jeunes, les autorités sanitaires ont envoyé une enquête à un échantillon nationalement représentatif de jeunes âgés de 14 à 20 ans au 31 décembre 1999. Le jeu de données suit l’âge Age, la taille en pouces Height_in, le poids en livres Weight_lbs, le genre Gender, ainsi que la réponse auto-déclarée à la question à choix multiples « How would you describe your weight? » describe_weight.
Le jeu de données nettoyé de l’enquête a été chargé sous le nom youth_survey_clean. Dans cet exercice, vous allez calculer des intervalles de confiance.
pandas, NumPy et le module de statistiques de SciPy ont été chargés sous les noms pd, np et st, respectivement.
Cet exercice fait partie du cours
Analyser des données d’enquête en Python
Instructions
- Calculez l’intervalle de confiance de la vraie moyenne de population de la taille,
Height_in, avec un niveau de confiance de 95 %. - Calculez l’intervalle de confiance de la vraie moyenne de population de la taille,
Height_in, avec un niveau de confiance de 99 %.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Find confidence interval for mean height with 95% confidence level
conf_95 = st.norm.interval(alpha = ____,
loc = np.mean(____),
scale = st.sem(____))
# Find confidence interval for mean height with 99% confidence level
conf_99 = st.norm.interval(alpha = ____,
loc = np.mean(____),
scale = st.sem(____))
print("conf_95 = ", conf_95)
print("conf_99 = ", conf_99)