Variance égale
Les secteurs d’activité reçoivent des niveaux d’investissement différents de la part des sociétés de capital‑risque (VC). Cependant, si vous observez un échantillon d’investissements VC et constatez des montants moyens légèrement différents, est‑il raisonnable de supposer que cette différence est statistiquement significative ? C’est une situation idéale pour une ANOVA. Toutefois, une condition clé de l’ANOVA est l’égalité des variances entre tous les groupes d’échantillons. Dans cet exercice, vous testerez cette hypothèse à l’aide du test de Levene d’égalité des variances.
Un DataFrame pandas des investissements de trois secteurs (Biotechnology, Enterprise Software et Health Care) a été chargé pour vous dans investments_df. Les packages pandas sous l’alias pd, NumPy sous l’alias np, Matplotlib sous l’alias plt, ainsi que le module stats de SciPy ont également été chargés.
Cet exercice fait partie du cours
Fondements de l’inférence en Python
Instructions
- Sélectionnez le financement pour chaque valeur de
marketindividuellement à partir deinvestments_dfen utilisant les noms de colonnes indiqués. - Réalisez des tests de Levene d’égalité des variances pour chaque paire de secteurs, dans l’ordre suivant : (i) Biotechnology et Enterprise Software, (ii) Biotechnology et Health Care, et (iii) Enterprise Software et Health Care, correspondant respectivement à
statistic1,statistic2etstatistic3. - Dans chaque cas, retournez un booléen indiquant si l’hypothèse nulle d’égalité des variances est rejetée.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Select each industry separately
biotech_df = ____
enterprise_df = ____
health_df = ____
# Conduct Levene tests for equal variance between funding_total_usd for all pairs of industries
statistic_1, p_value_1 = ____
statistic_2, p_value_2 = ____
statistic_3, p_value_3 = ____
# Print if the p-value is significant at the 5% level
print(____)
print(____)
print(____)