Gleiche Varianz
Verschiedene Branchen erhalten unterschiedlich viel Kapital von Venture-Capital-Investoren (VCs). Wenn du dir aber eine Stichprobe von VC-Investitionen ansiehst und leicht unterschiedliche durchschnittliche Investitionssummen findest, ist es dann plausibel, dass dieser Unterschied statistisch signifikant ist? Das ist ein idealer Anwendungsfall für ANOVA. Eine zentrale Voraussetzung für ANOVA ist jedoch die Varianzgleichheit zwischen allen Gruppen von Stichproben. In dieser Übung testest du das mit dem Levene-Test auf gleiche Varianzen.
Ein pandas-DataFrame mit Investitionen aus drei Branchen (Biotechnology, Enterprise Software und Health Care) wurde als investments_df für dich geladen. Die Pakete pandas als pd, NumPy als np, Matplotlib als plt und das stats-Paket aus SciPy sind ebenfalls geladen.
Diese Übung ist Teil des Kurses
Grundlagen der Inferenz in Python
Anleitung zur Übung
- Wähle die Finanzierung für jedes
marketeinzeln ausinvestments_dfaus, und zwar mit den angegebenen Spaltennamen. - Führe Levene-Tests auf Varianzgleichheit für jedes Branchenpaar in folgender Reihenfolge durch: (i) Biotechnology und Enterprise Software, (ii) Biotechnology und Health Care und (iii) Enterprise Software und Health Care. Weise die Ergebnisse den Variablen
statistic1,statistic2undstatistic3zu. - Gib in jedem Fall einen Boolean zurück, der angibt, ob die Nullhypothese gleicher Varianzen verworfen wird.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Select each industry separately
biotech_df = ____
enterprise_df = ____
health_df = ____
# Conduct Levene tests for equal variance between funding_total_usd for all pairs of industries
statistic_1, p_value_1 = ____
statistic_2, p_value_2 = ____
statistic_3, p_value_3 = ____
# Print if the p-value is significant at the 5% level
print(____)
print(____)
print(____)