ANOVA
Nu je met een Levene-test gelijke variantie hebt vastgesteld en visueel de benaderende normaliteit van de log-getransformeerde salarissen hebt beoordeeld, is het tijd voor een ANOVA-test! Onthoud dat het doel van de ANOVA-test is om te bepalen of biotech-, enterprise software- en zorgbedrijven een gelijk gemiddeld financieringsbedrag hadden. Omdat deze drie groepen voldoen aan de voorwaarden van een ANOVA-test, weet je dat de conclusies uit die test geldig zijn.
De DataFrames die je hebt gemaakt (biotech_df, enterprise_df en health_df) zijn voor je ingeladen. De pakketten pandas als pd, NumPy als np, Matplotlib als plt en het stats-pakket van SciPy zijn ook al geladen. De log-transformaties van de financieringswaarden die je in een eerdere oefening hebt berekend, zijn voor je beschikbaar gesteld.
Deze oefening maakt deel uit van de cursus
Basis van inferentie in Python
Oefeninstructies
- Voer een one-way ANOVA-test uit met elk van de drie log-getransformeerde financieringen in de volgende argumentvolgorde: Biotechnology, Enterprise Software, Health Care.
- Print of de p-waarde significant is op 5%.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
biotech_log_funding = np.log(biotech_df['funding_total_usd'])
enterprise_log_funding = np.log(enterprise_df['funding_total_usd'])
health_log_funding = np.log(health_df['funding_total_usd'])
# Conduct a one-way ANOVA test to compare the log-funding
s, p_value = ____
# Print if the p-value is significant at 5%
____