Effectgrootte voor gemiddelden
Veel door venture capital gesteunde bedrijven krijgen meer dan één financieringsronde. Over het algemeen is de tweede ronde groter dan de eerste. Hoeveel invloed heeft het rondenummer op het gemiddelde financieringsbedrag? Je kunt Cohen's d gebruiken om dit te kwantificeren.
Onthoud dat je, om Cohen's d te berekenen, eerst de gepoolde standaarddeviatie moet bepalen. Die wordt gegeven door de formule

Cohen's d wordt vervolgens gegeven door:

Een DataFrame met venture-capitalinvesteringen (investments_df) is voor je geladen, net als de pakketten pandas als pd, NumPy als np en stats uit SciPy. De kolom funding_total_usd laat de totale financiering in die ronde zien.
Deze oefening maakt deel uit van de cursus
Basis van inferentie in Python
Oefeninstructies
- Filter
investments_dfomfunding_rounds1 en 2 afzonderlijk te selecteren. - Bereken de standaarddeviatie en steekproefgrootte van elke ronde.
- Bereken de gepoolde standaarddeviatie tussen de twee rondes.
- Bereken Cohen's d met de termen die je zojuist hebt bepaald.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Select all investments from rounds 1 and 2 separately
round1_df = investments_df[____['funding_rounds'] == ____]
round2_df = investments_df[____['funding_rounds'] == ____]
# Calculate the standard deviation of each round and the number of companies in each round
round1_sd = ____.std()
round2_sd = ____.std()
round1_n = ____.shape[0]
round2_n = ____.shape[0]
# Calculate the pooled standard deviation between the two rounds
pooled_sd = np.sqrt(((____ - 1) * ____ ** 2 + (____ - 1) *____ ** 2) / (____ + ____ - 2))
# Calculate Cohen's d
d = (____.mean() - ____.mean()) / ____