Estimadores no estándar
En el último ejercicio, ejecutaste un bootstrap sencillo que ahora vamos a modificar para estimadores más complejos.
Supón que estás estudiando la salud del alumnado. Tienes la estatura y el peso de 1000 estudiantes y te interesan la mediana de la estatura, así como la correlación entre estatura y peso, y el IC del 95% asociado a estas magnitudes. Vamos a usar bootstrapping.
Examina el DataFrame de pandas df con las estaturas y pesos de 1000 estudiantes. Usándolo, calcula el IC del 95% tanto para la estatura mediana como para la correlación entre estatura y peso.
Este ejercicio forma parte del curso
Simulación estadística en Python
Instrucciones del ejercicio
- Usa el método
.sample()sobredfpara generar una muestra de los datos con reemplazo y asígnala atmp_df. - Para cada conjunto de datos generado en
tmp_df, calcula la mediana de las estaturas y la correlación entre estaturas y pesos usando.median()y.corr(). - Añade las medianas de estatura a
height_mediansy la correlación ahw_corr. - Por último, calcula los intervalos de confianza del 95% (
[2.5, 97.5]) para cada una de las cantidades anteriores usandonp.percentile().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Sample with replacement and calculate quantities of interest
sims, data_size, height_medians, hw_corr = 1000, df.shape[0], [], []
for i in range(sims):
tmp_df = ____(n=____, replace=____)
height_medians.append(____)
hw_corr.append(____)
# Calculate confidence intervals
height_median_ci = np.____
height_weight_corr_ci = np.____
print("Height Median CI = {} \nHeight Weight Correlation CI = {}".format( height_median_ci, height_weight_corr_ci))