Asignación no aleatoria de los sujetos
Una empresa agrícola está realizando un experimento para medir cómo afecta a su peso alimentar a las ovejas con distintos tipos de hierba. Te han pedido ayuda para montar adecuadamente el experimento. Uno de sus responsables ha dicho que puedes realizar la asignación de temas tomando las 250 filas superiores del DataFrame y que eso debería estar bien.
Tu tarea consiste en utilizar tu capacidad analítica para demostrar por qué esto podría no ser una buena idea. Asigna los sujetos a dos grupos mediante asignación no aleatoria (las 250 primeras filas) y observa las diferencias en los estadísticos descriptivos.
Has recibido el DataFrame, weights
que tiene una columna que contiene el weight
de la oveja y una columna única id
.
numpy
y pandas
se han importado como np
y pd
, respectivamente.
Este ejercicio forma parte del curso
Diseño experimental en Python
Instrucciones del ejercicio
- Utiliza DataFrame slicing para poner las 250 primeras filas de
weights
engroup1_non_rand
y las restantes engroup2_non_rand
. - Genera estadísticas descriptivas de los dos grupos y concaténalas en un único DataFrame.
- Imprímelo para observar las diferencias.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Non-random assignment
group1_non_rand = ____
group2_non_rand = ____
# Compare descriptive statistics of groups
compare_df_non_rand = ____([group1_non_rand['weight'].____, group2_non_rand['weight'].____], axis=1)
compare_df_non_rand.columns = ['group1', 'group2']
# Print to assess
print(____)