Bloqueo de datos experimentales
Estás trabajando con una empresa de fabricación que quiere realizar algunos experimentos sobre la productividad de los trabajadores. Su conjunto de datos sólo contiene 100 filas, por lo que es importante que los grupos experimentales estén equilibrados.
Esto parece una gran oportunidad de utilizar tus conocimientos de bloqueo para ayudarles. Han proporcionado un DataFrame productivity_subjects
. Divide el conjunto de datos proporcionado en dos grupos pares de 50 entradas cada uno.
Las bibliotecas numpy
y pandas
se han importado como np
y pd
respectivamente.
Este ejercicio forma parte del curso
Diseño experimental en Python
Instrucciones de ejercicio
- Selecciona aleatoriamente 50 sujetos del Marco de Datos
productivity_subjects
en un nuevo Marco de Datosblock_1
sin reemplazo. - Establece una nueva columna,
block
a 1 para el DataFrameblock_1
. - Asigna los sujetos restantes a un Marco de Datos llamado
block_2
y fija la columnablock
en 2 para este Marco de Datos. - Concatena los bloques en un único DataFrame, e imprime el recuento de cada valor en la columna
block
para confirmar que el bloqueo ha funcionado.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Randomly assign half
block_1 = productivity_subjects.____(____, random_state=42, ____)
# Set the block column
block_1['block'] = ____
# Create second assignment and label
block_2 = ____
block_2['block'] = ____
# Concatenate and print
productivity_combined = pd.____([block_1, block_2], axis=0)
print(productivity_combined['block'].value_counts())