ComenzarEmpieza gratis

Bloqueo de datos experimentales

Estás trabajando con una empresa de fabricación que quiere realizar algunos experimentos sobre la productividad de los trabajadores. Su conjunto de datos sólo contiene 100 filas, por lo que es importante que los grupos experimentales estén equilibrados.

Esto parece una gran oportunidad de utilizar tus conocimientos de bloqueo para ayudarles. Han proporcionado un DataFrame productivity_subjects. Divide el conjunto de datos proporcionado en dos grupos pares de 50 entradas cada uno.

Las bibliotecas numpy y pandas se han importado como np y pd respectivamente.

Este ejercicio forma parte del curso

Diseño experimental en Python

Ver curso

Instrucciones de ejercicio

  • Selecciona aleatoriamente 50 sujetos del Marco de Datos productivity_subjects en un nuevo Marco de Datos block_1 sin reemplazo.
  • Establece una nueva columna, block a 1 para el DataFrame block_1.
  • Asigna los sujetos restantes a un Marco de Datos llamado block_2 y fija la columna block en 2 para este Marco de Datos.
  • Concatena los bloques en un único DataFrame, e imprime el recuento de cada valor en la columna block para confirmar que el bloqueo ha funcionado.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Randomly assign half
block_1 = productivity_subjects.____(____, random_state=42, ____)

# Set the block column
block_1['block'] = ____

# Create second assignment and label
block_2 = ____
block_2['block'] = ____

# Concatenate and print
productivity_combined = pd.____([block_1, block_2], axis=0)
print(productivity_combined['block'].value_counts())
Editar y ejecutar código