Bloqueio de dados experimentais
Você está trabalhando com uma empresa de manufatura que deseja realizar alguns experimentos sobre a produtividade dos funcionários. Seu conjunto de dados contém apenas 100 linhas, portanto, é importante que os grupos experimentais sejam equilibrados.
Essa parece ser uma ótima oportunidade para você usar seu conhecimento de bloqueio para ajudá-los. Eles forneceram um productivity_subjects
DataFrame. Divida o conjunto de dados fornecido em dois grupos iguais de 50 entradas cada.
As bibliotecas numpy
e pandas
foram importadas como np
e pd
, respectivamente.
Este exercício faz parte do curso
Projeto experimental em Python
Instruções de exercício
- Selecione aleatoriamente 50 indivíduos do DataFrame
productivity_subjects
em um novo DataFrameblock_1
sem substituição. - Defina uma nova coluna,
block
, como 1 para o DataFrameblock_1
. - Atribua os assuntos restantes a um DataFrame chamado
block_2
e defina a colunablock
como 2 para esse DataFrame. - Concatene os blocos em um único DataFrame e imprima a contagem de cada valor na coluna
block
para confirmar que o bloqueio funcionou.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Randomly assign half
block_1 = productivity_subjects.____(____, random_state=42, ____)
# Set the block column
block_1['block'] = ____
# Create second assignment and label
block_2 = ____
block_2['block'] = ____
# Concatenate and print
productivity_combined = pd.____([block_1, block_2], axis=0)
print(productivity_combined['block'].value_counts())