ComeçarComece gratuitamente

Bloqueio de dados experimentais

Você está trabalhando com uma empresa de manufatura que deseja realizar alguns experimentos sobre a produtividade dos funcionários. Seu conjunto de dados contém apenas 100 linhas, portanto, é importante que os grupos experimentais sejam equilibrados.

Essa parece ser uma ótima oportunidade para você usar seu conhecimento de bloqueio para ajudá-los. Eles forneceram um productivity_subjects DataFrame. Divida o conjunto de dados fornecido em dois grupos iguais de 50 entradas cada.

As bibliotecas numpy e pandas foram importadas como np e pd, respectivamente.

Este exercício faz parte do curso

Projeto experimental em Python

Ver Curso

Instruções de exercício

  • Selecione aleatoriamente 50 indivíduos do DataFrame productivity_subjects em um novo DataFrame block_1 sem substituição.
  • Defina uma nova coluna, block, como 1 para o DataFrame block_1.
  • Atribua os assuntos restantes a um DataFrame chamado block_2 e defina a coluna block como 2 para esse DataFrame.
  • Concatene os blocos em um único DataFrame e imprima a contagem de cada valor na coluna block para confirmar que o bloqueio funcionou.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Randomly assign half
block_1 = productivity_subjects.____(____, random_state=42, ____)

# Set the block column
block_1['block'] = ____

# Create second assignment and label
block_2 = ____
block_2['block'] = ____

# Concatenate and print
productivity_combined = pd.____([block_1, block_2], axis=0)
print(productivity_combined['block'].value_counts())
Editar e executar código