Mulai sekarangMulai gratis

Pemblokiran data eksperimen

Anda bekerja dengan sebuah perusahaan manufaktur yang ingin melakukan eksperimen terkait produktivitas pekerja. Himpunan data mereka hanya berisi 100 baris, sehingga penting untuk menjaga keseimbangan kelompok eksperimen.

Ini merupakan kesempatan yang baik untuk menggunakan pengetahuan Anda tentang pemblokiran guna membantu mereka. Mereka telah menyediakan DataFrame productivity_subjects. Bagi himpunan data yang diberikan menjadi dua kelompok yang seimbang, masing-masing berisi 50 entri.

Pustaka numpy dan pandas telah diimpor sebagai np dan pd.

Latihan ini merupakan bagian dari kursus

Perancangan Eksperimen dengan Python

Lihat Kursus

Instruksi latihan

  • Secara acak pilih 50 subjek dari DataFrame productivity_subjects ke dalam DataFrame baru block_1 tanpa pengembalian.
  • Atur kolom baru block menjadi 1 untuk DataFrame block_1.
  • Tempatkan sisa subjek ke dalam DataFrame bernama block_2 dan atur kolom block menjadi 2 untuk DataFrame ini.
  • Gabungkan kedua blok menjadi satu DataFrame, lalu cetak jumlah tiap nilai pada kolom block untuk memastikan pemblokiran berhasil.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Randomly assign half
block_1 = productivity_subjects.____(____, random_state=42, ____)

# Set the block column
block_1['block'] = ____

# Create second assignment and label
block_2 = ____
block_2['block'] = ____

# Concatenate and print
productivity_combined = pd.____([block_1, block_2], axis=0)
print(productivity_combined['block'].value_counts())
Edit dan Jalankan Kode