MulaiMulai sekarang secara gratis

Pemblokiran data eksperimen

Anda bekerja dengan sebuah perusahaan manufaktur yang ingin melakukan eksperimen terkait produktivitas pekerja. Himpunan data mereka hanya berisi 100 baris, sehingga penting untuk menjaga keseimbangan kelompok eksperimen.

Ini merupakan kesempatan yang baik untuk menggunakan pengetahuan Anda tentang pemblokiran guna membantu mereka. Mereka telah menyediakan DataFrame productivity_subjects. Bagi himpunan data yang diberikan menjadi dua kelompok yang seimbang, masing-masing berisi 50 entri.

Pustaka numpy dan pandas telah diimpor sebagai np dan pd.

Latihan ini adalah bagian dari kursus

Perancangan Eksperimen dengan Python

Lihat Kursus

Petunjuk latihan

  • Secara acak pilih 50 subjek dari DataFrame productivity_subjects ke dalam DataFrame baru block_1 tanpa pengembalian.
  • Atur kolom baru block menjadi 1 untuk DataFrame block_1.
  • Tempatkan sisa subjek ke dalam DataFrame bernama block_2 dan atur kolom block menjadi 2 untuk DataFrame ini.
  • Gabungkan kedua blok menjadi satu DataFrame, lalu cetak jumlah tiap nilai pada kolom block untuk memastikan pemblokiran berhasil.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Randomly assign half
block_1 = productivity_subjects.____(____, random_state=42, ____)

# Set the block column
block_1['block'] = ____

# Create second assignment and label
block_2 = ____
block_2['block'] = ____

# Concatenate and print
productivity_combined = pd.____([block_1, block_2], axis=0)
print(productivity_combined['block'].value_counts())
Edit dan Jalankan Kode