Pemblokiran data eksperimen
Anda bekerja dengan sebuah perusahaan manufaktur yang ingin melakukan eksperimen terkait produktivitas pekerja. Himpunan data mereka hanya berisi 100 baris, sehingga penting untuk menjaga keseimbangan kelompok eksperimen.
Ini merupakan kesempatan yang baik untuk menggunakan pengetahuan Anda tentang pemblokiran guna membantu mereka. Mereka telah menyediakan DataFrame productivity_subjects. Bagi himpunan data yang diberikan menjadi dua kelompok yang seimbang, masing-masing berisi 50 entri.
Pustaka numpy dan pandas telah diimpor sebagai np dan pd.
Latihan ini adalah bagian dari kursus
Perancangan Eksperimen dengan Python
Petunjuk latihan
- Secara acak pilih 50 subjek dari DataFrame
productivity_subjectske dalam DataFrame barublock_1tanpa pengembalian. - Atur kolom baru
blockmenjadi 1 untuk DataFrameblock_1. - Tempatkan sisa subjek ke dalam DataFrame bernama
block_2dan atur kolomblockmenjadi 2 untuk DataFrame ini. - Gabungkan kedua blok menjadi satu DataFrame, lalu cetak jumlah tiap nilai pada kolom
blockuntuk memastikan pemblokiran berhasil.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Randomly assign half
block_1 = productivity_subjects.____(____, random_state=42, ____)
# Set the block column
block_1['block'] = ____
# Create second assignment and label
block_2 = ____
block_2['block'] = ____
# Concatenate and print
productivity_combined = pd.____([block_1, block_2], axis=0)
print(productivity_combined['block'].value_counts())