Deneysel verilerde bloklama
Bir üretim firmasıyla çalışıyorsun ve işçi verimliliği üzerine bazı deneyler yapmak istiyorlar. Veri kümeleri yalnızca 100 satır içeriyor, bu yüzden deney gruplarının dengeli olması önemli.
Bu, bloklama bilgisini kullanarak onlara yardımcı olmak için harika bir fırsat. Sana bir productivity_subjects DataFrame'i sağladılar. Verilen veri setini, her biri 50 kayıttan oluşan iki eşit gruba ayır.
numpy ve pandas kütüphaneleri sırasıyla np ve pd olarak içe aktarılmıştır.
Bu egzersiz
Python ile Deney Tasarımı
kursunun bir parçasıdırEgzersiz talimatları
productivity_subjectsDataFrame'inden rastgele 50 deneği, yerine koymadan, yeni bir DataFrame olanblock_1içine seç.block_1DataFrame'i için yeni bir sütun olanblockdeğerini 1 olarak ayarla.- Kalan denekleri
block_2adlı bir DataFrame'e ata ve bu DataFrame içinblocksütununu 2 olarak ayarla. - Blokları tek bir DataFrame'de birleştir ve bloklamanın çalıştığını doğrulamak için
blocksütunundaki her değerin sayısını yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Randomly assign half
block_1 = productivity_subjects.____(____, random_state=42, ____)
# Set the block column
block_1['block'] = ____
# Create second assignment and label
block_2 = ____
block_2['block'] = ____
# Concatenate and print
productivity_combined = pd.____([block_1, block_2], axis=0)
print(productivity_combined['block'].value_counts())