Mulai sekarangMulai gratis

Mendefinisikan fungsi agregasi

Terkejut dengan tingginya porsi item bertema tanda (sign) dalam inventarisnya, peritel memutuskan bahwa masuk akal untuk melakukan agregasi lebih lanjut untuk berbagai kategori agar dapat mengeksplorasi data dengan lebih baik. Ini terlihat sepele bagi Anda, tetapi peritel sebelumnya bahkan belum mampu melakukan analisis deskriptif dasar atas transaksinya dan itemnya.

Peritel meminta Anda melakukan agregasi untuk kategori candles, bags, dan boxes. Untuk menyederhanakan tugas, Anda memutuskan untuk menulis sebuah fungsi. Fungsi ini akan menerima string yang berisi kategori suatu item. Lalu fungsi akan menghasilkan sebuah DataFrame yang menunjukkan apakah setiap transaksi mencakup item dari kategori tersebut. Perhatikan bahwa pandas telah diimpor untuk Anda sebagai pd. Selain itu, data telah diimpor dalam format one-hot encoded sebagai onehot.

Latihan ini merupakan bagian dari kursus

Analisis Market Basket dengan Python

Lihat Kursus

Instruksi latihan

  • Lengkapi list comprehension yang mengekstrak subset header kolom.
  • Pilih kolom untuk item yang ingin Anda agregasikan.
  • Lakukan agregasi menggunakan fungsi aggregate() untuk bags, boxes, dan candles dengan menggunakan string bag, box, dan candle.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

def aggregate(item):
	# Select the column headers for sign items in onehot
	item_headers = [i for i in ____.columns if i.lower().find(item)>=0]

	# Select columns of sign items
	item_columns = onehot[____]

	# Return category of aggregated items
	return item_columns.sum(axis = 1) >= 1.0

# Aggregate items for the bags, boxes, and candles categories  
bags = aggregate('bag')
boxes = aggregate('____')
candles = ____
Edit dan Jalankan Kode