Aggregation durchführen
Nach kleineren Beratungsaufträgen für eine Bibliothek und einen E‑Book‑Händler hast du endlich dein erstes großes Market-Basket-Analysis-Projekt: Du berätst einen Online-Händler für ausgefallene Geschenkartikel bei Cross-Promotions. Da der Händler bisher noch nie eine Data Scientist beschäftigt hat, möchte er, dass du das Projekt damit beginnst, seine Transaktionsdaten zu erkunden. Er hat dich gebeten, eine Aggregation für alle signs im Datensatz durchzuführen und außerdem den Support für diese Kategorie zu berechnen. Beachte, dass pandas bereits als pd importiert wurde. Zusätzlich wurden die Daten im One‑Hot‑Encoding-Format als onehot importiert.
Diese Übung ist Teil des Kurses
Market Basket Analysis in Python
Anleitung zur Übung
- Wähle die Teilmenge der DataFrame-Spalten aus, die den String
signenthalten. - Gib den Support für
signsaus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Select the column headers for sign items
sign_headers = [i for i in onehot.columns if i.lower().find('sign')>=0]
# Select columns of sign items using sign_headers
sign_columns = onehot[____]
# Perform aggregation of sign items into sign category
signs = sign_columns.sum(axis = 1) >= 1.0
# Print support for signs
print('Share of Signs: %.2f' % ____.mean())