LoslegenKostenlos loslegen

Aggregation durchführen

Nach kleineren Beratungsaufträgen für eine Bibliothek und einen E‑Book‑Händler hast du endlich dein erstes großes Market-Basket-Analysis-Projekt: Du berätst einen Online-Händler für ausgefallene Geschenkartikel bei Cross-Promotions. Da der Händler bisher noch nie eine Data Scientist beschäftigt hat, möchte er, dass du das Projekt damit beginnst, seine Transaktionsdaten zu erkunden. Er hat dich gebeten, eine Aggregation für alle signs im Datensatz durchzuführen und außerdem den Support für diese Kategorie zu berechnen. Beachte, dass pandas bereits als pd importiert wurde. Zusätzlich wurden die Daten im One‑Hot‑Encoding-Format als onehot importiert.

Diese Übung ist Teil des Kurses

Market Basket Analysis in Python

Kurs anzeigen

Anleitung zur Übung

  • Wähle die Teilmenge der DataFrame-Spalten aus, die den String sign enthalten.
  • Gib den Support für signs aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Select the column headers for sign items
sign_headers = [i for i in onehot.columns if i.lower().find('sign')>=0]

# Select columns of sign items using sign_headers
sign_columns = onehot[____]

# Perform aggregation of sign items into sign category
signs = sign_columns.sum(axis = 1) >= 1.0

# Print support for signs
print('Share of Signs: %.2f' % ____.mean())
Code bearbeiten und ausführen