LoslegenKostenlos starten

Aggregation durchführen

Nach kleineren Beratungsaufträgen für eine Bibliothek und einen E‑Book‑Händler hast du endlich dein erstes großes Market-Basket-Analysis-Projekt: Du berätst einen Online-Händler für ausgefallene Geschenkartikel bei Cross-Promotions. Da der Händler bisher noch nie eine Data Scientist beschäftigt hat, möchte er, dass du das Projekt damit beginnst, seine Transaktionsdaten zu erkunden. Er hat dich gebeten, eine Aggregation für alle signs im Datensatz durchzuführen und außerdem den Support für diese Kategorie zu berechnen. Beachte, dass pandas bereits als pd importiert wurde. Zusätzlich wurden die Daten im One‑Hot‑Encoding-Format als onehot importiert.

Diese Übung ist Teil des Kurses

<Kurs>Market Basket Analysis in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Wähle die Teilmenge der DataFrame-Spalten aus, die den String sign enthalten.
  • Gib den Support für signs aus.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Select the column headers for sign items
sign_headers = [i for i in onehot.columns if i.lower().find('sign')>=0]

# Select columns of sign items using sign_headers
sign_columns = onehot[____]

# Perform aggregation of sign items into sign category
signs = sign_columns.sum(axis = 1) >= 1.0

# Print support for signs
print('Share of Signs: %.2f' % ____.mean())
Code bearbeiten und ausführen