Aan de slagGa gratis aan de slag

Zhang's metric toepassen

De oprichter van de ebook-start-up is terug voor extra advies. Ze heeft je een lijst met itemsets gestuurd die ze onderzoekt en vraagt je te bepalen of een van deze itemsets items bevat die gedissocieerd zijn. Als je klaar bent, vraagt ze je om de gebruikte metriek toe te voegen als een kolom aan de rules DataFrame, die al beschikbaar is en momenteel de kolommen antecedents en consequents bevat.

De itemsets zijn beschikbaar als een lijst van lijsten met de naam itemsets. Elke lijst bevat eerst de antecedent en daarna de consequent. Je hebt ook toegang tot de books DataFrame uit eerdere oefeningen. Merk op dat Zhang's metric al voor je is gedefinieerd en beschikbaar is als zhang(). Daarnaast is pandas beschikbaar als pd en numpy als np.

Deze oefening maakt deel uit van de cursus

Market Basket Analysis in Python

Cursus bekijken

Oefeninstructies

  • Loop over elke itemset in itemsets.
  • Haal voor elke itemset de kolommen voor antecedent en consequent uit books.
  • Maak de opdracht af en voeg het resultaat toe aan de lijst zhangs_metric.
  • Print de metriek voor elke itemset.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Define an empty list for Zhang's metric
zhangs_metric = []

# Loop over lists in itemsets
for itemset in ____:
    # Extract the antecedent and consequent columns
	antecedent = books[itemset[0]]
	consequent = ____[itemset[1]]
    
    # Complete Zhang's metric and append it to the list
	zhangs_metric.append(zhang(____, ____))
    
# Print results
rules['zhang'] = zhangs_metric
print(rules)
Code bewerken en uitvoeren