Featurebelang bij clusteren met ARI

Gebruik de Adjusted Rand Index (ARI) om kwantitatief te meten wat het effect is van het verwijderen van elke feature op de clusterindeling in de klantgegevensset waarmee je in de vorige oefening hebt gewerkt, al ingeladen in X.

De functie adjusted_rand_score() en de variabele column_names zijn al voor je ingeladen.

Deze oefening maakt deel uit van de cursus

Explainable AI in Python

Oefeninstructies

Bepaal de oorspronkelijke clusterindeling in original_clusters.
Verwijder in de for-lus features één voor één en sla het resultaat op in X_reduced.
Bepaal de reduced_clusters door K-means toe te passen op X_reduced.
Bereken het feature-importance op basis van de ARI tussen de reduced_clusters en de original_clusters.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

kmeans = KMeans(n_clusters=5, random_state=10, n_init=10).fit(X)
# Derive original clusters
original_clusters = ____

for i in range(X.shape[1]):
  	# Remove feature at index i
    X_reduced = ____
    # Derive reduced clusters
    reduced_clusters = ____
    # Derive feature importance
    importance = ____
    print(f'{column_names[i]}: {importance}')

Code bewerken en uitvoeren

Deze oefening maakt deel uit van de cursus

Explainable AI in Python

SkillTag.level.intermediateSkillTag.label

4.8+

Begin gratis met de cursus

Begin je traject met de basisconcepten van Explainable AI. Leer hoe je beslisregels uit beslisbomen haalt. Bepaal en visualiseer feature-importance met lineaire en boomgebaseerde modellen om inzicht te krijgen in hoe deze modellen voorspellingen doen, wat zorgt voor transparantere besluitvorming.

Exercise 1: Introductie tot explainable AI Exercise 2: Decision trees vs. neural networks Exercise 3: Model-agnostisch vs. model-specifieke uitlegbaarheid Exercise 4: Verklaarbaarheid in lineaire modellen Exercise 5: De impact van features berekenen met lineaire regressie Exercise 6: De impact van features berekenen met logistic regression Exercise 7: Verklaarbaarheid in boomgebaseerde modellen Exercise 8: Feature-importance berekenen met beslisbomen Exercise 9: Feature-importance berekenen met random forests

Ontgrendel de kracht van model-onafhankelijke technieken om de invloed van features over verschillende modellen te bepalen. Gebruik permutation importance en SHAP-waarden om te analyseren hoe features het modelgedrag beïnvloeden. Verken SHAP-visualisatietools om uitlegbaarheidsconcepten begrijpelijker te maken.

Exercise 1: Permutation importance Exercise 2: Permutation importance voor MLPClassifier Exercise 3: Coëfficiënten vs. permutation importance Exercise 4: SHAP-uitlegbaarheid Exercise 5: Belangrijkste voorspellers van medische kosten vinden met SHAP Exercise 6: Belangrijkste voorspellers van hartziekte vinden met SHAP Exercise 7: SHAP kernel-explainer Exercise 8: Kernel-explainer voor MLPRegressor Exercise 9: Kernel-explainer voor MLPClassifier Exercise 10: SHAP vs. model-specifieke benaderingen Exercise 11: SHAP-uitlegbaarheid visualiseren Exercise 12: Feature-importanceplots voor toelatingsanalyse Exercise 13: Feature-effecten analyseren met beeswarm-plots Exercise 14: Impact beoordelen met partial dependence-plots

Duik in lokale uitlegbaarheid en leg individuele voorspellingen uit. Leer SHAP in te zetten voor lokale uitlegbaarheid. Beheers LIME om de specifieke factoren achter afzonderlijke uitkomsten te onthullen, of het nu gaat om tekst-, tabel- of beeldgegevens.

Exercise 1: Lokale uitlegbaarheid met SHAP Exercise 2: Globale vs. lokale uitlegbaarheid Exercise 3: SHAP voor het uitleggen van inkomensniveaus Exercise 4: Lokale uitlegbaarheid met LIME Exercise 5: Regressors lokaal interpreteren Exercise 6: Classifiers lokaal interpreteren Exercise 7: Uitlegbaarheid van tekst en afbeeldingen met LIME Exercise 8: Uitleggen van sentimentanalyse-voorspellingen Exercise 9: Voedselvoorspellingen voor afbeeldingen verklaren

Verken geavanceerde onderwerpen in Explainable AI door modelgedrag en de effectiviteit van uitlegmethoden te beoordelen. Word vaardig in het evalueren van de consistentie en betrouwbaarheid (faithfulness) van uitleg, verdiep je in ongecontroleerde modelanalyse en leer het redeneerproces van generatieve AI-modellen zoals ChatGPT te verduidelijken. Rust jezelf uit met technieken om uitlegbaarheid in complexe AI-systemen te meten en te verbeteren.

Exercise 1: Explainability-metrieken Exercise 2: Consistentie van SHAP-verklaringen beoordelen Exercise 3: Faithfulness evalueren met LIME Exercise 4: Uitleggen van niet-gecontroleerde modellen Exercise 5: Impact van features op clusterkwaliteit Exercise 6: Featurebelang bij clusteren met ARI

Huidige oefening

Exercise 7: Uitleggen van chatgebaseerde generatieve AI-modellen Exercise 8: Chain-of-thought om redenering te achterhalen Exercise 9: Self-consistency om vertrouwen te meten Exercise 10: Gefeliciteerd