Impact van features op clusterkwaliteit

Onderzoek hoe individuele features de clusteringprestatie van een KMeans-model beïnvloeden. De gegevensset X wordt gebruikt voor klantsegmentatie op basis van drie features: inkomen, aantal kinderen en aantal tieners in huis.

De functie silhouette_score en de variabele column_names zijn alvast voor je ingeladen.

Deze oefening maakt deel uit van de cursus

Explainable AI in Python

Oefeninstructies

Bepaal de oorspronkelijke silhouette score (original_score).
Verwijder in de for-lus de features één voor één en sla het resultaat op in X_reduced.
Bereken de nieuwe silhouette score (new_score).
Bereken de impact van de feature.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

kmeans = KMeans(n_clusters=5, random_state=10, n_init=10).fit(X)
# Derive the original silhouette score
original_score = ____

for i in range(X.shape[1]):
  	# Remove feature at index i
    X_reduced = ____
    kmeans.fit(X_reduced)
    # Compute the new silhouette score
    new_score = ____
    # Compute the feature's impact
    impact = ____
    print(f'Feature {column_names[i]}: Impact = {impact}')

Code bewerken en uitvoeren

Deze oefening maakt deel uit van de cursus

Explainable AI in Python

SkillTag.level.intermediateSkillTag.label

4.8+

Begin gratis met de cursus

Begin je traject met de basisconcepten van Explainable AI. Leer hoe je beslisregels uit beslisbomen haalt. Bepaal en visualiseer feature-importance met lineaire en boomgebaseerde modellen om inzicht te krijgen in hoe deze modellen voorspellingen doen, wat zorgt voor transparantere besluitvorming.

Exercise 1: Introductie tot explainable AI Exercise 2: Decision trees vs. neural networks Exercise 3: Model-agnostisch vs. model-specifieke uitlegbaarheid Exercise 4: Verklaarbaarheid in lineaire modellen Exercise 5: De impact van features berekenen met lineaire regressie Exercise 6: De impact van features berekenen met logistic regression Exercise 7: Verklaarbaarheid in boomgebaseerde modellen Exercise 8: Feature-importance berekenen met beslisbomen Exercise 9: Feature-importance berekenen met random forests

Ontgrendel de kracht van model-onafhankelijke technieken om de invloed van features over verschillende modellen te bepalen. Gebruik permutation importance en SHAP-waarden om te analyseren hoe features het modelgedrag beïnvloeden. Verken SHAP-visualisatietools om uitlegbaarheidsconcepten begrijpelijker te maken.

Exercise 1: Permutation importance Exercise 2: Permutation importance voor MLPClassifier Exercise 3: Coëfficiënten vs. permutation importance Exercise 4: SHAP-uitlegbaarheid Exercise 5: Belangrijkste voorspellers van medische kosten vinden met SHAP Exercise 6: Belangrijkste voorspellers van hartziekte vinden met SHAP Exercise 7: SHAP kernel-explainer Exercise 8: Kernel-explainer voor MLPRegressor Exercise 9: Kernel-explainer voor MLPClassifier Exercise 10: SHAP vs. model-specifieke benaderingen Exercise 11: SHAP-uitlegbaarheid visualiseren Exercise 12: Feature-importanceplots voor toelatingsanalyse Exercise 13: Feature-effecten analyseren met beeswarm-plots Exercise 14: Impact beoordelen met partial dependence-plots

Duik in lokale uitlegbaarheid en leg individuele voorspellingen uit. Leer SHAP in te zetten voor lokale uitlegbaarheid. Beheers LIME om de specifieke factoren achter afzonderlijke uitkomsten te onthullen, of het nu gaat om tekst-, tabel- of beeldgegevens.

Exercise 1: Lokale uitlegbaarheid met SHAP Exercise 2: Globale vs. lokale uitlegbaarheid Exercise 3: SHAP voor het uitleggen van inkomensniveaus Exercise 4: Lokale uitlegbaarheid met LIME Exercise 5: Regressors lokaal interpreteren Exercise 6: Classifiers lokaal interpreteren Exercise 7: Uitlegbaarheid van tekst en afbeeldingen met LIME Exercise 8: Uitleggen van sentimentanalyse-voorspellingen Exercise 9: Voedselvoorspellingen voor afbeeldingen verklaren

Verken geavanceerde onderwerpen in Explainable AI door modelgedrag en de effectiviteit van uitlegmethoden te beoordelen. Word vaardig in het evalueren van de consistentie en betrouwbaarheid (faithfulness) van uitleg, verdiep je in ongecontroleerde modelanalyse en leer het redeneerproces van generatieve AI-modellen zoals ChatGPT te verduidelijken. Rust jezelf uit met technieken om uitlegbaarheid in complexe AI-systemen te meten en te verbeteren.

Exercise 1: Explainability-metrieken Exercise 2: Consistentie van SHAP-verklaringen beoordelen Exercise 3: Faithfulness evalueren met LIME Exercise 4: Uitleggen van niet-gecontroleerde modellen Exercise 5: Impact van features op clusterkwaliteit

Huidige oefening

Exercise 6: Featurebelang bij clusteren met ARI Exercise 7: Uitleggen van chatgebaseerde generatieve AI-modellen Exercise 8: Chain-of-thought om redenering te achterhalen Exercise 9: Self-consistency om vertrouwen te meten Exercise 10: Gefeliciteerd