Merkmalswichtigkeit beim Clustering mit ARI

Nutze den Adjusted Rand Index (ARI), um quantitativ zu messen, wie sich das Entfernen der einzelnen Merkmale auf die Clusterzuordnung in dem Kundendatensatz auswirkt, mit dem du in der vorherigen Übung gearbeitet hast und der in X geladen wurde.

Die Funktion adjusted_rand_score() und die Variable column_names wurden bereits geladen.

Diese Übung ist Teil des Kurses

<Kurs>Erklärbare KI in Python</Kurs>

Übungsanweisungen

Leite die ursprünglichen Clusterzuordnungen in original_clusters ab.
Entferne in der for-Schleife ein Merkmal nach dem anderen und speichere das Ergebnis in X_reduced.
Leite reduced_clusters ab, indem du K-means auf X_reduced anwendest.
Berechne anhand von ARI die Merkmalswichtigkeit (importance) zwischen reduced_clusters und original_clusters.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

kmeans = KMeans(n_clusters=5, random_state=10, n_init=10).fit(X)
# Derive original clusters
original_clusters = ____

for i in range(X.shape[1]):
  	# Remove feature at index i
    X_reduced = ____
    # Derive reduced clusters
    reduced_clusters = ____
    # Derive feature importance
    importance = ____
    print(f'{column_names[i]}: {importance}')

Code bearbeiten und ausführen

Diese Übung ist Teil des Kurses

<Kurs>Erklärbare KI in Python</Kurs>

Mittlere SchwierigkeitSchwierigkeitsgrad

4.8+

Kurs kostenlos starten

Deine Wissensreise beginnt mit einer Einführung in die grundlegenden Konzepte der erklärbaren KI. Du lernst, wie man Entscheidungsregeln aus Entscheidungsbäumen extrahiert. Du erfährst auch, wie du die Wichtigkeit von Merkmalen mithilfe von linearen und baumbasierten Modellen ableiten und visualisieren kannst, um die Vorhersagen dieser Modelle besser zu verstehen und somit die Entscheidungsfindung transparenter zu gestalten.

Exercise 1: Einführung in erklärbare KI Exercise 2: Entscheidungsbäume vs. Neuronale Netze Exercise 3: Modellunabhängige vs. modellspezifische Erklärbarkeit Exercise 4: Erklärbarkeit in linearen Modellen Exercise 5: Berechnung des Einflusses von Merkmalen mit linearer Regression Exercise 6: Berechnung des Einflusses von Merkmalen mit logistischer Regression Exercise 7: Erklärbarkeit in baumbasierten Modellen Exercise 8: Berechnung der Merkmalswichtigkeit bei Entscheidungsbäumen Exercise 9: Berechnung der Merkmalswichtigkeit bei Random Forests

Verwende leistungsstarke und modellunabhängige Techniken, um den Einfluss von Merkmalen auf verschiedene Modelle zu bewerten. Beachte die Permutationswichtigkeit und analysiere mithilfe von SHAP-Werten, wie sich Merkmale auf das Modellverhalten auswirken. Teste SHAP-Visualisierungstools, um Erklärbarkeitskonzepte verständlicher zu machen.

Exercise 1: Permutationswichtigkeit Exercise 2: Permutationswichtigkeit für MLPClassifier Exercise 3: Koeffizienten vs. Permutationswichtigkeit Exercise 4: SHAP-Erklärbarkeit Exercise 5: Wichtige Prädiktoren für medizinische Kosten mit SHAP bestimmen Exercise 6: Wichtige Prädiktoren für Herzkrankheiten mit SHAP bestimmen Exercise 7: SHAP-KernelExplainer Exercise 8: KernelExplainer für MLPRegressor Exercise 9: KernelExplainer für MLPClassifier Exercise 10: SHAP vs. modellspezifische Ansätze Exercise 11: Visualisierung der SHAP-Erklärbarkeit Exercise 12: Diagramme mit Merkmalswichtigkeiten für eine Zulassungsanalyse Exercise 13: Analyse von Merkmalsauswirkungen mit Bienenschwarmdiagrammen Exercise 14: Bewertung von Auswirkungen mit Diagrammen zur partiellen Abhängigkeit

In diesem Kapitel befasst du dich mit der lokalen Erklärbarkeit und lernst, einzelne Modellvorhersagen zu analysieren. Außerdem nutzt du SHAP, um individuelle Prognosen zu erklären. Du arbeitest auch mit LIME, um spezifische Faktoren zu ermitteln, die einzelne Ergebnisse beeinflussen, sei es durch Text-, Tabellen- oder Bilddaten.

Exercise 1: Lokale Erklärbarkeit mit SHAP Exercise 2: Globale vs. lokale Erklärbarkeit Exercise 3: Erklärung des Einkommensniveaus mit SHAP Exercise 4: Lokale Erklärbarkeit mit LIME Exercise 5: Lokale Interpretation von Regressoren Exercise 6: Lokale Interpretation von Klassifikatoren Exercise 7: Erklärbarkeit von Text und Bildern mit LIME Exercise 8: Erklärung von vorhergesagten Stimmungsanalysen Exercise 9: Erklärung von vorhergesagten Essensbildern

Im letzten Kapitel geht es um fortgeschrittene Themen im Zusammenhang mit der Erklärbarkeit von KI. Du bewertest das Verhalten von Modellen und die Effektivität von Erklärungsmethoden. Du lernst, die Konsistenz und Zuverlässigkeit von Erklärungen zu beurteilen, arbeitest dich in die Analyse unüberwachter Modelle ein und widmest dich den Argumentationsprozessen von generativen KI-Modellen wie ChatGPT. Dabei eignest du dir Techniken an, mit denen du die Erklärbarkeit von komplexen KI-Systemen messen und verbessern kannst.

Exercise 1: Metriken zur Erklärbarkeit Exercise 2: Bewertung der Konsistenz von Erklärungen mit SHAP Exercise 3: Bewertung der Zuverlässigkeit von LIME Exercise 4: Erklärbarkeit bei unüberwachten Modellen Exercise 5: Auswirkungen der Merkmale auf die Cluster-Qualität Exercise 6: Merkmalswichtigkeit beim Clustering mit ARI

Aktuelle Übung

Exercise 7: Erklärbarkeit bei chatbasierten generativen KI-Modellen Exercise 8: Gedankenkette zur Herleitung einer Erklärung Exercise 9: Selbstkonsistenz zur Konfidenzbewertung Exercise 10: Glückwunsch!