LoslegenKostenlos loslegen

Der Resampling-Trade-off

Ein großes Tech-Unternehmen möchte Mitarbeiterfluktuation vorhersagen, um die Bindung zu verbessern. Allerdings haben nur 12 % der Mitarbeitenden das Unternehmen verlassen, sodass das Modell überwiegend mit "Bleibe"-Fällen (88 %) trainiert wird – das erschwert es, gefährdete Personen zu erkennen.

Um dieses Ungleichgewicht zu beheben, nutzen HR-Analysten synthetisches Resampling, um mehr "Wechsel"-Fälle zu erzeugen und die Daten auszugleichen.

Eine zentrale Anforderung: Das Modell soll loyale Mitarbeitende nicht fälschlicherweise als "Hochrisiko-Wechsler" klassifizieren, um unnötige Bindungsmaßnahmen zu vermeiden.

Das Modell wird bewertet anhand von:

  • Training accuracy: korrekte Vorhersagen auf den Trainingsdaten.
  • Test accuracy: korrekte Vorhersagen auf neuen Daten.
  • Precision: wie viele vorhergesagte Wechsler tatsächlich gewechselt haben.
Metric Model A (without resampling) Model B (with resampling)
Training accuracy 85% 95%
Test Accuracy 82% 85%
Precision 80% 68%

Diese Übung ist Teil des Kurses

Fortgeschrittene Wahrscheinlichkeitsrechnung: Unsicherheit in Daten

Kurs anzeigen

Interaktive Übung

In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.

Übung starten