Vergleiche die Ergebnisse
Wir haben gesehen, dass ein Mischungsmodell (Mixture Model) jeder Beobachtung eine Wahrscheinlichkeit für die Zugehörigkeit zu jedem Cluster zuweist. Wenn du jedoch jede Beobachtung dem Cluster mit der höchsten Wahrscheinlichkeit zuordnen willst, kannst du die Funktion clusters() aus dem Paket flexmix verwenden.
Da der Datensatz mix_example eine Simulation ist, haben wir tatsächlich die echten Labels für jede Beobachtung. Diese stehen in der Variable assignment bereit. Ziel dieser Übung ist es, die durch die Funktion clusters() zugewiesenen Labels mit den echten Zuordnungen zu vergleichen.
Diese Übung ist Teil des Kurses
Mischungsmodelle in R
Anleitung zur Übung
- Untersuche die ersten sechs Elemente der Ausgabe von
clusters(). - Untersuche die ersten sechs Elemente der echten Labels.
- Verwende die Funktion
table(), um eine Häufigkeitstabelle zu erstellen, in der die Zeilen den echten Labels und die Spalten dem vorhergesagten Label entsprechen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Explore the first assignments
___(___(fit_mix_example))
# Explore the first real labels
___(mix_example$___)
# Create frequency table
___(___, clusters(fit_mix_example))