Mosaikdiagramm
Das im vorherigen Schritt erstellte Spine-Diagramm hilft dir, fehlende Datenmuster jeweils zwischen zwei Variablen zu untersuchen. Diese Idee wird für mehr Variablen zum Mosaikdiagramm verallgemeinert.
In dieser Übung erstellst du zunächst eine Dummy-Variable, die angibt, ob die Vereinigten Staaten an der Produktion des jeweiligen Films beteiligt waren. Dafür nutzt du die Funktion grepl(), die prüft, ob der als erstes Argument übergebene String im als zweites Argument übergebenen Objekt vorkommt. Anschließend zeichnest du ein Mosaikdiagramm, um zu sehen, ob das Geschlecht der porträtierten Person mit der Menge fehlender Daten zu den Einnahmen zusammenhängt – getrennt nach US- und Nicht-US-Filmen.
Die biopics-Daten sowie das Paket VIM sind bereits für dich geladen. Lass uns ein paar explorative Plots erstellen!
Hinweis: Es wurde eine proprietäre Funktion display_image() erstellt, die die Ausgabe der neuesten VIM -Version zurückgibt. Klappe unbedingt den Bereich HTML Viewer auf.
Diese Übung ist Teil des Kurses
Fehlende Daten mit Imputationen in R behandeln
Anleitung zur Übung
- Übergib die Daten
biopicsan diedplyr-Pipeline. - Erstelle eine Dummy-Variable
is_US_movie, dieTRUEist, wenncountryden String"US"enthält, und andernfallsFALSE. - Zeichne ein Mosaikdiagramm, das die Menge fehlender Daten in
"earnings"zeigt, aufgeteilt nach"is_US_movie"und"sub_sex". Denk daran, die Variablennamen als Strings zu übergeben.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Prepare data for plotting and draw a mosaic plot
___ %>%
# Create a dummy variable for US-produced movies
mutate(is_US_movie = grepl(___, ___)) %>%
# Draw mosaic plot
mosaicMiss(highlight = ___,
plotvars = c(___, ___))
# Return plot from latest VIM package - expand the HTML viewer section
display_image()