LoslegenKostenlos loslegen

Mosaikdiagramm

Das im vorherigen Schritt erstellte Spine-Diagramm hilft dir, fehlende Datenmuster jeweils zwischen zwei Variablen zu untersuchen. Diese Idee wird für mehr Variablen zum Mosaikdiagramm verallgemeinert.

In dieser Übung erstellst du zunächst eine Dummy-Variable, die angibt, ob die Vereinigten Staaten an der Produktion des jeweiligen Films beteiligt waren. Dafür nutzt du die Funktion grepl(), die prüft, ob der als erstes Argument übergebene String im als zweites Argument übergebenen Objekt vorkommt. Anschließend zeichnest du ein Mosaikdiagramm, um zu sehen, ob das Geschlecht der porträtierten Person mit der Menge fehlender Daten zu den Einnahmen zusammenhängt – getrennt nach US- und Nicht-US-Filmen.

Die biopics-Daten sowie das Paket VIM sind bereits für dich geladen. Lass uns ein paar explorative Plots erstellen!

Hinweis: Es wurde eine proprietäre Funktion display_image() erstellt, die die Ausgabe der neuesten VIM -Version zurückgibt. Klappe unbedingt den Bereich HTML Viewer auf.

Diese Übung ist Teil des Kurses

Fehlende Daten mit Imputationen in R behandeln

Kurs anzeigen

Anleitung zur Übung

  • Übergib die Daten biopics an die dplyr-Pipeline.
  • Erstelle eine Dummy-Variable is_US_movie, die TRUE ist, wenn country den String "US" enthält, und andernfalls FALSE.
  • Zeichne ein Mosaikdiagramm, das die Menge fehlender Daten in "earnings" zeigt, aufgeteilt nach "is_US_movie" und "sub_sex". Denk daran, die Variablennamen als Strings zu übergeben.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Prepare data for plotting and draw a mosaic plot
___ %>%
	# Create a dummy variable for US-produced movies
	mutate(is_US_movie = grepl(___, ___)) %>%
	# Draw mosaic plot
	mosaicMiss(highlight = ___, 
             plotvars = c(___, ___))

# Return plot from latest VIM package - expand the HTML viewer section
display_image()
Code bearbeiten und ausführen