Overplotting 4: Ganzzahlige Daten
Werfen wir einen Blick auf den letzten Fall, in dem es um den Umgang mit Overplotting geht:
- Ganzzahlige Daten
Dies können Variablen vom Typ integer
(d. h. 1, 2, 3 …) oder kategoriale Variablen (d. h. die Klasse factor
) sein. factor
ist nur eine spezielle Klasse vom Typ integer
.
Normalerweise gibt es eine kleine, definierte Anzahl von Überschneidungen zwischen zwei Variablen, die dem Fall 3 ähneln, aber du könntest sie übersehen, wenn du nicht weißt, dass Ganzzahl- und Faktor-Daten dasselbe sind wie Daten mit geringer Genauigkeit.
Der bereitgestellte Datensatz Vocab
enthält die Bildungsjahre und Vokabeltest-Ergebnisse von Befragten der US General Social Surveys aus den Jahren 1972-2004.
Diese Übung ist Teil des Kurses
Einführung in die Datenvisualisierung mit ggplot2
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Examine the structure of Vocab
___
# Plot vocabulary vs. education
___ +
# Add a point layer
___