Overplotting 4: Ganzzahlige Daten
Werfen wir einen Blick auf den letzten Fall, in dem es um den Umgang mit Overplotting geht:
- Ganzzahlige Daten
Dies können Variablen vom Typ integer
(d. h. 1, 2, 3 …) oder kategorische Variablen (d. h. die Klasse factor
) sein. factor
ist nur eine spezielle Klasse vom Typ integer
.
Normalerweise gibt es eine kleine, definierte Anzahl von Überschneidungen zwischen zwei Variablen, die dem Fall 3 ähneln, aber du könntest sie übersehen, wenn du nicht weißt, dass Ganzzahl- und Faktor-Daten dasselbe sind wie Daten mit geringer Genauigkeit.
Der bereitgestellte Datensatz Vocab
enthält die Bildungsjahre und Vokabeltest-Ergebnisse von Befragten der US General Social Surveys von 1972–2004.
Diese Übung ist Teil des Kurses
Einführung in die Datenvisualisierung mit ggplot2
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Examine the structure of Vocab
___
# Plot vocabulary vs. education
___ +
# Add a point layer
___