1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do wizualizacji danych z ggplot2

Connected

ćwiczenie

Nadmierne nakładanie punktów 4: dane całkowite

Przyjrzyjmy się ostatniemu przypadkowi radzenia sobie z nadmiernym nakładaniem punktów:

  1. Dane całkowite

Mogą to być zmienne typu integer (czyli 1, 2, 3…) lub kategoryczne (czyli klasy factor). factor to po prostu specjalna klasa typu integer.

Zazwyczaj mamy do czynienia z niewielką, określoną liczbą przecięć między dwiema zmiennymi – to sytuacja podobna do przypadku 3. Łatwo jednak przeoczyć ten problem, jeśli nie zdajemy sobie sprawy, że dane całkowite i czynnikowe są równoważne danym o niskiej precyzji.

Zbiór danych Vocab zawiera informacje o latach edukacji oraz wynikach testów słownikowych respondentów z amerykańskich ogólnych badań społecznych przeprowadzonych w latach 1972–2004.

Instrukcje 1/4

undefined XP
  • 1
    • Zbadaj zbiór danych Vocab przy użyciu funkcji str().
    • Korzystając z Vocab, narysuj wykres vocabulary względem education.
    • Dodaj warstwę punktów.
  • 2
    • Zastąp warstwę punktów warstwą jitter.
  • 3
    • Ustaw przezroczystość warstwy jitter na 0.2.
  • 4
    • Ustaw kształt rozrzuconych punktów na puste okręgi (kształt 1).