1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do wizualizacji danych z ggplot2

Connected

ćwiczenie

Nadmierne nakładanie punktów 1: duże zbiory danych

Wykresy punktowe (tworzone za pomocą geom_point()) są intuicyjne, łatwe do zrozumienia i bardzo popularne – jednak zawsze należy brać pod uwagę nadmierne nakładanie punktów (overplotting), szczególnie w czterech sytuacjach:

  1. Duże zbiory danych
  2. Wyrównane wartości na jednej osi
  3. Dane o niskiej precyzji
  4. Dane całkowite

Zazwyczaj w przypadku wypełnionych kształtów zaleca się stosowanie mieszania alpha (czyli dodawania przezroczystości). Alternatywnie możesz użyć nieprzezroczystych, pustych kształtów.

Małe punkty sprawdzają się dobrze w dużych zbiorach danych z obszarami o wysokiej gęstości (gdzie punkty mocno się nakładają).

Przećwiczmy radzenie sobie z dużymi zbiorami danych na przykładzie zbioru diamonds.

Instrukcje 1/2

undefined XP
  • 1

    Dodaj warstwę punktów do bazowego wykresu.

    • Ustaw przezroczystość punktów na 0.5.
    • Ustaw shape = ".", czyli rozmiar punktu wynoszący 1 piksel.
  • 2

    Zaktualizuj kształt punktów, usuwając kontury, ustawiając shape na 16.