1. Learn
  2. /
  3. Курси
  4. /
  5. Вступ до візуалізації даних з ggplot2

Connected

вправа

Накладання точок 1: великі набори даних

Діаграми розсіювання (з використанням geom_point()) інтуїтивні, легко сприймаються й дуже поширені, але ми маємо завжди зважати на надмірне накладання точок (overplotting), особливо в чотирьох випадках:

  1. Великі набори даних
  2. Значення, вирівняні по одній осі
  3. Дані з низькою точністю
  4. Цілі числові дані

Зазвичай для суцільних маркерів рекомендують застосовувати змішування alpha (тобто додавати прозорість). Як альтернатива — можна використовувати непрозорі порожнисті фігури.

Малі точки добре підходять для великих наборів даних із ділянками високої щільності (де багато перекриттів).

Скористаймося набором даних diamonds, щоб потренуватися працювати з випадком великого набору даних.

Інструкції 1/2

undefined XP
  • 1

    Додайте шар точок до базового графіка.

    • Встановіть прозорість точок на 0.5.
    • Встановіть shape = ".", розмір точки в 1 піксель.
  • 2

    Оновіть форму точки, щоб прибрати контурні лінії, встановивши shape на 16.