1. Nauka
  2. /
  3. Kursy
  4. /
  5. Najlepsze praktyki wizualizacji danych w R

Connected

ćwiczenie

KDE na dużym zbiorze danych

Dostarczony kod tworzy podstawowy wykres KDE zmiennej percentage_over_limit dla wszystkich cytatów. Na pierwszy rzut oka ustawienia wyglądają sensownie: mamy dużo danych, więc szerokość przedziału jest wąska – zaledwie jeden procent. Dodano też wykres rug z obniżoną przezroczystością alpha równą 0.7.

Po uruchomieniu kodu od razu widać, że wykres nie wygląda dobrze. Estymata gęstości przypomina jeżozwierza, a wykres rug wygląda jak gruby czarny pasek z powodu ogromnego nakładania się punktów.

Popraw to, zwiększając szerokość przedziału do 2.5 oraz obniżając alpha wykresu rug do 0.05, żeby lepiej uwidocznić zagęszczenie punktów. Pamiętaj, żeby zmienić podtytuł tak, aby odzwierciedlał nową szerokość jądra!

Instrukcje

100 XP
  • Zmień odchylenie standardowe jądra na 2.5
  • Ustaw alpha wykresu rug na 0.05
  • Zmień subtitle na "Gaussian kernel SD = 2.5", aby odzwierciedlał nową szerokość jądra.