1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Vizualizace dat v R – nejlepší postupy

Connected

Cvičení

KDE s velkým množstvím dat

Připravený kód vytvoří základní KDE hodnoty percentage_over_limit pro všechny záznamy. Na první pohled nastavení dává smysl – máme hodně dat, takže šířku přihrádky nastavíme pěkně úzce: jen jedno procento. Navíc je přidán koberec (rug plot) se sníženou průhledností alpha = 0.7.

Jakmile kód spustíš, hned uvidíš, že výsledný graf moc dobře nevypadá. Odhad hustoty připomíná ježka a koberec se kvůli obrovskému překryvu bodů jeví jako tlustá černá čára.

Oprav to tak, že šířku přihrádky zvýšíš na 2.5 a průhlednost alpha koberce snížíš na 0.05, aby byl překryv bodů alespoň trochu patrný. Nezapomeň také upravit podtitul grafu tak, aby odrážel novou šířku jádra!

Pokyny

100 XP
  • Změň směrodatnou odchylku jádra na 2.5
  • Nastav alpha koberce (rugplot) na 0.05
  • Změň subtitle na "Gaussian kernel SD = 2.5", aby odpovídal nové šířce jádra.