1. Nauka
  2. /
  3. Kursy
  4. /
  5. Projektowanie eksperymentów w R

Connected

ćwiczenie

Wizualizacja danych wyników SAT w Nowym Jorku

W poprzedniej lekcji, omawiając kwadraty łacińskie, przeprowadziliśmy numeryczną eksplorację danych (EDA), analizując średnie, wariancje i mediany wyników z matematyki w egzaminie SAT. Równie ważnym elementem EDA jest wizualizacja danych – często pomaga dostrzec wartości odstające i daje pogląd na rozkład zmiennych.

Biblioteka ggplot2 jest już wczytana, a zbiór danych nyc_scores jest dostępny. Utwórz i przeanalizuj wskazany wykres pudełkowy. Jak różnią się mediany w poszczególnych dzielnicach (Borough)? Ile jest wartości odstających i w których dzielnicach występują najczęściej?

Instrukcje

100 XP
  • Utwórz wykres pudełkowy wyników z matematyki w egzaminie SAT z podziałem na dzielnicę (Borough).
  • Uruchom kod, aby dodać tytuł: "Average SAT Math Scores by Borough, NYC".
  • Zmień etykiety osi x i y na "Borough (NYC)" oraz "Average SAT Math Scores (2014-15)", używając odpowiednich argumentów funkcji labs().