1. Nauka
  2. /
  3. Kursy
  4. /
  5. Eksploracyjna analiza danych w R

Connected

ćwiczenie

Wykresy pudełkowe do wykrywania wartości odstających

Wykres pudełkowy nie tylko pokazuje środek i rozrzut rozkładu, ale też pozwala graficznie wykryć wartości odstające. Zastosuj tę metodę do kolumny msrp (sugerowana cena detaliczna producenta), aby sprawdzić, czy w zbiorze danych znajdują się wyjątkowo drogie lub tanie samochody.

Instrukcje

100 XP
  • Stwórz wykres pudełkowy zmiennej msrp.
  • Wyklucz 3–5 największych wartości odstających, filtrując wiersze tak, aby pozostały tylko samochody kosztujące mniej niż 100 000 USD. Zapisz ten okrojony zbiór danych jako cars_no_out.
  • Stwórz analogiczny wykres pudełkowy zmiennej msrp na podstawie okrojonego zbioru danych. Porównaj oba wykresy.