1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Eksploracyjna analiza danych w R

Connected

Bài tập

Identyfikowanie wartości odstających

Przyjrzyj się rozkładowi oczekiwanej długości życia w krajach azjatyckich, pokazanemu na wykresie. Wykres pudełkowy wyraźnie wskazuje jedną wartość odstającą: kraj o wyjątkowo niskiej oczekiwanej długości życia. Czy masz pomysł, o który kraj chodzi? Sprawdź swój typ w konsoli, używając funkcji min() lub filter(), a następnie przystąp do tworzenia wykresu z pominięciem tego kraju.

Hướng dẫn

100 XP

gap2007 jest nadal dostępny w twoim środowisku pracy.

  • Zastosuj filtr tak, aby zbiór danych zawierał tylko obserwacje z Azji, a następnie utwórz nową zmienną is_outlier, która przyjmuje wartość TRUE dla krajów z oczekiwaną długością życia poniżej 50. Wynik przypisz do gap_asia.
  • Odfiltruj gap_asia, usuwając wszystkie wartości odstające, a następnie utwórz kolejny wykres pudełkowy dla pozostałych wartości oczekiwanej długości życia.