1. Nauka
  2. /
  3. Kursy
  4. /
  5. Projektowanie eksperymentów w R

Connected

ćwiczenie

EDA zbioru NHANES

Przyjrzyjmy się nowo utworzonemu zbiorowi danych z myślą o eksploracyjnej analizie danych (EDA). Podobnie jak w poprzednim rozdziale, warto spojrzeć zarówno na liczbowe miary podsumowujące, jak i na wizualizacje. Pomagają one lepiej zrozumieć dane i pozwalają wychwycić kroki czyszczenia, które mogły umknąć wcześniej. Zbiór danych nhanes_combined jest już wczytany.

Załóżmy, że mamy dostęp do pacjentów z badania NHANES i chcemy przeprowadzić badanie dotyczące wpływu zalecenia lekarskiego dotyczącego ograniczenia kalorii lub tłuszczu w diecie na masę ciała. To nasze leczenie – przyjmujemy, że zamiast pytać pacjenta, losowo przydzielamy lekarzy do udzielania porad żywieniowych wybranym pacjentom. Podejrzewamy jednak, że masa ciała może się różnić w zależności od płci pacjenta – jest to czynnik blokujący!

Instrukcje

100 XP
  • Uzupełnij i uruchom kod dplyr, aby wyznaczyć średnią masę ciała (bmxwt) w kilogramach według naszego leczenia (mcq365d). Czy pacjenci z wartością NA mają w sobie coś interesującego?
  • Uzupełnij kod ggplot2, aby wyświetlić wykres pudełkowy (boxplot) rozstępu ćwiartkowego (IQR) masy ciała pacjentów według zmiennej leczenia.