1. Nauka
  2. /
  3. Kursy
  4. /
  5. Projektowanie eksperymentów w R

Connected

ćwiczenie

Budowanie zbioru danych NHANES

Zbiory danych NHANES pobrane ze strony NHANES są dostępne wyłącznie jako osobne pliki .XPT – natywny format programu SAS. Na szczęście z pomocą przychodzi pakiet haven.

Połączymy ze sobą zbiory danych NHANES dotyczące danych demograficznych, schorzeń oraz pomiarów ciała. Są one dostępne w surowym formacie .XPT i można się do nich odwołać przez zmienne DEMO_file, MCQ_file i BMX_file. Połącz wszystkie 3 zbiory danych za pomocą zmiennej SEQN. Dobrym sposobem jest użycie funkcji Reduce(), która pozwala łączyć elementy w wygodny sposób.

Dostarczony kod łączący wykonuje następujące kroki:

  • Tworzy listę wszystkich 3 zbiorów danych (nhanes_demo, nhanes_medical, nhanes_bodymeasures).
  • Używa własnej funkcji wewnątrz Reduce(), aby wykonać złączenie wewnętrzne (inner join) wszystkich 3 zbiorów danych po zmiennej "SEQN".
  • Zapisuje wynik jako zbiór danych nhanes_combined.

Instrukcje

100 XP
  • Wczytaj pakiet haven.
  • Zaimportuj trzy pliki z danymi, wywołując read_xpt() osobno dla każdego z nich – przekaż kolejno DEMO_file, MCQ_file i BMX_file jako argumenty, a wyniki zapisz odpowiednio jako nhanes_demo, nhanes_medical i nhanes_bodymeasures.
  • Utwórz zbiór nhanes_combined, łącząc 3 właśnie zaimportowane zbiory danych za pomocą dostarczonego kodu.