1. 학습
  2. /
  3. 강의
  4. /
  5. R 데이터 가져오기 중급

Connected

연습 문제

foreign으로 STATA 데이터 가져오기 (2)

데이터는 문자 벡터부터 범주형 변수, 날짜 등 매우 다양할 수 있어요. 이런 경우에 read.dta()의 추가 인수가 유용합니다.

가장 자주 사용하게 될 인수는 convert.dates, convert.factors, missing.type, convert.underscore입니다. 의미는 Filip이 영상에서 설명했듯 비교적 직관적이에요. 핵심은 STATA 데이터를 표준 R 데이터 구조로 올바르게 변환하는 것입니다. 기본값을 확인하려면 ?read.dta를 입력해 보세요.

이번 연습 문제의 데이터셋은 서로 다른 개인들의 사회경제적 지표와 교육 접근성을 담고 있습니다(출처: World Bank). 이 데이터는 작업 디렉터리의 worldbank 폴더에 있는 edequality.dta로 제공됩니다.

지침

100 XP
  • file.path()를 사용해 파일 경로를 지정하고, 이를 path라고 하세요. "edequality.dta" 파일은 "worldbank" 폴더에 있음을 기억하세요.
  • path 변수를 사용해 세 가지 방식으로 데이터를 가져오고, 매번 str()로 구조를 확인하세요:
  • edu_equal_1: 파일 path만 read.dta()에 전달합니다.
  • edu_equal_2: 파일 path를 전달하고, convert.factors를 FALSE로 설정합니다.
  • edu_equal_3: 파일 path를 전달하고, convert.underscore를 TRUE로 설정합니다.