1. 학습
  2. /
  3. 강의
  4. /
  5. R 데이터 가져오기 중급

Connected

연습 문제

잠깐 탐구: 상관관계

통계에 익숙하시다면 Pearson 상관계수에 대해 들어보셨을 거예요. 이는 두 변수, 예를 들어 $X$와 \(Y\) 사이의 선형 종속성을 평가하는 지표입니다. 값의 범위는 -1에서 1까지이며, 1에 가까울수록 두 변수 간의 양의 연관성이 강하다는 뜻입니다. 즉, $X$가 크면 $Y$도 큰 경향이 있다는 의미예요. 반대로 -1에 가까우면 강한 음의 연관성이 있습니다: $X$가 크면 $Y$는 작은 경향이 있지요. 두 변수의 Pearson 상관계수가 0이면 두 변수가 독립적일 가능성이 있으며, $X$와 \(Y\) 사이에 뚜렷한 연관성이 없다는 뜻입니다.

두 벡터 사이의 상관관계는 cor() 함수로 계산할 수 있습니다. 예를 들어, 가상의 데이터 프레임 size의 height와 width 열 간 상관을 계산하는 코드는 다음과 같습니다:

cor(size$height, size$width)

이전 연습 문제에서 사용했던 international.sav 파일이 작업 디렉터리에 다시 준비되어 있습니다. 이제 이를 가져오고, 아래 질문에 답하기 위한 올바른 계산을 수행해 보세요:

두 수치형 변수 gdp와 f_illit(여성 문맹률)의 상관계수는 얼마인가요?

지침

50 XP

가능한 답변