1. 학습
  2. /
  3. 강의
  4. /
  5. R 중급 회귀

Connected

연습 문제

누적분포함수

로지스틱 분포를 이해하는 것은 로지스틱 회귀를 이해하는 데 핵심이에요. 정규(가우시안) 분포처럼, 하나의 연속형 변수에 대한 확률분포입니다. 여기서는 로지스틱 분포의 누적분포함수(CDF)를 시각화해 볼 거예요. 즉, 로지스틱 분포를 따르는 변수 x와, x가 가질 수 있는 값 xval이 있을 때, CDF는 x가 xval보다 작을 확률을 나타냅니다.

로지스틱 분포의 CDF는 로지스틱 함수로 계산합니다(이름의 유래이기도 하죠). 그 그래프는 S자 모양으로, 시그모이드 곡선이라고도 합니다. 이 함수의 중요한 성질은 입력으로 마이너스 무한대부터 플러스 무한대까지 어떤 값이든 받을 수 있고, 출력은 0과 1 사이의 값이 된다는 점입니다.

ggplot2는 로드되어 있습니다.

지침 1/2

undefined XP
    1
    2

세 개의 열을 포함한 티블을 생성하세요.

  • x 값은 -10부터 10까지 0.1 간격의 시퀀스.
  • 로지스틱 분포 CDF로 x를 변환해 만든 logistic_x.
  • 식 $cdf(x) = \frac{1}{(1 + exp(-x))}$으로 계산한 로지스틱 함수로 x를 변환해 만든 logistic_x_man.
  • 두 로지스틱 변환(logistic_x와 logistic_x_man)이 같은 값을 갖는지 all.equal()로 확인하세요.