1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. Python으로 배우는 Generalized Linear Models

Connected

अभ्यास

데이터 유형과 분포 계열

이 레슨에서는 일반화 선형 모형(GLM)으로 모형화할 수 있는 다양한 데이터 유형을 배웠습니다. 이번 연습 문제에서는 이러한 데이터 유형을 복습하고, GLM 적합에 알맞은 분포 계열을 적용해 보세요.

निर्देश 1/3

undefined XP
    1
    2
    3

प्रश्न

뉴욕시 브루클린 브리지의 자전거 통과 횟수를 일일 기온을 바탕으로 예측하려는 연구를 생각해 봅시다.

변수를 담고 있는 데이터셋 bike의 상위 다섯 행을 콘솔에서 확인하세요. 이를 위해 pandas의 head() 함수를 사용할 수 있어요.

모형 학습에 필요한 변수를 데이터에서 찾을 수 있습니다. 필요한 두 변수는 다음과 같습니다.

  1. Brooklyn_B: 브루클린 브리지를 지나는 자전거 통과 횟수
  2. Avg_Temp: 뉴욕시의 일일 평균 기온

산점도로 데이터를 시각화하면 다음과 같습니다.

GLM을 적합하기로 결정했습니다. 이제 반응 변수인 자전거 통과 횟수를 고려할 때, GLM을 적합하기 위해 어떤 분포 계열을 선택하시겠습니까?

संभावित उत्तर