1. 학습
  2. /
  3. 강의
  4. /
  5. Python에서 결측치 다루기

Connected

연습 문제

선형 모델 요약 분석하기

서로 다른 방식으로 대치한 모델의 성능을 분석하는 일은 결측치 처리를 할 때 가장 중요한 작업 중 하나예요. 이 분석을 통해 어떤 유형의 대치된 DataFrame을 신뢰할 수 있는지 판단할 수 있습니다. 분석을 위해, 대치된 DataFrame에 선형 회귀 모델을 적합하고, 대치 방식 선택에 영향을 주는 다양한 지표를 확인할 수 있어요.

이번 연습에서는 당뇨 데이터의 완전 사례 DataFrame인 diabetes_cc가 이미 로드되어 있습니다. 완전 사례는 다른 대치된 DataFrame과 비교할 때 기준점 역할을 합니다. 선형 회귀 모델을 만들고 요약을 생성하기 위해 statsmodels.api 패키지를 sm으로 불러 사용합니다.

지침 1/4

undefined XP
    1
    2
    3
    4
  • DataFrame diabetes_cc에서 'Class' 열을 제외한 모든 특성에 상수를 추가해 X로 설정하고, 'Class' 열은 y로 설정하세요.