1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 선형 모델 입문

Connected

연습 문제

`statsmodels`로 최소제곱법

여러 Python 라이브러리는 모델 최적화의 내부 과정을 매번 직접 다루지 않아도 되도록 편리한 추상화 인터페이스를 제공합니다.

예를 들어, 이번 연습 문제에서는 statsmodels 라이브러리를 사용해 최소제곱 최적화(RSS 최소화)를 활용한 좀 더 고수준의 일반화된 워크플로로 모델을 구축해 보겠습니다.

시작을 돕기 위해 x_data, y_data = load_data()로 불러온 데이터를 미리 로드해 두었고, df = pd.DataFrame(dict(x_column=x_data, y_column=y_data))를 사용해 열 이름이 x_column, y_column인 pandas DataFrame에 저장해 두었습니다.

지침

100 XP
  • formula="y_column ~ x_column", data=df를 인수로 하는 ols()로 모델을 만들고, .fit()을 호출해 데이터에 적합하세요.
  • model_fit.predict()를 사용해 y_model 값을 구하세요.
  • 제공된 함수 plot_data_with_model()로 y_data와 y_model을 겹쳐서 그리세요.
  • model_fit.params에서 모델 파라미터 a0, a1 값을 추출하세요.
  • compute_rss_and_plot_fit()를 사용해 이 결과가 numpy로 구현된 해석적 공식과 일치하는지 확인하세요.