1. Învăţa
  2. /
  3. Courses
  4. /
  5. Python으로 연습하는 Machine Learning 면접 질문

Connected

exercise

필터와 래퍼 메서드

데이터셋의 차원을 줄이는 방법에 대한 질문은 Machine Learning 면접에서 매우 흔해요. 차원을 줄이는 한 가지 방법은 데이터셋에서 관련 있는 피처만 선택하는 것이죠.

여기서는 diabetes DataFrame에 대해 필터 메서드를 연습한 뒤, 교차 검증을 포함한 두 가지 스타일의 래퍼 메서드를 이어서 실습해 보겠습니다. 상관관계를 시각화하고, 데이터를 처리하며, 피처 선택 기법을 적용하기 위해 pandas, matplotlib.pyplot, seaborn을 사용해요.

타깃 변수 열(progression)을 제거한 피처 행렬은 X로, 타깃 변수는 y로 불러와져 있어요.

참고로 pandas, matplotlib.pyplot, seaborn은 이미 워크스페이스에 불러와 각각 pd, plt, sns로 별칭이 지정되어 있습니다.

파이프라인에 마지막 3단계에 적용되는 Cross-validate 단계를 추가했다는 점에 유의하세요:

Machine learning pipeline

Instrucțiuni 1 / 3

undefined XP
  • 1
    • diabetes로 상관계수 행렬과 heatmap을 만들고, 상관계수가 50%를 초과하는 피처만 서브셋으로 추려 보세요.
  • 2
    • 선형 커널 SVR 추정기와 5-겹 교차 검증을 사용하는 피처 선택기를 인스턴스화하고, 피처와 타깃에 fit 하세요.
  • 3
    • 2단계에서 중요하지 않다고 확인된 열을 X에서 제거하고, LarsCV 객체를 인스턴스화해 데이터에 fit 하세요.