1. 학습
  2. /
  3. 강의
  4. /
  5. Python에서의 앙상블 기법

Connected

연습 문제

UCI SECOM 데이터 탐색하기

이 장을 마무리하고 bagging에 대한 이해를 확실히 하기 위해, 이제 새로운 데이터셋으로 작업해 보겠습니다! 이 데이터는 UCI Machine Learning Repository에서 제공하는 반도체 제조 공정 데이터예요.

각 행은 하나의 생산 단위를 나타냅니다. 특성(feature)은 공정 내 센서 또는 측정 지점에서 얻은 값입니다. 레이블은 해당 단위가 테스트를 통과(1)했는지 실패(-1)했는지를 나타냅니다.

데이터셋은 uci_secom으로 로드되어 있습니다. target 변수는 'Pass/Fail' 열이에요. .value_counts()와 .describe() 메서드를 사용해 이 변수를 확인해 보세요. 무엇이 보이나요?

지침

50 XP

가능한 답변