1. 학습
  2. /
  3. 강의
  4. /
  5. 엔드 투 엔드 Machine Learning

Connected

연습 문제

데이터셋 정리하기

심장병 데이터셋처럼 실제 데이터셋은 중복값이나 결측값이 섞여 지저분한 경우가 많습니다. 이번 연습 문제에서는 이 장에서 배운 내용을 활용해 심장병 데이터셋을 정리해 보겠습니다. 데이터셋은 이미 로드되어 있습니다. 여러분의 과제는 EDA 결과를 바탕으로 일반적인 정리 작업을 식별하고 수행하는 것입니다: 빈 열을 제거하고, 중복 행을 삭제하며, 심전도 측정과 관련된 restecg 열에 대해 결측값 대치를 수행하세요. Pandas는 pd로 임포트되어 있으며, 심장병 데이터셋은 heart_disease_df라는 pandas DataFrame에 저장되어 있습니다.

지침 1/4

undefined XP
    1
    2
    3
    4
  • 비어 있는 "oldpeak" 열을 제거하세요.