1. 학습
  2. /
  3. 강의
  4. /
  5. Python에서 결측치 다루기

Connected

연습 문제

더미 값 채우기

열들 사이에서 결측과 결측 사이의 관계를 살펴본 것처럼, 결측과 비결측 값 사이의 관계를 찾는 것도 중요해요. 이는 데이터의 결측이 생기는 요인을 파악하는 데 도움이 됩니다.

BMI vs Serum Insulin

위 그림을 보면, Serum Insulin의 결측값이 BMI 값 범위 전반에 걸쳐 흩어져 있음을 알 수 있어요. 이는 두 변수 간에 관계가 없다는 뜻입니다!

이번 연습 문제에서는 위와 같은 산점도를 만들 수 있도록 더미 값을 생성하는 함수를 작성할 거예요(다음 연습 문제에서 사용). 더미 값을 생성하는 과정은 임의의 값을 축척 비율로 스케일링해 열의 범위에 맞추고, 값을 이동(shifting)하는 것을 포함합니다.

numpy.random에서 rand() 함수가 미리 임포트되어 있어요.

지침 1/4

undefined XP
    1
    2
    3
    4
  • 열의 최댓값과 최솟값의 차이를 구해 열의 범위를 계산하세요.