1. 학습
  2. /
  3. 강의
  4. /
  5. Julia로 하는 데이터 조작

Connected

연습 문제

그룹별 중앙값으로 rating 대체하기

이전 연습 문제에서는 rating 열의 누락값을 열의 중앙값으로 대체했어요. 그런데 더 잘할 수 있을까요? 물론이죠! 같은 회사의 초콜릿에 대한 중앙값으로 누락값을 대체할 수 있어요. 함께 해볼까요?

미리 정의된 replace_missing() 함수가 있으며, DataFrame group과 열 이름 col 두 인수를 받아요. 이 함수는 col 열의 중앙값 계산을 시도하고, 성공하면 그 값을 반환해요. 값이 전혀 없어 중앙값을 계산할 수 없는 경우처럼 계산에 실패하면, 미리 정의된 값을 반환해요.

chocolates 데이터셋과 DataFrames, Statistics 패키지는 이미 불러와 두었어요.

지침

100 XP
  • company를 기준으로 chocolates를 그룹화하고, GroupedDataFrame을 순회하세요.
  • 각 그룹에서 rating 열에 대해 ismissing()을 사용해 누락값을 부분 선택하고, 해당 값을 replace_missing() 함수가 반환하는 값으로 대체하세요.