1. 学ぶ
  2. /
  3. コース
  4. /
  5. 데이터 엔지니어링 입문

Connected

演習

손상된 데이터 걸러내기

변환 단계에서 자주 수행하는 작업 중 하나는 불완전한 데이터를 정리하는 일입니다. 이번 연습 문제에서는 다음 형식의 강의 데이터를 살펴볼 거예요:

course_id title description programming_language
1 Some Course … r

이 DataFrame을 점검하고, pandas DataFrame의 .isnull().sum() 메서드를 사용해 결측값이 없는지 확인해 보세요. programming_language 열에 일부 결측값이 있음을 확인하게 될 거예요.

따라서 .fillna() 메서드를 사용해 결측값을 채우도록 transform_fill_programming_language() 함수를 완성해야 합니다.

指示

100 XP
  • course_data의 결측값 개수를 출력하세요.
  • programming_language의 결측값은 언어 "R"로 채워야 해요.
  • 이번에는 transformed에 대해, 열마다 결측값 개수를 다시 한 번 출력하세요.