1. 학습
  2. /
  3. 강의
  4. /
  5. 데이터 엔지니어링 입문

Connected

연습 문제

코스별 평균 평점

강의를 추천하는 좋은 방법 중 하나는 높은 평점을 받은 강의를 추천하는 거예요. DataCamp 학습자들은 동료 학습자들에게서 높은 평점을 받은 강의를 선호하는 경향이 있어요.

이번 연습 문제에서는 pandas DataFrame의 .groupby() 메서드를 사용해 평점 데이터를 집계하는 변환 함수 transform_avg_rating()을 완성해 보세요. 목표는 두 개의 열, 즉 코스 id와 해당 코스의 평균 평점을 가진 DataFrame을 얻는 것입니다:

course_id avg_rating
123 4.72
111 4.62
… …

이 연습 문제에서는 이 변환 함수를 완성한 다음, 도우미 함수인 extract_rating_data()로 추출한 원시 평점 데이터에 적용합니다. 이 함수는 rating 테이블에서 코스 평점을 추출해요.

지침

100 XP
  • course_id 열로 그룹화하고 rating 열의 평균을 구해 transform_avg_rating() 함수를 완성하세요.
  • extract_rating_data()를 사용해 원시 평점 데이터를 추출하세요. 이 함수는 데이터베이스 엔진 db_engines를 인자로 받습니다.
  • 추출한 원시 평점 데이터에 transform_avg_rating()을 적용하세요.