1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 추천 엔진 만들기

Connected

연습 문제

결측값 처리의 어려움

지금까지 다뤘던 피벗된 DataFrame에는 자주 결측값이 있었던 걸 보셨을 거예요. 이는 자연스러운 현상입니다. 사용자가 모든 영화를 다 보지는 않고, 대부분의 영화도 모든 사용자가 보지 않기 때문에 사용자-평점 행렬에 빈칸이 생기게 됩니다.

이번 연습 문제에서는 결측값이 포함된 사용자 평점 테이블 user_ratings_subset의 또 다른 부분 집합을 살펴보고, 결측값을 처리하는 여러 방법이 테이블의 활용도에 어떤 영향을 미치는지 관찰해 보겠습니다.

지침 1/3

undefined XP
    1
    2
    3

질문

미리 로드된 user_ratings_subset을 살펴보세요. None 값은 사용자가 아직 평점을 남기지 않았음을 의미합니다.

이 표를 기준으로 할 때, User_A와 가장 비슷한 사용자는 누구인가요?

가능한 답변