행렬의 희소도

현실 세계의 평점 데이터에서는 대부분의 사용자가 대부분의 항목에 평점을 남기지 않고, 대부분의 항목도 일부 사용자에게만 평점이 매겨지는 경우가 많아요. 그 결과 DataFrame이 매우 비거나, 즉 희소(sparse)해져요.

이번 연습 문제에서는 movie_lens 평점 데이터에서 값이 채워진 셀의 수를 세고, 전체 DataFrame 크기와 비교하여 얼마나 희소한지 계산해 보려고 해요. 이전에 사용했던 사용자당 하나의 행과 영화당 하나의 열을 가진 DataFrame user_ratings_df가 이미 로드되어 있어요.