ComenzarEmpieza gratis

Datos limitados en tus filas

Esta escasez de datos puede causar problemas al usar técnicas como K-nearest neighbors, como vimos en el capítulo anterior. KNN necesita encontrar los k usuarios más similares que hayan valorado un ítem, pero si solo k o menos usuarios han dado una valoración a ese ítem, entonces todas las valoraciones serán las "más similares".

En este ejercicio, vas a contar cuántas veces cada película del DataFrame user_ratings_df ha recibido una valoración y, después, ver cuántas tienen solo una o dos valoraciones.

Este ejercicio forma parte del curso

Creación de motores de recomendación en Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Count the occupied cells per column
occupied_count = user_ratings_df.____().____()
print(occupied_count)
Editar y ejecutar código