Comparando métodos de recomendação
Neste curso, você previu como acredita que um usuário avaliaria filmes que ainda não viu usando vários métodos diferentes (médias básicas de avaliações, KNN, fatoração de matrizes). Neste exercício final, você vai comparar as avaliações médias e a fatoração de matrizes usando mean_squared_error() como medida de desempenho.
As previsões baseadas em médias foram carregadas como avg_pred_ratings_df, enquanto as previsões calculadas foram carregadas como calc_pred_ratings_df.
Os valores de verdade de base foram carregados como act_ratings_df.
Por fim, a função mean_squared_error() foi importada do sklearn.metrics para você usar.
Este exercício faz parte do curso
Construindo mecanismos de recomendação em Python
Instruções do exercício
- Extraia as linhas 0-20 e as colunas 0-100 (as áreas que você quer comparar) nos DataFrames
act_ratings_df,avg_pred_ratings_dfecalc_pred_ratings_df. - Crie uma máscara do DataFrame
actual_valuesque selecione apenas as células não vazias. - Encontre o erro quadrático médio entre as duas previsões e os valores de verdade de base.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Extract the ground truth to compare your predictions against
actual_values = act_ratings_df.____[:20, :100].values
avg_values = avg_pred_ratings_df.____[:20, :100].values
predicted_values = calc_pred_ratings_df.____[:20, :100].values
# Create a mask of actual_values to only look at the non-missing values in the ground truth
mask = ~np.isnan(____)
# Print the performance of both predictions and compare
print(____(____[mask], avg_values[mask], squared=False))
print(____(____[mask], predicted_values[mask], squared=False))