Comparer linear_kernel et cosine_similarity
Dans cet exercice, vous disposez de tfidf_matrix, qui contient les vecteurs tf-idf d’un millier de documents. Votre objectif est de générer la matrice de similarité cosinus pour ces vecteurs, d’abord avec cosine_similarity, puis avec linear_kernel.
Nous comparerons ensuite les temps de calcul des deux fonctions.
Cet exercice fait partie du cours
Feature Engineering pour le NLP en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Record start time
start = time.time()
# Compute cosine similarity matrix
cosine_sim = ____(____, ____)
# Print cosine similarity matrix
print(cosine_sim)
# Print time taken
print("Time taken: %s seconds" %(time.time() - start))