linear_kernel en cosine_similarity vergelijken
In deze oefening krijg je tfidf_matrix, met daarin de tf-idf-vectoren van duizend documenten. Je taak is om de cosinus-similariteitsmatrix voor deze vectoren te maken, eerst met cosine_similarity en daarna met linear_kernel.
Daarna vergelijken we de rekentijden van beide functies.
Deze oefening maakt deel uit van de cursus
Feature Engineering voor NLP in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Record start time
start = time.time()
# Compute cosine similarity matrix
cosine_sim = ____(____, ____)
# Print cosine similarity matrix
print(cosine_sim)
# Print time taken
print("Time taken: %s seconds" %(time.time() - start))