Beispiel: Cosine Similarity
Die Handlung von Animal Farm ist ziemlich geradlinig. Am Anfang sind die Tiere unzufrieden damit, ihren menschlichen Anführern zu folgen. In der Mitte stürzen sie diese Anführer, und am Ende sind sie unzufrieden mit den Tieren, die schließlich ihre neuen Anführer wurden.
Richtig angewendet kann Cosine Similarity dabei helfen, ähnliche Dokumente (Kapitel) zu erkennen. In dieser Übung identifizierst du ähnliche Kapitel in Animal Farm. Sehr wahrscheinlich sind Kapitel 1 (der Anfang) und Kapitel 10 (das Ende) einander ähnlich.
Diese Übung ist Teil des Kurses
Einführung in Natural Language Processing mit R
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create word counts
animal_farm_counts <- animal_farm %>%
unnest_tokens(word, text_column) %>%
___(___) %>%
count(chapter, word)