Beispiel: Cosine Similarity
Die Handlung von Animal Farm ist ziemlich geradlinig. Am Anfang sind die Tiere unzufrieden damit, ihren menschlichen Anführern zu folgen. In der Mitte stürzen sie diese Anführer, und am Ende sind sie unzufrieden mit den Tieren, die schließlich ihre neuen Anführer wurden.
Richtig angewendet kann Cosine Similarity dabei helfen, ähnliche Dokumente (Kapitel) zu erkennen. In dieser Übung identifizierst du ähnliche Kapitel in Animal Farm. Sehr wahrscheinlich sind Kapitel 1 (der Anfang) und Kapitel 10 (das Ende) einander ähnlich.
Diese Übung ist Teil des Kurses
<Kurs>Einführung in Natural Language Processing mit R</Kurs>Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create word counts
animal_farm_counts <- animal_farm %>%
unnest_tokens(word, text_column) %>%
___(___) %>%
count(chapter, word)