LoslegenKostenlos starten

Beispiel: Cosine Similarity

Die Handlung von Animal Farm ist ziemlich geradlinig. Am Anfang sind die Tiere unzufrieden damit, ihren menschlichen Anführern zu folgen. In der Mitte stürzen sie diese Anführer, und am Ende sind sie unzufrieden mit den Tieren, die schließlich ihre neuen Anführer wurden.

Richtig angewendet kann Cosine Similarity dabei helfen, ähnliche Dokumente (Kapitel) zu erkennen. In dieser Übung identifizierst du ähnliche Kapitel in Animal Farm. Sehr wahrscheinlich sind Kapitel 1 (der Anfang) und Kapitel 10 (das Ende) einander ähnlich.

Diese Übung ist Teil des Kurses

<Kurs>Einführung in Natural Language Processing mit R</Kurs>
Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create word counts 
animal_farm_counts <- animal_farm %>%
  unnest_tokens(word, text_column) %>%
  ___(___) %>%
  count(chapter, word)
Code bearbeiten und ausführen