LoslegenKostenlos loslegen

Beispiel: Cosine Similarity

Die Handlung von Animal Farm ist ziemlich geradlinig. Am Anfang sind die Tiere unzufrieden damit, ihren menschlichen Anführern zu folgen. In der Mitte stürzen sie diese Anführer, und am Ende sind sie unzufrieden mit den Tieren, die schließlich ihre neuen Anführer wurden.

Richtig angewendet kann Cosine Similarity dabei helfen, ähnliche Dokumente (Kapitel) zu erkennen. In dieser Übung identifizierst du ähnliche Kapitel in Animal Farm. Sehr wahrscheinlich sind Kapitel 1 (der Anfang) und Kapitel 10 (das Ende) einander ähnlich.

Diese Übung ist Teil des Kurses

Einführung in Natural Language Processing mit R

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create word counts 
animal_farm_counts <- animal_farm %>%
  unnest_tokens(word, text_column) %>%
  ___(___) %>%
  count(chapter, word)
Code bearbeiten und ausführen