LoslegenKostenlos loslegen

Einen R-Korpus erkunden

Eine Kollegin bzw. ein Kollege hat einen Korpus mit 20 Dokumenten zum Thema Rohöl vorbereitet, genannt crude. Das ist nur eine Stichprobe von mehreren tausend Artikeln, die du nächste Woche erhältst. Um die Textanalyse auf diesen Dokumenten vorzubereiten, hast du beschlossen, ihren Inhalt und ihre Metadaten zu erkunden. Denk daran: In R enthält ein VCorpus sowohl meta als auch content zu jedem Text. In dieser Lektion erkundest du diese beiden Objekte.

Diese Übung ist Teil des Kurses

Einführung in Natural Language Processing mit R

Kurs anzeigen

Anleitung zur Übung

  • Gib crude aus und sieh dir die Ausgaben an.
  • Gib den Inhalt des 10. Artikels aus.
  • Gib die ID des ersten Artikels in crude aus.
  • Erstelle mit der vorgegebenen for-Schleife einen Vektor der IDs aus dem Korpus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Print out the corpus
print(___)

# Print the content of the 10th article
crude[[___]]$___

# Find the first ID
crude[[___]]$___$id

# Make a vector of IDs
ids <- c()
for(i in c(1:20)){
  ids <- append(ids, crude[[___]]$___$id)
}
Code bearbeiten und ausführen