ComenzarEmpieza gratis

Crear un corpus

Has creado un tibble llamado russian_tweets que contiene unos 20.000 tuits generados automáticamente por bots durante el ciclo electoral de EE. UU. de 2016 para poder realizar análisis de texto. Sin embargo, al revisar las opciones disponibles para el análisis que quieres hacer, crees que el paquete tm ofrece el camino más sencillo. Para poder llevar a cabo el análisis, primero debes crear un corpus y adjuntar metadatos que puedan ser útiles.

Ten en cuenta que se trata de datos reales de Twitter y, como tal, siempre existe el riesgo de que contengan lenguaje ofensivo u otro contenido inapropiado (en este ejercicio y en cualquier ejercicio posterior que también use datos reales de Twitter).

Este ejercicio forma parte del curso

Introducción al procesamiento del lenguaje natural en R

Ver curso

Instrucciones del ejercicio

  • Crea un corpus usando la columna content de russian_tweets.
  • Adjunta las columnas following y followers como metadatos a tweet_corpus.
  • Imprime las primeras filas de la tabla de metadatos.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create a corpus
tweet_corpus <- ___(___(russian_tweets$___))

# Attach following and followers
___(tweet_corpus, 'following') <- russian_tweets$___
___(tweet_corpus, 'followers') <- russian_tweets$___

# Review the meta data
head(meta(___))
Editar y ejecutar código