Ajouter des mots vides personnalisés
Nous avons repéré plusieurs mots dans twitter_data qui n’apportent aucune information et devraient être retirés de votre liste finale. Dans cet exercice, vous allez ajouter quelques mots à votre data frame custom_stop_words.
Cet exercice fait partie du cours
Introduction à l’analyse de texte en R
Instructions
- Les noms de colonnes du nouveau data frame de mots vides personnalisés doivent correspondre à ceux de
stop_words. - Ajoutez
http,winett.cocomme mots vides personnalisés. - Fusionnez les lignes des mots vides personnalisés avec
stop_wordsà l’aide d’un row bind.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
custom_stop_words <- tribble(
# Column names should match stop_words
___, ___,
# Add http, win, and t.co as custom stop words
___, "CUSTOM",
___, "CUSTOM",
___, "CUSTOM"
)
# Bind the custom stop words to stop_words
stop_words2 <- stop_words %>%
___(___)