Passo 2: Identificare le fonti di testo
Le recensioni dei dipendenti possono provenire da fonti diverse. Se il tuo reparto risorse umane avesse i mezzi, potresti incaricare una terza parte di organizzare focus group per intervistare dipendenti sia interni sia dell'azienda concorrente.
Forbes e altri pubblicano articoli sui "migliori posti di lavoro", che potrebbero citare Amazon e Google. Un'altra fonte di informazioni potrebbero essere recensioni online anonime da siti come Indeed, Glassdoor o CareerBliss.
Qui ci concentreremo su una raccolta di recensioni online anonime.
Questo esercizio fa parte del corso
Text mining con Bag-of-Words in R
Istruzioni dell'esercizio
- Visualizza la struttura di
amznconstr()per ottenerne le dimensioni e un'anteprima dei dati. - Crea
amzn_prosa partire dalla colonna delle recensioni positiveamzn$pros. - Crea
amzn_consa partire dalla colonna delle recensioni negativeamzn$cons. - Stampa la struttura di
googconstr()per ottenerne le dimensioni e un'anteprima dei dati. - Crea
goog_prosa partire dalla colonna delle recensioni positivegoog$pros. - Crea
goog_consa partire dalla colonna delle recensioni negativegoog$cons.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Print the structure of amzn
___
# Create amzn_pros
___ <- ___
# Create amzn_cons
___ <- ___
# Print the structure of goog
___(___)
# Create goog_pros
___ <- ___
# Create goog_cons
___ <- ___