Langkah 2: Mengidentifikasi sumber teks
Ulasan karyawan dapat berasal dari berbagai sumber. Jika departemen SDM Anda memiliki sumber daya, Anda dapat meminta pihak ketiga menyelenggarakan focus group untuk mewawancarai karyawan, baik dari internal maupun dari pesaing Anda.
Forbes dan pihak lain menerbitkan artikel tentang "tempat kerja terbaik", yang mungkin menyebutkan Amazon dan Google. Sumber informasi lain bisa berupa ulasan anonim secara daring dari situs seperti Indeed, Glassdoor, atau CareerBliss.
Di sini, kita akan berfokus pada kumpulan ulasan anonim secara daring.
Latihan ini adalah bagian dari kursus
Text Mining dengan Bag-of-Words di R
Petunjuk latihan
- Lihat struktur
amzndenganstr()untuk mendapatkan dimensinya dan pratinjau data. - Buat
amzn_prosdari kolom ulasan positifamzn$pros. - Buat
amzn_consdari kolom ulasan negatifamzn$cons. - Cetak struktur
googdenganstr()untuk mendapatkan dimensinya dan pratinjau data. - Buat
goog_prosdari kolom ulasan positifgoog$pros. - Buat
goog_consdari kolom ulasan negatifgoog$cons.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Print the structure of amzn
___
# Create amzn_pros
___ <- ___
# Create amzn_cons
___ <- ___
# Print the structure of goog
___(___)
# Create goog_pros
___ <- ___
# Create goog_cons
___ <- ___