Berlatih sintaks dengan grep
Anda baru saja menyelesaikan latihan perkenalan di tempat kerja dan Anda mencatat 10 fakta tentang atasan Anda. Anda menyimpan 10 fakta ini ke dalam sebuah vektor bernama text. Dengan menggunakan regular expression, Anda ingin merangkum respons atasan Anda.
Beberapa catatan tentang regular expression di R:
- Saat menggunakan
grep(), mengaturvalue = TRUEakan menampilkan teks alih-alih indeks. - Anda dapat menggabungkan pola seperti digit,
"\\d", yang diikuti tanda titik"\\.", menjadi"\\d\\." - Spasi dapat dicari menggunakan
"\\s". - Anda dapat mencari sebuah kata cukup dengan menggunakan kata tersebut sebagai polanya.
pattern = 'word'
Latihan ini adalah bagian dari kursus
Pengantar Natural Language Processing di R
Petunjuk latihan
- Gunakan
grep()untuk menampilkan teks dari respons yang memuat angka numerik. - Temukan semua item dengan angka yang diikuti spasi. Gunakan regular expression untuk angka dan spasinya.
- Gunakan
length()dangrep()untuk mengetahui berapa kali Anda menulis kata"favorite".
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Print off each item that contained a numeric number
___(pattern = ___, x = text, value = TRUE)
# Find all items with a number followed by a space
___(pattern = ___, x = text)
# How many times did you write down 'favorite'?
length(___(pattern = ___, x = text))