Atribut leksikal
Dalam contoh ini, Anda akan menggunakan objek Doc dan Token dari spaCy, serta atribut leksikal untuk menemukan persentase dalam sebuah teks. Anda akan mencari dua token berurutan: sebuah angka dan tanda persen. Objek nlp bahasa Inggris sudah disiapkan.
Latihan ini adalah bagian dari kursus
NLP Lanjutan dengan spaCy
Petunjuk latihan
- Gunakan atribut token
like_numuntuk memeriksa apakah sebuah token dalamdocmenyerupai angka. - Ambil token yang berada setelah token saat ini dalam dokumen. Indeks token berikutnya dalam
docadalahtoken.i + 1. - Periksa apakah atribut
texttoken berikutnya adalah tanda persen "%".
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Process the text
doc = nlp("In 1990, more than 60% of people in East Asia were in extreme poverty. Now less than 4% are.")
# Iterate over the tokens in the doc
for token in doc:
# Check if the token resembles a number
if ____.____:
# Get the next token in the document
next_token = ____[____]
# Check if the next token's text equals '%'
if next_token.____ == '%':
print('Percentage found:', token.text)