MulaiMulai sekarang secara gratis

Atribut leksikal

Dalam contoh ini, Anda akan menggunakan objek Doc dan Token dari spaCy, serta atribut leksikal untuk menemukan persentase dalam sebuah teks. Anda akan mencari dua token berurutan: sebuah angka dan tanda persen. Objek nlp bahasa Inggris sudah disiapkan.

Latihan ini adalah bagian dari kursus

NLP Lanjutan dengan spaCy

Lihat Kursus

Petunjuk latihan

  • Gunakan atribut token like_num untuk memeriksa apakah sebuah token dalam doc menyerupai angka.
  • Ambil token yang berada setelah token saat ini dalam dokumen. Indeks token berikutnya dalam doc adalah token.i + 1.
  • Periksa apakah atribut text token berikutnya adalah tanda persen "%".

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Process the text
doc = nlp("In 1990, more than 60% of people in East Asia were in extreme poverty. Now less than 4% are.")

# Iterate over the tokens in the doc
for token in doc:
    # Check if the token resembles a number
    if ____.____:
        # Get the next token in the document
        next_token = ____[____]
        # Check if the next token's text equals '%'
        if next_token.____ == '%':
            print('Percentage found:', token.text)
Edit dan Jalankan Kode