Debugging pola (2)
Kedua pola dalam latihan ini mengandung kesalahan dan tidak akan cocok seperti yang diharapkan. Dapatkah Anda memperbaikinya?
nlp dan sebuah doc telah disiapkan untuk Anda. Jika mengalami kesulitan, cobalah mencetak token dalam doc untuk melihat bagaimana teks dipecah, lalu sesuaikan polanya sehingga setiap kamus merepresentasikan satu token.
Latihan ini merupakan bagian dari kursus
NLP Lanjutan dengan spaCy
Instruksi latihan
- Sunting
pattern1agar dapat mencocokkan semua penyebutan"Amazon"secara tidak peka huruf besar-kecil, ditambah sebuah proper noun berjudul (Title Case). - Sunting
pattern2agar dapat mencocokkan semua penyebutan"ad-free"secara tidak peka huruf besar-kecil, ditambah kata benda yang mengikutinya.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Create the match patterns
pattern1 = [{'LOWER': 'Amazon'}, {'IS_TITLE': True, 'POS': 'PROPN'}]
pattern2 = [{'LOWER': 'ad-free'}, {'POS': 'NOUN'}]
# Initialize the Matcher and add the patterns
matcher = Matcher(nlp.vocab)
matcher.add('PATTERN1', None, pattern1)
matcher.add('PATTERN2', None, pattern2)
# Iterate over the matches
for match_id, start, end in matcher(doc):
# Print pattern string name and text of matched span
print(doc.vocab.strings[match_id], doc[start:end].text)