Debugging pola (2)
Kedua pola dalam latihan ini mengandung kesalahan dan tidak akan cocok seperti yang diharapkan. Dapatkah Anda memperbaikinya?
nlp dan sebuah doc telah disiapkan untuk Anda. Jika mengalami kesulitan, cobalah mencetak token dalam doc untuk melihat bagaimana teks dipecah, lalu sesuaikan polanya sehingga setiap kamus merepresentasikan satu token.
Latihan ini adalah bagian dari kursus
NLP Lanjutan dengan spaCy
Petunjuk latihan
- Sunting
pattern1agar dapat mencocokkan semua penyebutan"Amazon"secara tidak peka huruf besar-kecil, ditambah sebuah proper noun berjudul (Title Case). - Sunting
pattern2agar dapat mencocokkan semua penyebutan"ad-free"secara tidak peka huruf besar-kecil, ditambah kata benda yang mengikutinya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create the match patterns
pattern1 = [{'LOWER': 'Amazon'}, {'IS_TITLE': True, 'POS': 'PROPN'}]
pattern2 = [{'LOWER': 'ad-free'}, {'POS': 'NOUN'}]
# Initialize the Matcher and add the patterns
matcher = Matcher(nlp.vocab)
matcher.add('PATTERN1', None, pattern1)
matcher.add('PATTERN2', None, pattern2)
# Iterate over the matches
for match_id, start, end in matcher(doc):
# Print pattern string name and text of matched span
print(doc.vocab.strings[match_id], doc[start:end].text)