Patterns debuggen (2)
Beide Patterns in dieser Übung enthalten Fehler und matchen nicht wie erwartet. Kannst du sie korrigieren?
Das nlp-Objekt und ein doc wurden bereits für dich erstellt. Wenn du nicht weiterkommst, gib die Tokens im doc aus, um zu sehen, wie der Text aufgeteilt wird, und passe das Pattern so an, dass jedes Dictionary ein Token repräsentiert.
Diese Übung ist Teil des Kurses
Fortgeschrittenes NLP mit spaCy
Anleitung zur Übung
- Bearbeite
pattern1, sodass es alle groß-/kleinschreibungsunabhängigen Erwähnungen von"Amazon"plus ein eigennamengeschriebenes Substantiv korrekt matched. - Bearbeite
pattern2, sodass es alle groß-/kleinschreibungsunabhängigen Erwähnungen von"ad-free"plus das folgende Substantiv korrekt matched.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create the match patterns
pattern1 = [{'LOWER': 'Amazon'}, {'IS_TITLE': True, 'POS': 'PROPN'}]
pattern2 = [{'LOWER': 'ad-free'}, {'POS': 'NOUN'}]
# Initialize the Matcher and add the patterns
matcher = Matcher(nlp.vocab)
matcher.add('PATTERN1', None, pattern1)
matcher.add('PATTERN2', None, pattern2)
# Iterate over the matches
for match_id, start, end in matcher(doc):
# Print pattern string name and text of matched span
print(doc.vocab.strings[match_id], doc[start:end].text)