Patterns debuggen (2)

Beide Patterns in dieser Übung enthalten Fehler und matchen nicht wie erwartet. Kannst du sie korrigieren?

Das nlp-Objekt und ein doc wurden bereits für dich erstellt. Wenn du nicht weiterkommst, gib die Tokens im doc aus, um zu sehen, wie der Text aufgeteilt wird, und passe das Pattern so an, dass jedes Dictionary ein Token repräsentiert.

Diese Übung ist Teil des Kurses

<Kurs>Fortgeschrittenes NLP mit spaCy</Kurs>

Kurs ansehen

Übungsanweisungen

Bearbeite pattern1, sodass es alle groß-/kleinschreibungsunabhängigen Erwähnungen von "Amazon" plus ein eigennamengeschriebenes Substantiv korrekt matched.
Bearbeite pattern2, sodass es alle groß-/kleinschreibungsunabhängigen Erwähnungen von "ad-free" plus das folgende Substantiv korrekt matched.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create the match patterns
pattern1 = [{'LOWER': 'Amazon'}, {'IS_TITLE': True, 'POS': 'PROPN'}]
pattern2 = [{'LOWER': 'ad-free'}, {'POS': 'NOUN'}]

# Initialize the Matcher and add the patterns
matcher = Matcher(nlp.vocab)
matcher.add('PATTERN1', None, pattern1)
matcher.add('PATTERN2', None, pattern2)

# Iterate over the matches
for match_id, start, end in matcher(doc):
    # Print pattern string name and text of matched span
    print(doc.vocab.strings[match_id], doc[start:end].text)

Code bearbeiten und ausführen