Depuración de patrones (2)
Ambos patrones de este ejercicio contienen errores y no coincidirán como se espera. ¿Puedes corregirlos?
Ya tienes nlp y un doc creados. Si te atascas, prueba a imprimir los tokens del doc para ver cómo se divide el texto y ajusta el patrón para que cada diccionario represente un token.
Este ejercicio forma parte del curso
NLP avanzado con spaCy
Instrucciones del ejercicio
- Edita
pattern1para que coincida correctamente con todas las menciones de"Amazon"sin distinguir mayúsculas de minúsculas, más un nombre propio en formato título. - Edita
pattern2para que coincida correctamente con todas las menciones de"ad-free"sin distinguir mayúsculas de minúsculas, más el sustantivo que le sigue.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create the match patterns
pattern1 = [{'LOWER': 'Amazon'}, {'IS_TITLE': True, 'POS': 'PROPN'}]
pattern2 = [{'LOWER': 'ad-free'}, {'POS': 'NOUN'}]
# Initialize the Matcher and add the patterns
matcher = Matcher(nlp.vocab)
matcher.add('PATTERN1', None, pattern1)
matcher.add('PATTERN2', None, pattern2)
# Iterate over the matches
for match_id, start, end in matcher(doc):
# Print pattern string name and text of matched span
print(doc.vocab.strings[match_id], doc[start:end].text)