Bolsa de palabras
En el ámbito del Natural Language Processing, los n-gramas son una forma básica de crear características a partir de texto. Los n-gramas cuentan secuencias de palabras, y n indica cuántas palabra(s) contiene una secuencia. Por ejemplo, los 2-gramas cuentan la aparición de secuencias de dos palabras.
En este ejercicio, elige un texto de ejemplo y una longitud de secuencia (n) para ver las principales características de 1-grama, 2-grama y 3-grama según su frecuencia, junto con cuántas veces aparece cada una.
¿Cuál de las siguientes afirmaciones es verdadera?
Este ejercicio forma parte del curso
Understanding Machine Learning
ejercicio interactivo práctico
Convierte la teoría en práctica con uno de nuestros ejercicios interactivos
Empezar ejercicio