Las opciones con …letras funcionan a nivel de carácter. Se comprueba si la cadena de caracteres aparece en cualquier lugar dentro del n-grama incluso dentro de los %[token|tokens]%. Las opciones con …palabras funcionan a nivel de %[token]%. Se comprueba si los n-gramas contienen el token.
todo
sin filtrar, devuelve todos los resultados
que empiezan con letras
introduce una cadena de caracteres que deberían encontrarse en el principio de los n-gramas, se pueden incluir espacios
que terminan letras
introduce caracteres que deberían encontrarse en el fin de los n-gramas incluso espacios
que contienen letras
introduce caracteres que deberían encontrarse en cualquier posición dentro de los n-gramas, incluso espacios
que empiezan con palabra
introduce un token que debería encontrarse en la posición inicial del n-grama, e.g. introduce la para encontrar n-gramas con el artículo femenino en el principio pero no los que empiecen con las
containing word
type a word that should appear anywhere in the n-gram including the first and last positions
que terminan con palabra
introduce un token que debería encontrarse en la posición final del n-grama,
matching regular expressions
use %[regex|regular expressions]% for detailed filtering, the whole n-gram is treated as a continuous sequence of characters
de esta lista
introduce n-gramas a encontrar y establecer su frecuencia en el corpus, su tamaño debería coincidir con el criterio arriba, los tokens deberían separarse por espacios, e.g. I do n't know o he 'll go