Le opzioni con ...lettere funzionano a livello di carattere, controllano se la sequenza di caratteri appare ovunque nell'n-gramma, anche all'interno dei %[token|token]%. Le opzioni con ...parole funzionano a livello di %[token|token]%, controllano se l'intera parola appare tra gli spazi nell'n-gramma.

tutti
nessun filtro aggiuntivo sarà applicato

iniziante con le lettere
digita una sequenza di lettere che ogni n-gramma dovrebbe avere all'inizio, gli spazi possono essere inclusi

terminante con le lettere
digita una sequenza di lettere che ogni n-gramma dovrebbe avere alla fine, gli spazi possono essere inclusi

contenente le lettere
digita una sequenza di lettere che ogni n-gramma dovrebbe avere all'inizio, in mezzo o alla fine, gli spazi possono essere inclusi

iniziante con la parola
digita una parola che dovrebbe essere la prima parola (o token) di ogni n-gramma, digitando cat saranno inclusi n-grammi con cat ma non con catalogue

contenente la parola
digita una parola che dovrebbe apparire ovunque nell'n-gramma, comprese la prima e l'ultima posizione

terminante per la parola
digita una parola che dovrebbe apparire come ultima parola dell'n-gramma

corrispondente alle espressioni regolari
usa le %[regex|espressioni regolari]% per filtrare più in dettaglio, l'intero n-gramma è trattato come una sequenza continua di caratteri

da questa lista
digita gli n-grammi per scoprire quanto frequentemente appaiono nel corpus attualmente selezionato, la dimensione degli n-grammi deve corrispondere alla dimensione selezionata sopra, uno spazio deve apparire tra tutti i token, ad esempio I do n't know o he 'll go