Gli n-grammi sono composti da %[token|token]%, ecco perché don't like è un trigramma e sarà visualizzato come do n't like. (In una concordanza, don't sarà visualizzato senza spazio in mezzo ma anche trattato come due token.)
Il risultato può essere limitato per frequenza minima e massima. Di default, gli n-grammi a bassa frequenza sono esclusi. Usa la scheda avanzata per cambiare questo.
Le %[regex|espressioni regolari]% possono essere usate per definire criteri complessi per gli n-grammi che dovrebbero essere inclusi nella lista delle frequenze. Quando si usano le espressioni regolari, l'intero n-gramma è trattato come una sequenza continua di caratteri, spazi inclusi.
Ci sono due versioni dei filtri "iniziante per", "terminante per" e "contenente". Una per filtrare i caratteri (lettere) che appaiono ovunque all'interno di un n-gramma e una per filtrare le parole complete, cioè ciò che si trova tra due spazi.