N-gramy se skládají z %[token|tokenů]%, proto se trigram anglických slov don't like zobrazí jako do n't like. (V konkordanci se don't zobrazí bez mezery, ale také se s ním zachází jako se dvěma tokeny.)
Výsledek lze omezit minimální a maximální frekvencí. Ve výchozím nastavení jsou vyloučeny n-gramy s nízkou frekvencí. Pomocí záložky Upřesnit to můžete změnit.
%[regex|Regulární výrazy]% lze použít k definování složitých kritérií pro n-gramy, které mají být zahrnuty do frekvenčního seznamu. Při použití regulárních výrazů se celý n-gram považuje za jednu souvislou posloupnost znaků včetně mezer.
Existují dvě verze počátečního, koncového a obsahujícího filtru. Jedna pro filtrování podle znaků (písmen) vyskytujících se kdekoli uvnitř n-gramu a druhá pro filtrování podle celých slov, tj. podle toho, co se nachází mezi dvěma mezerami.