Možnosti s …písmeny pracují na úrovni znaků, kontrolují, zda se sekvence znaků vyskytuje kdekoli v n-gramu včetně případu uvnitř %[token|tokenů]%. Možnosti se …slovy pracují na úrovni %[token|tokenů]%, tedy kontrolují, zda se v n-gramu vyskytuje celé slovo oddělené mezerami.
všechny
nebude použito žádné další filtrování
začínající písmeny
zadejte posloupnost písmen, kterou by měl mít každý n-gram na začátku, lze použít i mezery
končící písmeny
napište posloupnost písmen, kterou by měl mít každý n-gram na konci, lze použít i mezery
obsahující písmena
zadejte posloupnost písmen, která by měl mít každý n-gram na začátku, uprostřed nebo na konci, lze zahrnout i mezery
začínající slovem
zadejte slovo, které má být prvním slovem (nebo tokenem) každého n-gramu, zadání hrad zahrne n-gramy s hrad, ale ne s hradba
obsahující slovo
napište slovo, které by se mělo objevit kdekoli v n-gramu, včetně první nebo poslední pozice
končící slovem
zadejte slovo, které se má objevit jako poslední slovo n-gramu
odpovídající regulárním výrazům
použití %[regex|regulárních výrazů]% pro podrobné filtrování, celý n-gram je považován za souvislou posloupnost znaků
z tohoto seznamu
zadejte n-gramy, abyste zjistili, jak často se vyskytují v aktuálně vybraném korpusu, velikost n-gramu musí odpovídat velikosti zvolené výše, mezi všemi tokeny se musí objevit mezera, např. I do n'know nebo he 'll go