Klíčová slova Klíčová slova jsou jednotlivá slova (%[token|tokeny]%), která se ve
cílovém korpusu vyskytují častěji než v
referenčním korpusu. Jakýkoli %[token]% může být kvalifikován jako klíčové slovo, pokud je ve cílovém korpusu používán častěji než v referenčním korpusu. Ve skutečnosti bude výsledek obsahovat především podstatná a přídavná jména, protože frekvence ostatních slovních druhů bývají ve všech textech podobné.
Terms Termíny jsou víceslovné výrazy, které se v cílovém korpusu vyskytují častěji než v referenčním korpusu a navíc odpovídají typickému formátu terminologie v daném jazyce. Tento formát je definován v
termové gramatice.
Aby nástroj fungoval, musí existovat alespoň 2 korpusy (nebo 2 subkorpusy) v daném jazyce. Korpus, ve kterém jsou identifikována klíčová slova a termíny, se nazývá cílový korpus. Korpus, který se používá pro srovnání, se nazývá referenční korpus.