Klíčová slova Klíčová slova jsou jednotlivá slova (%[token|tokeny]%), která se ve
vybraném korpusu vyskytují častěji než v
referenčním korpusu. Jakýkoli %[token]% může být kvalifikován jako klíčové slovo, pokud je ve vybraném korpusu používán častěji než v referenčním korpusu. Ve skutečnosti bude výsledek obsahovat především podstatná a přídavná jména, protože frekvence ostatních slovních druhů bývají ve všech textech podobné.
Terms Terms are multi-word expressions which appear more frequently in the focus corpus than in the reference corpus and, additionally, match the typical format of terminology in the language. The format is defined in the
term grammar.
Aby nástroj fungoval, musí existovat alespoň 2 korpusy (nebo 2 subkorpusy) v daném jazyce. Korpus, ve kterém jsou identifikována klíčová slova a termíny, se nazývá vybraný korpus. Korpus, který se používá pro srovnání, se nazývá referenční korpus.