Nástroj pro n-gramy vytváří %[frequency|frekvenční]% seznamy sekvencí %[token|tokenů]%. N-gramy jsou také nazývány jako víceslovné výrazy nebo MWE. Uživatel má na výběr z několika možností filtrování, včetně %[regex|regulárních výrazů]%, které podrobně specifikují, u kterých n-gramů se má generovat jejich frekvence. N-gramy lze generovat na základě libovolného %[attribute|atributu]%, přičemž nejčastěji používané jsou %[wordForm|slovní tvar]% a %[lemma]%.