Extrakce n-gramů lze provést na jakémkoli %[attribute|atributu]%. Nejužitečnější jsou:

lemma – různé %[wordForm|slovní tvary]% téhož %[lemma|lemmatu]% budou považovány za totéž

slovo – různé %[wordForm|slovní tvary]% téhož lemmatu budou zpracovány jednotlivě