N元组由%[token|词元]%组成,这也是为什么don't like是一个三元组,并显示为do n't like。(在对照中,显示don't时不会带有空格,但仍会被视为两个词元。)
结果可以按最小和最大词频来限制。默认情况下,低频 N 元组会被排除在外。使用进阶选项来更改此设置。
应包含在词频列表中N 元组的复杂标准可以使用%[regex|正则表达式]%来定义。使用正则表达式时,整个 N 元组被视为一个连续的字符序列,包括空格。
以什么为开头、结尾和包含的筛选器有两个版本。一个用于按出现在 N 元组中任何位置的字符(字母)来筛选,一个用于按完整单词来筛选,即出现在两个空格之间的内容。