N-グラムは%[token|トークン]%で構成されているため、don't likeはトリグラムであり、do n't likeとして表示されます。(コンコーダンスでは、don'tはスペースなしで表示されますが、2つのトークンとしても扱われます。)
結果は最小および最大の頻度で制限できます。デフォルトでは、低頻度のN-グラムが除外されます。これを変更するには、高度タブを使用してください。
%[regex|正規表現]%を使用すると、頻度リストに含めるべきN-グラムの複雑な基準を定義できます。正規表現を使用すると、N-グラム全体が、スペースを含む連続した文字列として扱われます。
N-グラム内の任意の位置に現れる字(文字)でフィルタリングするためのバージョンと、完全な単語でフィルタリングするためのバージョン(つまり、2つのスペースの間にあるもの)の2つのバージョンがあります。