The options with …letters work at character level, they check if he sequence of characters appears anywhere in the n-gram including inside the %[token|tokens]%. The options with …words work at %[token]% level, they check if the whole word appears between spaces in the n-gram.

すべて
追加のフィルタリングは適用されません

文字で始まる
各N-グラムが最初に持つ文字列を入力してください。スペースを含めることもできます

文字で終わる
各N-グラムが末尾に持つ文字のシーケンスを入力してください。スペースを含めることもできます

含まれる文字
各N-グラムが先頭、中間、または末尾に持つ文字のシーケンスを入力してください。スペースを含めることができます

単語で始まる
各N-グラムの最初の単語(またはトークン)として表示される単語を入力してください。例えば、cat を入力すると、cat のN-グラムが含まれますが、catalogue は含まれません

単語を含む
N-グラムの最初や最後の位置を含め、どこにでも現れる単語を入力してください

単語で終わる
N-グラムの最後の単語として表示される単語を入力してください

一致する正規表現
詳細なフィルタリングには%[regex|正規表現]%を使用してください。N-グラム全体が連続した文字列として扱われます

このリストから
現在選択されているコーパスで、それらがどのくらい頻繁に現れるかを確認するためにN-グラムを入力してください。N-グラムのサイズは、上で選択したサイズと一致する必要があります。すべてのトークンの間にはスペースを入れてください。例:I do n't knowhe 'll go