Die Option mit ...Buchstaben arbeiten auf Zeichenebene, d. h. sie prüfen, ob die Zeichenfolge irgendwo im N-Gramm vorkommt, auch innerhalb des %[token|Tokens]%. Die Option mit Wörtern arbeiten auf %[token|Token]%-Ebene, d. h. sie prüfen, ob das ganze Wort zwischen Leerzeichen im N-Gramm vorkommt.
alles
es wird keine zusätzliche Filterung vorgenommen
beginnt mit Buchstaben
geben Sie eine Folge von Buchstaben ein, die jedes N-Gramm am Anfang haben soll, Leerzeichen können eingeschlossen werden
endet mit Buchstaben
geben Sie eine Folge von Buchstaben ein, die jedes N-Gramm am Ende haben soll, Leerzeichen können eingeschlossen werden
enthaltet Buchstaben
geben Sie eine Folge von Buchstaben ein, die jedes N-Gramm am Anfang, in der Mitte oder am Ende haben soll, Leerzeichen können eingeschlossen werden
beginnt mit Wort
Geben Sie ein Wort ein, das das erste Wort (oder Token) jedes N-Grams sein soll. Wenn Sie cat eingeben, werden N-Grams mit cat, aber nicht mit catalogue eingeschlossen
enthaltet Wort
geben Sie ein Wort ein, das an einer beliebigen Stelle des N-Grams erscheinen soll, einschließlich der ersten und letzten Position
endet mit Wort
geben Sie ein Wort ein, das als letztes Wort des N-Grams erscheinen soll
passende reguläre Ausdrücke
verwenden Sie %[regex|reguläre Ausdrücke]% für eine detaillierte Filterung, das gesamte N-Gramm wird als fortlaufende Folge von Zeichen behandelt
aus dieser Liste
geben Sie die N-Gramme ein, um herauszufinden, wie häufig sie im aktuell ausgewählten Korpus vorkommen. Die Größe der N-Gramme muss mit der oben ausgewählten Größe übereinstimmen, zwischen allen Token muss ein Leerzeichen stehen