Word sketch El thesaurus sólo puede funcionar si existen word sketches en el corpus. El corpus tiene que ser etiquetado en Sketch Engine o utilizar el mismo tagset. Si el corpus está etiquetado con un tagset diferentes tienes que utilizar una
gramática word sketch personalizada.
El thesaurus funcionará incluso con gramáticas word sketch universales, con todas las limitaciones que ello conlleva. Véase word sketch.
Word sketch
Thesaurus can only work if word sketches exist in the corpus. The corpus has to be tagged in Sketch Engine or use the same tagset. A custom word sketch grammar has to be used if the corpus is tagged with a different tagset.
Thesaurus will work even with universal sketch grammars with all the related limitations. See word sketch.
Tamaño del corpus
La calidad del thesaurus depende totalmente de la riqueza de los word sketches. Un word sketch rico se define por un gran número de colocaciones en todas las relaciones gramaticales. Debe existir un word sketch rico para la palabra buscada, pero también para todas las demás palabras con la misma parte de la oración, de modo que puedan compararse. Este requisito sólo puede cumplirse si la palabra tiene una alta %[frecuencia]% en el corpus, idealmente miles de apariciones o más. Por consiguiente, se necesita un corpus muy amplio para que incluso las palabras menos frecuentes puedan producir word sketches ricos. Se recomienda el uso de nuestros corpora de miles de millones de palabras para cualquier trabajo serio de thesaurus.