Ta referenčni korpus je bil obdelan z različnimi %[pojavnica|tokenizacija]% ali oblikoskladenjskimi oznakami. Besedilo, ki je drugače tokenizirano ali označeno, je lahko napačno prepoznano kot ključne besede.