Se inlcuirán solo colocaciones cuyas ocurrencias en todo el corpus superan el límite. Útil para excluir tokens de poca frecuencia y valor lingüístico limitado.