Solo i collocati con più occorrenze nell'intero corpus rispetto al limite saranno inclusi. Utile per escludere gli elementi a bassa frequenza che sono linguisticamente irrilevanti.