使用阈值设置,可以排除不太有代表性时间段的值。如果某个时间段的词元大小小于平均时间段大小的指定百分比,则该时间段的数据将被删除。