我们重新利用Lucene开发一个免费文本检索箱,以收集向用户提供的数据,如电子邮件In Box。 我们愿让该箱处理日期,例如第5/1/2011号。 为了使事情更加容易,我们把目前版本的特征限制在两个日期格式上:
mm/dd/yy
mm/dd/yyyy
对我们的原型来说,我们 ha住了问答分析过程,试图先处理问题,看看这两个日期模式。 大约两年前,我们就在Lucene 2.4。 奇怪的是,是否在卢塞内有任何工具来接受“日期”,并将“TkenStream”带回任何确定的日期。 通过对Lucene 2.9的javadocs,我发现:
org.apache.lucene.analysis.sinks.DateRecognizerSinkFilter
看来我需要做些什么,但实施了一个SinkFilter,这一概念似乎在卢塞尼·维基中得到了记录。 是否有任何人在之前使用过这种过滤器,如果是,使用该过滤器的最有效方式是什么?