English 中文(简体)
已调试的 Jackrabbbit Lucene 再次指数中止/失败
原标题:Debugging Jackrabbit Lucene re-index abort/failure

我试图在 Jackrabbbit 2. 0 实例( 实际上是 一天 CRX 2. 1 实例) 上重建 Luceene 搜索索引( 实际上是 一天 CRX 2. 1 实例), 这样我就可以应用新的属性增量加权值来进行相关评分。 但是, 在同一点, 计数 3173000 重复中止索引化 。

*INFO * MultiIndex: indexing... /content/xxxxxx/jcr:content (3173000) (MultiIndex.java, line 1209)
*INFO * RepositoryImpl: Shutting down repository... (RepositoryImpl.java, line 1139)

离开 CRX 网络实例显示

非法国家例外:该存储库不可用。

日志中没有任何迹象表明它为什么关闭。 在任何更高的跟踪水平上, 这两条线之间没有更多的线条。 所提到的路径存在且无足轻重。 Jackrabbit 每100个节点记录一条路径, 从而导致失败的可能是下100个节点中的任何一条。

任何想法 可能出了什么问题, 或如何我可以调试这个?

(不幸的是,这是那些我深思熟虑的问题之一——我不能多说,因为我不知道去哪里找。 )

最佳回答

感谢所有评论中的建议。 问题是我们对错误的 HTML 有一些内容 : 具体来说, 在 < code@ lt; li> 中, 是否关闭 : a code@ lt; select> & lt; option> :

<html><body><form>
  <select>
    <option value="1"><li></option>
  </select>
</form></body></html>

这杀死了javax.swind.text.html.parser.Parser ,并配有可扔的StackOverflowError, 这是可扔的, 并且不会被Jackrabbit Multip Index的错误处理所捕获。

https://bugs.java.com/buggdatabase/view_bug?bugg_id=7172359” rel=“nofollow norefererr” 向Oracle 报告Parser撞车事件,我会提议给 Jackrabbbit 核心添加一个补丁, 该补丁在索引代码周围添加额外的试捕, 至少记录有问题的精确节点, 并在可能情况下, 从错误中恢复, 并继续索引化。 在StackOverplowError 的情况下, 我认为这是可以回收的 : 当我们回到例外处理代码时, 堆堆的深度不合理 。

在实践中,我不会被允许在这里 经营一个经过修改的杰克比特 生产,但至少我已经确定 和固定坏的内容 这样同样的问题就不会咬我们了。

问题回答

暂无回答




相关问题
Lucene.NET in medium trust

How do I make Lucene.NET 2.3.2 run in a medium trust environment? GoDaddy doesn t like it the way it is.

Grails searchable plugin

In my Grails app, I m using the Searchable plugin for searching/indexing. I want to write a Compass/Lucene query that involves multiple domain classes. Within that query when I want to refer to the id ...

Search subset of objects using Compass/Lucene

I m using the searchable plugin for Grails (which provides an API for Compass, which is itself an API over Lucene). I have an Order class that I would like to search but, I don t want to search all ...

Lucene seems to be caching search results - why?

In my project we use Lucene 2.4.1 for fulltext search. This is a J2EE project, IndexSearcher is created once. In the background, the index is refreshed every couple of minutes (when the content ...

热门标签