English 中文(简体)
露骨专家:如何最佳地针对索引员进行诊断,以解决业绩问题?
原标题:Lucene experts: how best to run diagnostics against an IndexWriter to resolve performance issues?

我拿着目前大约1gb空间的指数,大约有250万份文件。 该指数储存在快速的固态驱动力上。 每次增加2 500份文件之后,每批文件都投入使用。 该指数是“终身”指数,需要在整个白天和晚上不断更新,因此尽量减少书写速度非常重要。 采用10个合并系数的Im,从来不使用<代码>Optimize(),而是允许该指数根据合并系数优化本身。

我需要在每个批次之后再投文件,因为我记录这一事实,这样,如果飞机坠毁或重新开工,它就可以在离去之处走。 如果我没有承诺,储存状态将不符合指数中的内容。 如果撰稿人没有承诺就销毁,我将不作补充、删除和更新。

无论如何,我注意到,经过一段任意的时间,时间可能从两分钟或两小时不等,而且以前的一些承诺数目也各不相同,索引员似乎在上 st。 添加文件(doc)方法,我可以说,它为什么会拖延或如何固定。 该区可以停留在两小时以上,似乎奇怪的是,在数百万份低价文件中,该指数的计算低于2GB,并且有SSD运动。

是什么原因可以阻止添加文件? 是否有任何可帮助我的卢塞尼诊断设施? 我可以指望什么来追踪这一问题?

最佳回答

您可以使用索引。 SetInfoStream()将诊断结果转向可能给你造成错失行为的上游。

问题回答

暂无回答




相关问题
Lucene.NET in medium trust

How do I make Lucene.NET 2.3.2 run in a medium trust environment? GoDaddy doesn t like it the way it is.

Grails searchable plugin

In my Grails app, I m using the Searchable plugin for searching/indexing. I want to write a Compass/Lucene query that involves multiple domain classes. Within that query when I want to refer to the id ...

Search subset of objects using Compass/Lucene

I m using the searchable plugin for Grails (which provides an API for Compass, which is itself an API over Lucene). I have an Order class that I would like to search but, I don t want to search all ...

Lucene seems to be caching search results - why?

In my project we use Lucene 2.4.1 for fulltext search. This is a J2EE project, IndexSearcher is created once. In the background, the index is refreshed every couple of minutes (when the content ...

热门标签