我正在为全文搜索制作搜索引擎, 在用描述显示结果时出现性能问题。 我为当前查询做了结果, 但缺乏性能是因为当我试图获取文本并突出关键字所在部分时。 我使用 pdf, txt, doc, docs, html 等。 因此, 我的搜索引擎像 :
- I have a db table where i store the document text
- I have a db table where i index the text with it s frequency
这个方案是否很好。 我必须搜索索引并获取文档, 分析文本, 获取句子, 用关键字过滤句子。 无需描述搜索的性能是 :
**Крушевското Востание 1903** 0,00518989562988
**Даме Груев** 0,00394678115845
**Даме Груев и Гоце Делчев** 0,0916090011597
**Државен празник Илинден** 0,0072648525238
**Даме** 0,00195503234863
**Александар Македонски** 0,0423209667206
**Бранко Црвенковски и Никола Груевски** 0,0233609676361
**СДСМ и ВМРО-ДПМНЕ** 0,0295231342316
**Македонија** 0,0435738563538
**Никола Груевски и Македонија** 0,0451180934906
搜索关键词是用我母语编写的,文件的收集为3679。 带有句子的描述标记, 我对结果的显示慢了10x20x倍( 类似 2-3 秒) 。 搜索用 Python 进行 。
有什么建议吗?