我需要建立一个数据结构,高效提供关键词搜索设施。
我的衡量标准是:
- Circa 500,000 products.
- Circa 20+ keywords per product (a guess).
- Products are identified by an ID of about 10 digits but may be any ASCII codes going forward.
我希望尽可能使数据结构符合记忆。 我将坐在一个服务器上,因此我可以承担一些重要的记忆。
速度很重要。 利用<代码>LIKE数据库查询不是一种可以接受的解决办法。
对数据结构的任何想法?
我的想法:
<><>TrieMap>
关键词非常有效,但需要一份产品识别清单,以避开任何严重记忆饥饿的传单。 任何可以帮助这样做的想法?
<<>Compression
出现了各种压缩计划,但从重要价值来看,没有一项跳出。
是否有人把这样的东西加在一起? 你们能否分享经验?
数据可能发生变化,但并非经常变化。 每天重建结构以适应变化是合理的。