我正在寻找一个Perl图书馆,处理银行的询问,但需要处理比典型应用程序大得多的海滩。 它需要:
c 每份约20万份记录,平均可能有两个甲基溴当量(总共400 GB)
have no maximum record size (or at least a fairly large one, like several GB)
储存量高于预约上限时,自动删除最老的(最后进入时间)记录。
鉴于上述要求,尽可能快
到目前为止,我所看的图书馆有:CHI和Cache:SizeAwareFileCache(Cache:Cache)。
我对爱幼会的主要关切是,我需要使用爱护:驾驶员:用精干_——转播,但文件特别警告:
......对于无法原谅地读和更新价值(例如,CHI:驱动力:File)的驱动因素,在更新规模方面存在着种族条件,可能会造成规模随时间演变不准确。
The main concern I have with Cache::SizeAwareFileCache is that Cache::Cache is old and not currently maintained. One of the first things I see in the documentation is a section that advises me to use CHI instead.
任何建议? 我是否应该利用这两个图书馆中的任何一个或其它一些? 我的讽刺是想为此而 use? 是否有任何人经历过类似的要求? 请提出任何建议。
www.un.org/Depts/DGACM/index_spanish.htm 关于申请的一些细节:。
我的申请是对大型网站进行分析,以研究超文本代码中难以确定的错误/不一致之处,这些错误/要素往往被埋在数十万页之内。 该申请使整个网站无法使用,并储存了亚洲开发银行每一页的超文本。 (一台MySQL服务器,运行一个单独的机器) 拖网完工后,用户可以操作各种软件工具,分析网站每一页的超文本。
这些工具等待着点,并同时运行。 每个工具都需要装上拖网每一页的超文本,总是按同一顺序。 因此,如果拖网占用了10万页,用户需要使用15种不同的工具,那么海滩需要持有至少10万份记录,每份记录将改为15次。 关键是,各新闻中心能够同时从某个地点储存所有网页。 (否则每页都会放下,然后又每件工具重新排列,每件工具将比完全没有打上下)
最大的目标是减少数据库的负荷。 第二(但依然非常重要)目标是提高速度。