我正在考虑一个脚本,它可以扫描10多个网站,在特定的div
中查找特定的内容。假设它将被适度使用,每天大约400次搜索。
标题中的两个选项中,哪一个可以更好地支持负载、占用更少的资源并提供更好的速度:
从每个网站创建DOM,然后针对特定的div id迭代每个网站
或
creating a string from the website with file_get_contents
,
and then regexping the needed string.
为了更具体地说明我需要执行什么样的操作,请听以下内容,
Additional question: Is regexp capable of searching the following occurrence of the given string:
<div id="myId"> needed string </div>
以识别具有给定ID的标签,并仅返回标签之间的内容?
请只回答是/否,如果可能的话,我将打开一个关于语法的单独问题,这样就不会全部捆绑在这里了