English 中文(简体)
我该如何编程地从另一个网站上抓取图片?
原标题:How can I programmatically scrape an image from another website?

几年前,我曾帮助某人组建一个网页(仅用于本地个人使用,不向世界提供服务),它可以从他最喜欢的几个网站中汇集户外网络摄像头的照片。这可以节省查看多个网站的时间。当这些网站上的图像具有固定的URL时,我们可以轻松处理。当URL可预测地发生更改时(例如,在URL中使用日期),我们能编写一些JavaScript代码。但现在,他想添加一个文件名看似随机变化的图像,我不知道该怎么处理。基本上,我想:

  1. Programmatically visit another website to find the URL of a particular image.
  2. Insert that URL into my webpage with an <img> tag.

我意识到这可能是一个令人困惑和不寻常的问题。我愿意尽可能帮助澄清。我只是不确定该怎么要求这个人想做什么。

<>Update: David Dorward提到,与Javales做这件事违反了http://en.wikipedia.org/wiki/Same_origin_policy”rel=“nofollow noretinger”>Same Origin Policy 。 我愿意就解决这一问题的其他方法提出建议。

最佳回答
  1. Fetch html of remote page using Cross Domain AJAX.
  2. Then parse it to get urls of images of interest.
  3. Then for each url do <img src=url />
问题回答

这可能是对版权的重大侵犯。

这张图片很可能被包含在网页中 - 只需定期访问该页面并解析img标签。确保您评论的随机位不仅仅是为了强制浏览器获取新鲜的图像而不是检索缓存版本的随机参数。

如果你在自己的项目中使用网址,你就可以利用CURL图书馆获取另一个网站内容,并利用网站栏目从源码中获取图像。

您的个人资料中有一个Python问题,所以我想说如果我要尝试做这个,我会选择使用Python和Beautiful Soup。更好的一点是它可以处理无效的HTML。





相关问题
CSS working only in Firefox

I am trying to create a search text-field like on the Apple website. The HTML looks like this: <div class="frm-search"> <div> <input class="btn" type="image" src="http://www....

image changed but appears the same in browser

I m writing a php script to crop an image. The script overwrites the old image with the new one, but when I reload the page (which is supposed to pickup the new image) I still see the old one. ...

Firefox background image horizontal centering oddity

I am building some basic HTML code for a CMS. One of the page-related options in the CMS is "background image" and "stretch page width / height to background image width / height." so that with large ...

Separator line in ASP.NET

I d like to add a simple separator line in an aspx web form. Does anyone know how? It sounds easy enough, but still I can t manage to find how to do it.. 10x!

热门标签