在 Java,我是如何下载一个被改用的网页的?
原标题:In Java, how I download a page that was redirected?
  • 时间:2011-05-02 19:27:38
  • java

我制造了一个网络拖网,有几页改用。 我怎么回过原来的网页?


总是有某种方式来接上该网页,然后又转方向。 没有任何改头的原始网页并不重要。

• 感谢和骚扰坏官。

EDIT:利用httpConn.setInstance FollowRedirects(true)跟踪Redirections,并将URL与httpConn.getURL合用。

1 The httpConn.getURL only will re-directed page if I calls httpConn.getDate before. 如果我这样做的话,它将在重新定向之前归还原来的URL。

2: Some sites like visa.com.br get the answer 200, but if I open then in the web browser, I see another page. Eg.: my program - visa.com.br - answer 200 (no redirections) web broser - visa.com.br/go/principal.aspx - html code different of the version that i get in my program


使用<代码>HttpURLConnection, 依附后改头。


httpConn.setInstanceFollowRedirects( false );
int responseCode = httpConn.getResponseCode();
while ((responseCode / 100) == 3) { /* codes 3XX are redirections */
   String newLocationHeader = httpConn.getHeaderField( "Location" );
   /* open a new connection and get the content for the URL newLocationHeader */
   /* ... */
   responseCode = httpConn.getResponseCode();
   /* do it until you get some code that is not a redirection */

你们可以很容易地得到 j印的改头脑。 而《人权法案》的重新定位则通过<代码>的违约处理。 HttpURLConnection 。 您可以做的是,查找几个关键词的网页内容:

  • the meta refresh tag
  • document.location=, window.location= and both with .href=

但这不能保证任何东西。 人们可能把 j印功能从外部垃圾档案中挑出来,而你则非常需要腾出资源和 par,你们不愿意这样做。

我最后使用。ache s HTTP的客户。 还有一个选择。

