來源:北京SEO 時間:2019-04-05
  有些行業的站點做的非常隱蔽,哪怕是模擬百度蜘蛛UA也不能訪問到真實的百度蜘蛛抓取結果,而且站點還禁止了百度快照的顯示,如果想看到它在百度蜘蛛下的內容也是有些辦法可以嘗試的,比如偽造ip。可以用php的curl模塊實現,上代碼:
 
  <?php
 
  $headers=[//構造百度蜘蛛IP
 
  'CLIENT-IP:220.181.108.117',
 
  'X-FORWARDED-FOR:220.181.108.117',];
 
  $UserAgent="Mozilla/5.0+(compatible;+Baiduspider/2.0)";//構造百度蜘蛛UA
 
  $ch=curl_init();
 
  curl_setopt($ch,CURLOPT_URL,'http://www.website.com/');//這里寫要訪問的站點
 
  #curl_setopt($ch,CURLOPT_REFERER,'http://www.baidu.com/');//構造來路
 
  curl_setopt($ch,CURLOPT_USERAGENT,$UserAgent);
 
  curl_setopt($ch,CURLOPT_HTTPHEADER,$headers);
 
  curl_setopt($ch,CURLOPT_HEADER,false);
 
  curl_exec($ch);
 
  curl_close($ch);
 
  ?>
 
  把這個代碼放到一個php文件里,然后執行這個php文件,就能看到你要訪問的網址給你返回的內容。HTTP_CLIENT_IP是服務器發送的HTTP頭,這個參數值是可以隨便修改的。
 
  所以,需要明白一點:
 
  如果服務器端用$_SERVER[‘HTTP_CLIENT_IP’]判斷來訪ip,那么這方法是可行的;
 
  如果用$_SERVER[‘REMOTE_ADDR’]來判斷來訪ip,那么這方法就失效了。$_SERVER[‘REMOTE_ADDR’]獲取的是真實的ip,是你的客戶端跟你的服務器“握手”時候的IP。
 
  補充知識:
 
  php中的$_SERVER數組中以HTTP開頭的值,都是由客戶端(client)傳遞到服務端的,也就是說這一部分是可以進行偽造的,而$_SERVER[“REMOTE_ADDR”]是由服務器傳遞的,是不能進行偽造的。
 
  這里https://www.cnblogs.com/codefly-sun/p/5941314.html有更詳細的介紹。
羽毛球的规则