主要介绍了Referer
原理与图片防盗链实现方法,结合实例形式分析了Referer
头信息原理与图片防盗链判定、实现方法,并附带一个Http
请求封装类,需要的朋友可以参考下
1. 图片防盗链
在一些大型网站中,比如百度贴吧,该站点的图片采用了防盗链的规则,以至于使用下面代码会发生错误。
1 2 3 4 5 6 7 8 9 10 11 12 13
| <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge"> <title></title> <link rel="stylesheet" href=""> </head> <body> <img src="http://imgsrc.baidu.com/forum/pic/item/03a4462309f79052204229be04f3d7ca7acbd5d5.jpg"/> </body> </html>
|
主要是该站点的图片采用了防盗链的规则,其实这个规则也比较简单,和大家一说就知道啦,主要是该站点在得知有请求时,会先判断请求头中的信息,如果请求头中有Referer
信息,然后根据自己的规则来判断Referer
头信息是否符合要求,Referer
信息是请求该图片的来源地址。
浏览器中的请求头信息
- 正常使用百度贴吧查看图片的请求头信息
- 我的代码的头信息
相信大家看到这,也就明白了,为什么我的代码不能访问到图片,而是显示一张警告盗链图片,因为我们的Referer头信息和百度贴吧的不同,当我的请求发出去时,该站点查看Referer头信息,一看来源不是本站,就重定向到另外一张图片了。
给自己的站点配置图片防盗链
配置APACHE
- 在web服务器中开启
mod_rewrite
模块
- 在需要防盗的网站或目录中,写
.htaccess
文件,并指定防盗链规则
- 新建一个
.htaccess
文件
- 查找手册,在
.htaccess
文件中利用正则判断
- 指定规则,如果是图片资源且
referer
头信息是来自于本站,则通过
假定我的服务器是localhost,规则的意思是,如果请求的是图片资源,但是请求来源不是本站的话,就重定向到当前目录的一张no.png的图片上
1 2 3 4
| RewriteEngine On RewriteCond %{SCRIPT_FILENAME} .*\.(jpg|jpeg|png|gif) [NC] RewriteCond %{HTTP_REFERER} !localhost [NC] RewriteRule .* no.png
|
配置NGINX
1 2 3 4 5 6 7
| location /images { valid_referers none blocked www.baidu.com 192.168.200.222 *.example.com example.* www.example.org ~\.google\.; if ($invalid_referer){ return 403; } root /usr/local/nginx/html; }
|
2. 反防盗链
上面我的服务器配置了图片防盗链,现在以它来讲解反防盗链,如果我们在采集图片的时候,遇到使用防盗链技术的站点,我们可以在采集图片的时候伪造一个Referer
头信息。
1 2 3 4 5 6 7 8 9 10 11 12 13
| <?php
require './Http.class.php'; $http = new Http("http://localhost/booledu/http/apple.jpg");
$res = $http->get(); $content = strstr($res,"\r\n\r\n"); file_put_contents('./toutupian.jpg',substr($content,4)); echo "ok"; ?>
|
其实就是加上一个Referer
头信息,那么,每个站点的Referer
头信息从哪里找呢?这个应该抓包分析就可以得出来了!
3. 封装的Http请求类
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99
| <?php
class Http{ const CRTF = "\r\n"; private $errno = -1; private $errstr = ''; private $timeout = 5; private $url = null; private $version = 'HTTP/1.1'; private $requestLine = array(); private $header = array(); private $body = array(); private $fh = null; private $response = ''; public function __construct($url){ $this->connect($url); $this->setHeader('Host:'.$this->url['host']); } public function connect($url){ $this->url = parse_url($url); if(!isset($this->url['port'])){ $this->url['port'] = 80; } $this->fh = fsockopen($this->url['host'],$this->url['port'],$this->errno,$this->errstr,$this->timeout); } public function setRequestLine($method){ $this->requestLine[0] = $method.' '.$this->url['path'].' '.$this->version; } public function setHeader($headerLine){ $this->header[] = $headerLine; } public function setBody($body){ $this->body[] = http_build_query($body); } public function get(){ $this->setRequestLine('GET'); $this->request(); $this->close(); return $this->response; } private function request(){ $reqestArr = array_merge($this->requestLine,$this->header,array(''),$this->body,array('')); $req = implode(self::CRTF,$reqestArr); fwrite($this->fh,$req); while(!feof($this->fh)){ $this->response .= fread($this->fh,1024); } } public function post($body = array()){ $this->setRequestLine("POST"); $this->setBody($body); $this->setHeader('Content-Type:application/x-www-form-urlencoded'); $this->setHeader('Content-Length:'.strlen($this->body[0])); $this->request(); $this->close(); return $this->response; } public function close(){ fclose($this->fh); } }
?>
|
如果您喜欢此博客或发现它对您有用,则欢迎对此发表评论。 也欢迎您共享此博客,以便更多人可以参与。 如果博客中使用的图像侵犯了您的版权,请与作者联系以将其删除。 谢谢 !