开发笔记📐 发现👽 人物👮 趣闻💦
nginx路由配置 从location对url匹配到Rewrite重写

nginx路由配置 从location对url匹配到Rewrite重写
2018-06-12 16:59:39   点击:

nginx中location对url匹配

语法:location [=|~|~*|^~] /uri/ { … }

当匹配中符合条件的location,则执行内部指令;如果使用正则表达式,必须使用~*表明不区分大小写或者~区分大小写匹配;例如:location ~* \.(gif|jpg|jpeg)$ ;当配皮成功后,将停止往下匹配;如果没有找到,则使用常规自字符串处理结果;

如果不是用正则表达式;可使用=严格匹配;

如果使用^~前缀用于一个常规字符串;表示如果路径匹配,则不测试正则表达式;

总结:指令按下列顺序被接受

  • =前缀的指令严格匹配这个查询;如果找到停止往下匹配
  • 挣下的常规字符串,长的在前,如果这个匹配使用^~前缀,匹配停止;
  • 正则表达式,按配置文件的顺序;
  • 如果第三步产生匹配。则使用这个结果;停止匹配;否则使用第二部的匹配结果;
     

举例: 

location = / {

    #只匹配/查询

  }

  location / {

    #匹配任何查询,所有请求都是以/开头。但是正则表达式规则和长的块规则将被优先匹配和查询;

  }

  location ^~ /images/ {
    # 匹配任何已 /images/ 开头的任何查询并且停止搜索。任何正则表达式将不会被测试。
    }

  location ~* \.(gif|jpg|png)${

    #匹配任何以gif、jpg、png结尾的请求。然后所有/images/目录的请求将使用第三个

  }

  例子请求:

    / -> configuration A

    /documents/document.html -> configuration B

    /images/1.gif -> configuration C

    /documents/1.jpg -> configuration D
 

举例2:

location = / { #精确匹配,/后面不能加任何字符串,符合此条件就直接返回数据,不再像下匹配。
if (-d $request_filename) {
root /usr/local/nginx/html/; #当用户访问newweb的时候,则显示此目录的内容,除此之外访问其他的任何目录都不匹配。
  [动作A]
}

location / {
# 因为所有的地址都以/开头,所以这条规则将匹配到所有请求,但是非精确匹配会采取正则和最长字符串会优先匹配,因此还会向下继续匹配,比如当访问/bbs的时候,还需要看下面是否更精确的匹配。
[ 动作B]
}

location /documents/ {
# 匹配任何以 /documents/ 开头的地址,匹配符合以后,还要继续往下搜索
# 如果后面的正则表达式都没有匹配到,就匹配这一条
[动作C]
}

location ^~ /images/ { #匹配任何以/images/ 开头的任何请求并且停止搜索,后面任何正则表达式将不会被测试。
# 匹配任何以 /images/ 开头的地址,匹配符合以后,停止往下搜索正则,采用这一条。
[动作D]
}

location ~* \.(gif|jpg|jpeg)$ { #~*为不区分大小写
# 匹配所有以 gif,jpg或jpeg 结尾的请求
# 然而,所有请求/images/下的图片会被动作D匹配处理,因为动作D有^~会优先匹配并终止匹配,所以到达不了这一条正则
[动作E]
}

location /images/ {
# 字符匹配到 /images/,继续往下,会发现 ^~ 存在,如果动作D存在,则这一条就不生效。
[动作F]
}

location /images/abc {
#最长字符匹配到 /images/abc,继续往下,会发现 ^~ 存在,如果D存在,则这一条就不生效。
#F与G的放置顺序是没有关系的
[动作G]
}

location ~ /images/abc/ {
# 动作D存在,这一条不生效,如果注销动作D,则会优先最长匹配 动作G 开头的地址,然后向下匹配,到这一条的时候就会匹配并生效。
[ configuration H ]
}

匹配优先级,顺序 no优先级:
(location =) > (location 完整路径) > (location ^~ 路径) > (location ~,~* 正则顺序) > (location 部分起始路径) > (/)

上面的匹配结果
按照上面的location写法,以下的匹配示例成立:

/ -> config A
精确完全匹配,即使/index.html也匹配不了

/downloads/download.html -> config B
匹配B以后,往下没有任何匹配,采用B

/images/1.gif -> configuration D
匹配到F,往下匹配到D,停止往下

/images/abc/def -> config D
最长匹配到G,往下匹配D,停止往下
你可以看到 任何以/images/开头的都会匹配到D并停止,FG写在这里是没有任何意义的,H是永远轮不到的,这里只是为了说明匹配顺序

/documents/document.html -> config C
匹配到C,往下没有任何匹配,采用C

/documents/1.jpg -> configuration E
匹配到C,往下正则匹配到E

/documents/Abc.jpg -> config CC
最长匹配到C,往下正则顺序匹配到CC,不会往下到E
 

 

匹配成功后location中可以使用rewrite进行路由重写

首先需要了解nginx rewrite中可以使用到的全局变量;

$args  :请求中get的参数,例如a=1&b=2;

$body_remote_add  :二进制客户地址

$body_byte_sent  :相应时发送出去的body字节数数量,即使链接中断这个数据也是精确的;

$content_length  :请求头中的Content_length字段

$content_type  :请求中的Content_type字段

$document_root  :当前请求在root指令中的位置;服务器中绝对路径

$document_url  :与uri相同

$host  :请求主机头字段,否则为服务器名称;

$hostname  :保存了当前请求中不包含指令的uri,例如:http://www.aaa.com/index.php?a=1中的/index.php;

$host  :请求的服务器名称;

$http_user_agent  :客户端浏览器的详细信息,如果使用 chrome 和Firefox 则访问结果是

Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.87 Safari/537.36 #chrome的浏览器信息
Mozilla/5.0 (Windows NT 6.1; WOW64; rv:46.0) Gecko/20100101 Firefox/46.0 #Firefox的浏览器信息

$http_cookie  : 客户端cookie信息;

$limit_rate  :如果nginx服务器中使用limit_rate配置了显示网络速率,则会显示,如果没有则为0

$remote_addr  :客户端的地址,每个客户端的公网ip,

$remote_port  :客户端请求nginx服务器时随机打开的端口,这个每个客户端自己的端口;

$remote_user  :已经经过auth basic module验证的用户名

$request_body_file  :作反向代理是发给服务端的本地资源名称

$request_method  :请求志愿的方式,get\put\delete等

$request_filename  :请求的资源文件的路径名称

$request_url  :请求参数的原始uri,不包含主机名;如"/index.php?a=1"

$squery_string  :保存了url请求的指令,与$args相同

$scheme  :请求协议;如http、https、ftp

$server_protacpl  :保存了客户端请求资源使用的协议的版本,如http/1.0、http/1.1

$server_addr  :保存了服务器ip

$server_name  :保存了服务器的主机名;该变量不一定是用户访问的域名,是你的server_name配的地址;

$host  :保存了用户访问的域名

$server_port  :服务器端口

$uri与$document_uri相同  :不包含指令的uri地址

 

防盗链:注意location生效规则,否则防盗链不起作用

配置参数说明:

none

'Referer' :来源头部为空的情况

blocked

'Referer' :来源头部不为空,但里面的值被代理或者防火墙删除,这些值都不以http://或者https://开头

server_names

'Referer' :来源头部包含当前的server_name,就是域名

arbitary string :任意字符串,定义服务器名或者可选的url前缀,主机名可以使用*开头或者结尾,在检测来源头部这个过程中,来源域名中的主机端口将会被忽视;

regular expression :正则表达式,表示排除https://或者http://开头的字符串

下面两个案例:

location ~* \.(gif|jpg|png|bmp)$ {

valid_referers none blocked *.aaa.com server_names ~\.google\. ~\.baidu\.;

if ($invalid_referer) {

return 403;

#rewrite ^/ http://www.aaa.com/1.jpg; }

}

以上所有来至aaa.com和域名中包含google和baidu的站点都可以访问到当前站点的图片,如果来源域名不在这个列表中,那么$invalid_referer等于1,在if语句中返回一个403给用户,这样用户便会看到一个403的页面,如果使用下面的rewrite,那么盗链的图片都会显示403.jpg。如果用户直接在浏览器输入你的图片地址,那么图片显示正常,因为它符合none这个规则.

 

location ~* \.(gif|jpg|png|swf|flv)$ { # 防盗链设置,对于后缀是gif、jgp等格式的生效
valid_referers none blocked a.com*.a.com; #定义允许访问的请求链接
if ($invalid_referer) {
return 404;
}
}

none:在浏览器输入网站域名直接访问的请求,需要允许访问的
blocked:有referer首部,但是referer首部被清除了,一般是防火墙改过的请求
server_name:带服务器名称的,一般是本机或其他服务器的请求,a.com和*.a.com是本公司的域名,要允许访问于是要先允许本机的访问,再禁止其他服务器的访问

location /public/admin/images/y.jpg {
#valid_referers none blocked *.aaa.com server_names *.aaa.com ;
#valid_referers none blocked www.sss.com; #设置只有该域> 名可以访问
valid_referers none blocked 111.111.111.11; #设置只有该域名可以访> 问
if ($invalid_referer) {
rewrite ^ http://baidu.com$request_uri?;
return 403;
rewrite ^/ http://www.aaa.com/1.jpg; }
}

 

常用正则匹配

. : 匹配除换行符以外的任意字符
? : 重复0次或1次
+ : 重复1次或更多次
* : 重复0次或更多次
\d :匹配数字
^ : 匹配字符串的开始
$ : 匹配字符串的介绍
{n} : 重复n次
{n,} : 重复n次或更多次
[c] : 匹配单个字符c
[a-z] : 匹配a-z小写字母的任意一个
小括号()之间匹配的内容,可以在后面通过$1来引用,$2表示的是前面第二个()里的内容。正则里面容易让人困惑的是\转义特殊字符。

 

参考if判断语句

if ($http_user_agent ~ MSIE) { #如果客户端是微软的IE浏览器,就将请求rewrite到msie目录下。
rewrite ^(.*)$ /msie/$1 break;
}

if ($http_cookie ~* "id=([^;]+)(?:;|$)") { # 如果cookie匹配正则,就设置变量$id等于正则引用部分
set $id $1; 设置$id等于正则第一个括号内匹配的部分
}

if ($request_method = POST) { #如果提交方法为POST,则返回状态405(Method not allowed)。return不能返回301,302
return 405;
}

if ($slow) { #限速,$slow可以通过 set 指令设置
limit_rate 10k;
}

if (!-f $request_filename){ #如果请求的文件名不存在,则反向代理到localhost 。这里的break也是停止rewrite检查
break;
proxy_pass http://127.0.0.1; }

if ($args ~ post=140){ #如果query string中包含"post=140",永久重定向到example.com
rewrite ^ http://example.com/ permanent;
}

 

nginx 配置案例参考

http {

# 定义image日志格式

log_format imagelog '[$time_local] ' $image_file ' ' $image_type ' ' $body_bytes_sent ' ' $status;

# 开启重写日志

rewrite_log on;

server {

root /home/www;

location / {

# 重写规则信息

error_log logs/rewrite.log notice;

# 注意这里要用‘’单引号引起来,避免{}

rewrite '^/images/([a-z]{2})/([a-z0-9]{5})/(.*)\.(png|jpg|gif)$' /data?file=$3.$4;

# 注意不能在上面这条规则后面加上“last”参数,否则下面的set指令不会执行

set $image_file $3;

set $image_type $4;

}

location /data {

# 指定针对图片的日志格式,来分析图片类型和大小

access_log logs/images.log mian;

root /data/images;

# 应用前面定义的变量。判断首先文件在不在,不在再判断目录在不在,如果还不在就跳转到最后一个url里

try_files /$arg_file /image404.html;

}

location = /image404.html {

# 图片不存在返回特定的信息

return 404 "image not found\n";

}

}

 

完全接管路由配置举例

server {

listen 80 www.deadnine.com;

listen [::]:80 www.deadnine.com;

root /var/www/laravel-project/public;

index index.php index.html index.htm;

server_name www.deadnine.com;

location / {

try_files $uri $uri/ /index.php?$query_string;

}

location ~ \.php$ {

try_files $uri /index.php =404;

fastcgi_split_path_info ^(.+\.php)(/.+)$;

fastcgi_pass unix:/var/run/php7.1-fpm.sock;

fastcgi_index index.php;

fastcgi_param SCRIPT_FILENAME $document_root$fastcgi_script_name;

include fastcgi_params;

}}

本文部分内容来源:http://www.cnblogs.com/jackylee92/p/6836948.html

nginx 后端 location rewrite 路由

上一篇:Nginx重定向HttpRewrite模块 用正则表达式改变URI
下一篇:Apache路由配置.htaccess详解 更改httpServer每个目录设置