Nginx之正则表达式、location匹配及rewrite重写

目录

一,rewhite作用

二、常见的Nginx正则表达式

三、location

1、location分类

2、匹配规则

 3、location匹配优先级

四、location 示例说明

4.1location 匹配顺序

4.2三个匹配规则定义

4.2-1 直接匹配网站根

4.2-2 处理静态文件请求

4.2-3通用规则

五、location优先级

六,在实际网络使用中,至少有三个匹配规则定义

七、rewrite

1、rewrite跳转实现

2、rewrite 执行顺序

3、flag标记说明

4、rewrite和location区别

八、rewrite 示例

1、基于域名的跳转

 2、基于客户端 IP 访问跳转

 3、基于旧域名跳转到新域名后面加目录


在Nginx已经成为很多公司作为前端反向代理服务器的首选,在实际工作中往往会遇到很多跳转(重写URL)的需求。比如更换域名后需要保持旧的域名能跳转到新的域名上、某网页发生改变需要跳转到新的页面、网站防盗链等等需求。
 

一,rewhite作用

1,URL看起来更加规范,合理

2,企业会将动态URL地址伪装成静态地址提供服务

3,网址换新域名后,让旧的访问跳转到新的域名上

4,服务端某些业务调整

二、常见的Nginx正则表达式

^ 匹配输入字符串的起始位置
$ Lt输入字符串的结束位置
匹配前面的宁符零次或多次。如ol""能匹配"o及"or".
"oll
+ 匹配前面的字符一次或多次。如r"ol+"能匹配"oI及"oll、"oll,但不能匹配"o”
? 匹配前面的字符零次或一次,例如do(es)?"能匹配“do”或“does”,”?”等效于”{0,1}”
.

匹配除""\n'之外的f何单个字符,若要匹配包括"\n"在内的任意字符,请使用诸如          "[.\n]"之类的模式

\

    将后面接着的字符标记为一个特殊字符或一个原义字符或一个向后引用

\d 匹配纯数字
{n} 重复n次
{n,} 重复n次或页多次
{n,m} 重复n到m次
 [ ] 定义匹配的字符范围
0 匹配单个字符c
[a-z] 匹配, a-z小写字母的任意一个
[a-zA-Z0-9] 匹配所有大小写字母或数字
() 表达式的开始和结束位置
| 或运算符

语法格式

rewrite  <regex> <replacement> [flag];

last  相当于apache的L标记,表示完成rewrite

break 本地规则匹配,完成即终止,不在匹配后面的任何规则

redirect 返回302临时重定向,浏览器地址会显示跳转后的URL地址,爬虫不会更新3URL

permanent 返回301永久重定向,浏览器地址栏会显示跳转后的

三、location

1、location分类

精准匹配 location =/{}
一般匹配 location / {}
正则匹配 location~/{}

2、匹配规则

l=

进行普通字符精确匹配,也就是完全匹配

^~

表示普通字符匹配。使用前缀匹配。如果匹配成功,则不再匹配其它location

~

区分大小写的匹配

~*

不区分大小写的匹配

!~

区分大小写的匹配取非

!~*

不区分大小写的匹配取非

 3、location匹配优先级

相同类型的表达式,字符串长的会优先匹配
按优先级排列
 
首先精确匹配  =
其次前缀匹配  ^~
其次按文件中顺序的正则匹配 ~或~*
然后匹配不带任何修饰符的前缀匹配
最后是交给 / 通用匹配

优先级总结

(location = 完整路径) > (location ^~ 路径) > (location ~,~* 正则顺序) > (location 部分起始路径) > (location /)

四、location 示例说明

① location = / {}

=为精准匹配 / ,主机名后面不能带任何字符串,比如访问 / 和 /data ,则 / 匹配 ,/data 不匹配。再比如 location = /abc ,则只匹配/abc,/abc/或/abcd 不匹配。若location /abc ,则匹配 /abc 、/abcd/ 、/abc/。

② location / {}

因为所有的地址都是以 / 开头,所以这条规则将匹配到所有普请求,比如访问 / 和 /data ,则 / 匹配,/data 也匹配。 但若后面还有正则表达式和最长字符,则优先匹配(最长匹配)

③location /documents/ {}

匹配任何以 /documents/ 开头的地址,匹配符合以后,还要继续往下搜索其它 location,只有其它 location 后面的正则表达式 没有匹配到时,才会采用这一条。

④location /documents/abc {}

匹配任何以 /documents/abc 开头的地址,匹配符合以后,还要继续往下搜索其它 location ,只有其它 location 后面的正则表达式没有匹配到时,才会采用这一条。

⑤ location ^~ /images/ {}

匹配任何以 /images/ 开头的地址,匹配符合以后,停止往下搜索正则,直接采用这一条。

⑥ location ~ .(gif|jpg|jpeng)$ {}*

匹配所有以gif、jpg或jpeng结尾的请求,然而,所有请求 /images/ 下的图片会被 location ^~ /images/ 处理,因为^~ 的优先级更高,所以到达不了这一条正则。

⑦ location /images/abc {}

最长字符匹配到 /images/abc ,优先级最低,继续往下搜索其它 location,会发现 ^~ 和~ 存在

⑧ location ~ /images/abc {}

匹配以/images/abc 开头的,优先级次之,只有去掉location ^~ /images/ 才会采用这一条

⑨ location /images/abc/1.html {}

匹配 /images/abc/1.html 文件,如果和正则 location ~ /images/abc/1.html 相比,正则优先级更高
 

4.1location 匹配顺序

首先看 优先级:精确>前缀>正则>一般>通用
优先级相同:正则看上下顺序,上面的优先;一般匹配看长度,最长匹配的优先
精确、前缀、正则、一般都没有匹配到,最后再看通用匹配

4.2三个匹配规则定义

实际网站使用中,至少有三个匹配规则定义

4.2-1 直接匹配网站根

  1. 第一个必选规则直接匹配网站根
  2. 通过域名访问网站首页比较频繁,使用这个会加速处理,比如说官网。
  3. 可以是一个静态首页,也可以直接转发给后端应用服务器
    location = / {
        root   html;
    	index  index.html index.htm;
    }

    4.2-2 处理静态文件请求

  1. 第二个必选规则是处理静态文件请求,这是nginx作为http服务器的强项
  2. 有两种配置模式,目录匹配或后缀匹配,任选其一或搭配使用

目录匹配

location ^~ /static/ {
    root /webroot/static/;
}

 后缀匹配

location ~* \.(html|gif|jpg|jpeg|png|css|js|ico)$ {
    root /webroot/res/;
}

4.2-3通用规则

第三个规则就是通用规则,比如用来转发带.php、.jsp后缀的动态请求到后端应用服务器
非静态文件请求就默认是动态请求

location / {
    proxy_pass http://tomcat_server;
}

五、location优先级

匹配某个具体文件
(location =完整路径) > (location ^~完整路径) > (location ~*完整路径) > (location ~完整路径) >
(location完整路径) > (location /)
location ~★完整路径> location ~完整路径/path
正则:原则精确度自定义一》为了尽量的节省资源
Path
path
PATH
更容易被定位到
 
用目录做匹配访问某个目录
(location =目录) > (location ^~目录/) > (location ~目录) > (location ~★目录) > (location 目录) >
(location /)
正则:原则精确度自定义--》为了尽量的节省资源
Path
install.html引导文件
path
install/bbs.html
PATH
install/ index . html
www . kgc. com/ Path/
 
 
文件目录为什么只会在区不区分大小写上会有变动
正则表达式:日的是为了尽量精确的匹配
文件一》尽量精确匹配,区分大小写精确、不区分更为精确
日录一-》 尽量精确匹配,区分大小写精确优先级更高,不区分大小写的
Path
install.html引导文件
path
install/bbs.html
PATH
install/ index . html
www . kgc. com/ Path/

六,在实际网络使用中,至少有三个匹配规则定义

#第一个必选规则
直接匹配网站根,通过域名访问网站首页比较频繁(www.baidu.com/),使用这个会加速处理,比如说官网。
可以是一“个静态首页,也可以直接转发给后端“应用服务器”一》PHP 、Apache
location / {
root    html;
index index.html index. htm;
 
}
 
 
 
#第二个必选规则是处理静态文件请求,这是nginx作为http服务器的强项(1、静态请求处理的能力+高并发处理能力+资源消耗较低)
有两种配置模式,日录匹配或后缀匹配,任选其一或搭配使用
location ^~ /static/ {
root / webroot/static/ ;
 
}
 
location ~* \. (html IIgif I1jpg ljpeglpng1cssljslico)$ {
root /webroot/res/ ;
}
 
 
 
 
 
#*★.第三个规则就是通用规则,比如用来转发带.php、.jsp后缀的动态请求到后端应用服务器
非静态文件请求就默认是动态请求(跳转/反向代理)
upstream     tomcat_ server.{
server 192. 168.226.128:8080 weight 1;
server 192.168.226.132:8080 weight 1;
 
}
 
location   ^/ \. (phpljsp)$ {
proxy_ pass http: I I tomgat_ server:
}
根“/"匹配一》匹配首页
静态资源匹配
动态跳转的匹配,是第三类必要匹配规则

七、rewrite

rewrite功能就是,使用nginx提供的全局变量或自己设置的变量,结合正则表达式和标记位实现URL重写以及重定向。
比如:更换域名后需要保持旧的域名能跳转到新的域名上、某网页发生改变需要跳转到新的页面、网站防盗链等等需求。

rewrite只能放在server{},location{},if{}中,并且默认只能对域名后边的除去传递的参数外的字符串起作用
例如 http://www.kgc.com/abc/bbs/index.php?a=1&b=2 只对/abc/bbs/index.php重写。

语法格式:

rewrite <regex> <replacement> [flag];

regex :表示正则匹配规则。
replacement :表示跳转后的内容。
flag :表示rewrite支持的flag标记。

1、rewrite跳转实现

Nginx:通过ngx_http_rewrite_module 模块支持URL重写、支持if条件判断,但不支持else
跳转:从一个 location跳转到另一个location,循环最多可以执行10次,超过后nginx将返回500错误
PCRE支持:perl兼容正则表达式的语法规则匹配
重写模块 set 指令:创建新的变量并设其值

2、rewrite 执行顺序

执行 server 块里面的 rewrite 指令。
执行 location 匹配。
执行选定的 location 中的 rewrite 指令。

3、flag标记说明

last :本条规则匹配完成后,继续向下匹配新的location URL规则,一般用在 server 和 if 中。
break :本条规则匹配完成即终止,不再匹配后面的任何规则,一般使用在 location 中。
redirect :返回302临时重定向,浏览器地址会显示跳转后的URL地址。
permanent :返回301永久重定向,浏览器地址栏会显示跳转后的URL地址。

4、rewrite和location区别

从功能看 rewrite 和 location 似乎有点像,都能实现跳转,主要区别在于 rewrite 是在同一域名内更改获取资源的路径,而 location 是对一类路径做控制访问或反向代理,还可以proxy_pass 到其他机器。

八、rewrite 示例

1、基于域名的跳转

现在公司旧域名www.yasuo.com有业务需求变更,需要使用新域名www.zyy.com代替,但是旧域名不能废除,需要跳转到新域名上,而且后面的参数保持不变。

1 vim /etc/hosts 进去添加网址/域名

 2 创建日志文件

 3 

vim /usr/local/nginx/conf/nginx.conf

server {
	listen       80;
	server_name  www.yasuo.com;		#域名修改	
	charset utf-8;
	access_log  /var/log/nginx/www.yasuo.com-access.log;		#日志修改
	location / {
	#添加域名重定向
        if ($host = 'www.lic.com'){						#$host为rewrite全局变量,代表请求主机头字段或主机名
			rewrite ^/(.*)$ http://www.zyy.com/$1 permanent;	#$1为正则匹配的内容,即“域名/”之后的字符串
        }
        root   html;
        index  index.html index.htm;
    }
}

 重启nginx 进入网页查看

 

 2、基于客户端 IP 访问跳转

今天公司业务新版本上线,要求所有 IP 访问任何内容都显示一个固定维护页面,只有公司 IP :192.168.100.111访问正常。

vim /usr/local/nginx/conf/nginx.conf

server {
	listen       80;
	server_name  www.zyy.com;		#域名修改	
	charset utf-8;
	access_log  /var/log/nginx/www.zyy.com-access.log;		#日志修改

	#设置是否合法的IP标记
    set $rewrite true;							#设置变量$rewrite,变量值为boole值true
    #判断是否为合法IP
   #remode_addr表示客户端
	if ($remote_addr = "192.168.111.100"){		#当客户端IP为192.168.111.100时,将变量值设为false,不进行重写
        set $rewrite false;
    }
	#除了合法IP,其它都是非法IP,进行重写跳转维护页面
    if ($rewrite = true){						#当变量值为true时,进行重写
        rewrite (.+) /weihu.html;				#将域名后边的路径重写成/weihu.html,例如www.kgc.com/weihu.html
    }
    location = /weihu.html {
        root /var/www/html;						#网页返回/var/www/html/weihu.html的内容
    }
	
	location / {
        root   html;
        index  index.html index.htm;
    }
}


mkdir -p /var/www/html/
echo "<h1>We are maintaining now!</h1>" > /var/www/html/weihu.html
mkdir -p /var/www/html
echo "lichen ge hanpi" > /var/www/html/weihu.html

systemctl restart nginx

 只有本机能跳转,其他机子直接跳转到weihu界面

 

​​​​​​​

猜你喜欢

转载自blog.csdn.net/zyy1020075955/article/details/126665180