nginx的配置与使用 四、nginx配置location总结及rewrite规则写法
一.反向代理
下列配置就将本地80端口对应的主机转发到小编的博客中
server {
listen 80;
server_name cong.blog.com;
location / {
proxy_pass https://www.cnblogs.com/QicongLiang/;
}
}
二.负载均衡
upstream myblog {
ip_hash;
server myblog1.example.com;
server myblog2.example.com;
server myblog3.example.com;
server myblog4.example.com;
}
location / {
proxy_pass http://myblog;
}
三.配置参数详解
http {
#设定mime类型,类型由mime.type文件定义
include /etc/nginx/mime.types;
default_type application/octet-stream;
#设定日志格式
access_log /var/log/nginx/access.log;
#设定负载均衡的服务器列表
upstream load_balance_server {
server 192.168.1.11:80 weight=5; #weigth参数表示权值,权值越高被分配到的几率越大
server 192.168.1.12:80 weight=1;
server 192.168.1.13:80 weight=6;
}
#HTTP服务器
server {
listen 80; #侦听80端口
server_name www.helloworld.com; #以域名区分主机,定义使用www.xx.com访问
location / { #对所有请求进行负载均衡请求
root /root; #定义服务器的默认网站根目录位置
index index.html index.htm; #定义首页索引文件的名称
proxy_pass http://load_balance_server ; #请求转向load_balance_server 定义的服务器列表
#以下是一些反向代理的配置(可选择性配置)
#proxy_redirect off; #proxy_redirect指定修改被代理服务器返回的响应头中的location头域跟refresh头域数值,如后端服务器用的端口为8080,关闭redirect后将会向客户端返回Location:http://192.168.1.154:8080/wuman/,而开启redirect后将会对localtion进行修改,返回Location:http://192.168.1.154/wuman/,这样就不会暴露后端服务器信息。
proxy_set_header Host $host; #如果请求头有host字段时,$http_host和$host都是原始的’HOST’字段,例如请求的时候HOST的值是www.****.net 那么反代后还是www.****.net,如果请求头没有host字段,则建议使用$host,这表示当前location中的server_name的值。
proxy_set_header Host $http_host;
proxy_set_header Host $proxy_host; #$proxy_host 自然是 proxy_pass后面跟着的host了
proxy_set_header X-Real-IP $remote_addr; #记录最后一跳的真实ip
proxy_set_header X-Forwarded-For $remote_addr; #后端的Web服务器可以通过X-Forwarded-For获取用户真实IP
一般来说,X-Forwarded-For
是用于记录代理信息的,每经过一级代理(匿名代理除外),代理服务器都会把这次请求的来源IP
追加在X-Forwarded-For
中
来自4.4.4.4
的一个请求,header包含这样一行
X-Forwarded-For: 1.1.1.1, 2.2.2.2, 3.3.3.3
代表 请求由1.1.1.1
发出,经过三层代理,第一层是2.2.2.2
,第二层是3.3.3.3
,而本次请求的来源IP4.4.4.4
是第三层代理
而X-Real-IP
,没有相关标准,上面的例子,如果配置了X-Read-IP
,可能会有两种情况
// 最后一跳是正向代理,可能会保留真实客户端IP
X-Real-IP: 1.1.1.1
// 最后一跳是反向代理,比如Nginx,一般会是与之直接连接的客户端IP
X-Real-IP: 3.3.3.3
#正向代理与反向代理的含义详细请见,博客----正向代理与反向代理
proxy_connect_timeout 90; #nginx跟后端服务器连接超时时间(代理连接超时)
proxy_send_timeout 90; #后端服务器数据回传时间(代理发送超时)
proxy_read_timeout 90; #连接成功后,后端服务器响应时间(代理接收超时)
proxy_buffer_size 4k; #设置代理服务器(nginx)保存用户头信息的缓冲区大小
proxy_buffers 4 32k; #proxy_buffers缓冲区,网页平均在32k以下的话,这样设置
proxy_busy_buffers_size 64k; #高负荷下缓冲大小(proxy_buffers*2)
proxy_temp_file_write_size 64k; #设定缓存文件夹大小,大于这个值,将从upstream服务器传
client_max_body_size 10m; #允许客户端请求的最大单文件字节数
client_body_buffer_size 128k; #缓冲区代理缓冲用户端请求的最大字节数
}
}
}
四、nginx配置location总结及rewrite规则写法
4.1 正则
-
.
: 匹配除换行符以外的任意字符 -
?
: 重复0次或1次 -
+
: 重复1次或更多次 -
*
: 重复0次或更多次 -
d
:匹配数字 -
^
: 匹配字符串的开始 -
$
: 匹配字符串的介绍 -
{n}
: 重复n次 -
{n,}
: 重复n次或更多次 -
[c]
: 匹配单个字符c -
[a-z]
: 匹配a-z小写字母的任意一个~ 区分大小写匹配
~* 不区分大小写匹配
!~和!~*分别为区分大小写不匹配及不区分大小写不匹配
^ 以什么开头的匹配
$ 以什么结尾的匹配
-
小括号
()
之间匹配的内容,可以在后面通过$1
来引用,$2
表示的是前面第二个()
里的内容。正则里面容易让人困惑的是转义特殊字符。
4.2 常用变量
-
$args
: #这个变量等于请求行中的参数,同$query_string
-
$content_length
: 请求头中的Content-length字段。 -
$content_type
: 请求头中的Content-Type字段。 -
$document_root
: 当前请求在root指令中指定的值。 -
$host
: 请求主机头字段,否则为服务器名称。 -
$http_user_agent
: 客户端agent信息 -
$http_cookie
: 客户端cookie信息 -
$limit_rate
: 这个变量可以限制连接速率。 -
$request_method
: 客户端请求的动作,通常为GET或POST。 -
$remote_addr
: 客户端的IP地址。 -
$remote_port
: 客户端的端口。 -
$remote_user
: 已经经过Auth Basic Module验证的用户名。 -
$request_filename
: 当前请求的文件路径,由root或alias指令与URI请求生成。 -
$scheme
: HTTP方法(如http,https)。 -
$server_protocol
: 请求使用的协议,通常是HTTP/1.0或HTTP/1.1。 -
$server_addr
: 服务器地址,在完成一次系统调用后可以确定这个值。 -
$server_name
: 服务器名称。 -
$server_port
: 请求到达服务器的端口号。 -
$request_uri
: 包含请求参数的原始URI,不包含主机名,如:”/foo/bar.php?arg=baz”。 -
$uri
: 不带请求参数的当前URI,$uri不包含主机名,如”/foo/bar.html”。 -
$document_uri
: 与$uri相同。
4.3 flag标志位
-
last
: 相当于Apache的[L]标记,表示完成rewrite -
break
: 停止执行当前虚拟主机的后续rewrite指令集 -
redirect
: 返回302临时重定向,地址栏会显示跳转后的地址 -
permanent
: 返回301永久重定向,地址栏会显示跳转后的地址
$host详解
$host变量的官方解释
$host:in this order of precedence: host name from the request line, or host name from the “Host” request header field, or the server name matching a request
host变量的值按照如下优先级获得:
- 请求行中的host.
- 请求头中的Host头部.
- 与一条请求匹配的server name.
什么是请求行中的host
我们知道,HTTP是一个文本协议,建立在一个可靠的传输层协议之上。这个传输层协议要是可靠的,面向连接的。由于TCP的普及程度,让它成了HTTP下层协议事现上的标准。但我们要知道,HTTP并不仅限于建立在TCP之上。只要是可靠的,面向连接的传输层协议,都可以用来传输HTTP。下面所说的HTTP,都是指搭载在TCP之上的HTTP。
一个HTTP请求过程是这样的,客户端先与服务器建立起TCP连接,然后再与服务器端进行请求和回复的收发。请求包含请求行、请求头和请求体,其中,根据请求方法的不同,请求体是可选的。
在发送请求行之前,客户端与服务器已经建立了连接。所以此时请求行中并不需要有服务器的信息。我们用telnet测试, 例如:
GET /index.php HTTP/1.1
这就是一个完整的HTTP请求行。虽然请求行中不需要有服务器的信息,但仍然可以在请求行中包含服务器的信息。例如:
GET www.test.info/index.php HTTP/1.1
两者一比较,就很容易理解什么叫请求行中的host了。第一个请求行中,就没有host,第二种请求行中,就带了host,为www.test.info。
Host请求头与HTTP/1.0、HTTP/1.1
一个请求,请求行下面就是一些列的请求头。这些请求头,在HTTP/1.0中,都是可选的,且HTTP/1.0不支持Host请求头;而在HTTP/1.1中,Host请求头部必须存在,否则会返回400 Bad Request
我们看个例子, 使用telnet 连接:
GET /index.php HTTP/1.1
HTTP/1.1 400 Bad Request
Server: nginx/1.4.6 (Ubuntu)
但是HTTP/1.0是不支持Host头部的,所以请求,不需要带这个Host,我们也测试一下:
HEAD /rec/app/detail/youxidaren.html HTTP/1.0
HTTP/1.1 404 NOT FOUND
Server: nginx/1.4.6 (Ubuntu)
可以看到没有返回400, 而是返回了404,说明这个请求还是来到nginx处理,命中了其中一个配置的"虚拟主机", 我到nginx下面看access_log,看到日志写在了第一个的nginx虚拟主机配置的日志文件下面,说明http1.0情况下,没有带host头部,请求默认来到了nginx 第一个虚拟主机下处理。
什么是与请求匹配的server name
server name是指在Nginx配置文件中,在server块中,用server_name指令设置的值。一个server可以多次使用server_name指令,来实现俗称的“虚拟主机”。例如:
server {
listen 80;
server_name example.org www.example.org;
...
}
server {
listen 80;
server_name example.net www.example.net;
...
}
server {
listen 80;
server_name example.com www.example.com;
...
}
关于虚拟主机的确定方法,还是引用Nginx的官方文档:
在这个配置中,nginx仅仅检查请求的“Host”头以决定该请求应由哪个虚拟主机来处理。如果Host头没有匹配任意一个虚拟主机,或者请求中根本没有包含Host头,那nginx会将请求分发到定义在此端口上的默认虚拟主机。在以上配置中,第一个被列出的虚拟主机即nginx的默认虚拟主机——这是nginx的默认行为。而且,可以显式地设置某个主机为默认虚拟主机,即在”listen”指令中设置”default_server”参数:
server {
listen 80 default_server;
server_name example.net www.example.net;
…
}
这就解释了上面的HTTP1.0请求,不带Host头,默认来到了第一个配置的server处理了。
然后我测试一下把www.test.info这个域名设成默认的主机default_server,看请求能不能正常来到www.test.info这个server来处理。
nginx 配置修改:
server {
listen 80 default_server;
server_name www.test.info
}
再次请求:
HEAD /index.php HTTP/1.0
HTTP/1.1 200 OK
Server: nginx/1.4.6 (Ubuntu)
实际测试,正常,default_server确实起作用了。
延伸: Nginx 的 $host 与 $http_host 的区别
$host 是nginx的官方变量,可以从官方查询
$http_host 则是读取请求头header里面的key,所有请求头里面的key再nginx里面都可以通过小写和下划线来让nginx读取。例如header里面的Host就能转成$http_host, user_agent可以转成$http_user_agent。
所以,只要是header的请求头都可以这样被nginx读取, 我们测试一下:
HEAD /rec/app/detail/youxidaren.html HTTP/1.1
Host: mo.ouwan.com
Content-type: html/txt
Test-key: test-value
HTTP/1.1 200 OK
Server: nginx/1.4.6 (Ubuntu)
Date: Thu, 22 Mar 2018 12:28:56 GMT
Content-Type: text/html; charset=utf-8
Connection: keep-alive
Vary: Cookie
# 这三个头都是我请求的时候加的。
x_host: mo.ouwan.com
x_test_key: test-value
x_content_type: html/txt
当然这个几个头部能在response显示是因为在nginx加了add_header控制的:
location / {
add_header x_host $http_host;
add_header x_test_key $http_test_key;
add_header x_content_type $http_content_type;
}
$http_header的应用:当我们一个项目部署在两个服务器下面,然后在另外一个服务器搭建nginx反响代理,反响代理把请求转发给两个服务器的时候,他们的日志记录的是反向代理的ip, 而不是真正请求的用户IP, 这时就可以通过配置proxy_set_header 把真实IP设置给一个X-forwarded-For 或者 X-Real-IP 转给后端服务器,然后后端服务器读取通过http_x_real_ip来读取真实IP, 记录到access_log下面
location / {
proxy_pass http://tg_web_cluster;
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
# proxy_set_header X-Forwarded-Proto $scheme;
}
日志的格式把第一个IP换成刚才转发过来的头部X-Real-IP就可以记录用户IP了:
log_format tg_log '$http_x_real_ip - $remote_user [$time_local] '
'"$request" $status $body_bytes_sent '
'"$http_referer" "$http_user_agent" "$gzip_ratio" - $request_time';
总结:
- $host变量的值按照如下优先级获得:
- 请求行中的host.
- 请求头中的Host头部.
- 与一条请求匹配的server name.
- nginx 可以通过$http_header读取请求头的值,实际应用就可以负载均衡的时候读取IP
来源:https://www.jianshu.com/p/0850db5af284