nginx的配置与使用 四、nginx配置location总结及rewrite规则写法

nginx的配置与使用
四、nginx配置location总结及rewrite规则写法

一.反向代理

下列配置就将本地80端口对应的主机转发到小编的博客中

server {

    listen 80;
    server_name cong.blog.com;


    location / {
    proxy_pass https://www.cnblogs.com/QicongLiang/;


  }
}

二.负载均衡

upstream myblog {
ip_hash;
server myblog1.example.com;
server myblog2.example.com;
server myblog3.example.com;
server myblog4.example.com;
}


location / {
proxy_pass http://myblog;
}

三.配置参数详解

http {
#设定mime类型,类型由mime.type文件定义
include /etc/nginx/mime.types;
default_type application/octet-stream;
#设定日志格式
access_log /var/log/nginx/access.log;

#设定负载均衡的服务器列表
upstream load_balance_server {
server 192.168.1.11:80 weight=5;                        #weigth参数表示权值,权值越高被分配到的几率越大
server 192.168.1.12:80 weight=1;
server 192.168.1.13:80 weight=6;
}

                                                                             #HTTP服务器
server {

listen 80;                                                               #侦听80端口

server_name www.helloworld.com;                      #以域名区分主机,定义使用www.xx.com访问

 location / {                                                             #对所有请求进行负载均衡请求

root /root;                                                              #定义服务器的默认网站根目录位置
index index.html index.htm;                                  #定义首页索引文件的名称
proxy_pass http://load_balance_server ;              #请求转向load_balance_server 定义的服务器列表

#以下是一些反向代理的配置(可选择性配置)

#proxy_redirect off;                                               #proxy_redirect指定修改被代理服务器返回的响应头中的location头域跟refresh头域数值,如后端服务器用的端口为8080,关闭redirect后将会向客户端返回Location:http://192.168.1.154:8080/wuman/,而开启redirect后将会对localtion进行修改,返回Location:http://192.168.1.154/wuman/,这样就不会暴露后端服务器信息。


proxy_set_header Host $host;                              #如果请求头有host字段时,$http_host和$host都是原始的’HOST’字段,例如请求的时候HOST的值是www.csdn.net 那么反代后还是www.csdn.net,如果请求头没有host字段,则建议使用$host,这表示当前location中的server_name的值。                                         

proxy_set_header Host $http_host;       

proxy_set_header Host $proxy_host;                   #$proxy_host 自然是 proxy_pass后面跟着的host了


proxy_set_header X-Real-IP $remote_addr;                                         #记录最后一跳的真实ip
proxy_set_header X-Forwarded-For $remote_addr;                             #后端的Web服务器可以通过X-Forwarded-For获取用户真实IP

 

 

一般来说,X-Forwarded-For是用于记录代理信息的,每经过一级代理(匿名代理除外),代理服务器都会把这次请求的来源IP追加在X-Forwarded-For

 

来自4.4.4.4的一个请求,header包含这样一行

 

X-Forwarded-For: 1.1.1.1, 2.2.2.2, 3.3.3.3

 

代表 请求由1.1.1.1发出,经过三层代理,第一层是2.2.2.2,第二层是3.3.3.3,而本次请求的来源IP4.4.4.4是第三层代理

 

X-Real-IP,没有相关标准,上面的例子,如果配置了X-Read-IP,可能会有两种情况

 

// 最后一跳是正向代理,可能会保留真实客户端IP
X-Real-IP: 1.1.1.1
// 最后一跳是反向代理,比如Nginx,一般会是与之直接连接的客户端IP
X-Real-IP: 3.3.3.3

#正向代理与反向代理的含义详细请见,博客----正向代理与反向代理

proxy_connect_timeout 90;                                                                   #nginx跟后端服务器连接超时时间(代理连接超时)
proxy_send_timeout 90;                                                                        #后端服务器数据回传时间(代理发送超时)
proxy_read_timeout 90;                                                                         #连接成功后,后端服务器响应时间(代理接收超时)
proxy_buffer_size 4k;                                                                              #设置代理服务器(nginx)保存用户头信息的缓冲区大小
proxy_buffers 4 32k;                                                                               #proxy_buffers缓冲区,网页平均在32k以下的话,这样设置
proxy_busy_buffers_size 64k;                                                                #高负荷下缓冲大小(proxy_buffers*2)
proxy_temp_file_write_size 64k;                                                            #设定缓存文件夹大小,大于这个值,将从upstream服务器传

client_max_body_size 10m;                                                                   #允许客户端请求的最大单文件字节数
client_body_buffer_size 128k;                                                                #缓冲区代理缓冲用户端请求的最大字节数
}
}
}

 

四、nginx配置location总结及rewrite规则写法

4.1 正则

  • . : 匹配除换行符以外的任意字符
  • ? : 重复0次或1次
  • + : 重复1次或更多次
  • * : 重复0次或更多次
  • d :匹配数字
  • ^ : 匹配字符串的开始
  • $ : 匹配字符串的介绍
  • {n} : 重复n次
  • {n,} : 重复n次或更多次
  • [c] : 匹配单个字符c
  • [a-z] : 匹配a-z小写字母的任意一个

    ~ 区分大小写匹配

    ~* 不区分大小写匹配

    !~和!~*分别为区分大小写不匹配及不区分大小写不匹配

    ^ 以什么开头的匹配

    $ 以什么结尾的匹配

  • 小括号()之间匹配的内容,可以在后面通过$1来引用,$2表示的是前面第二个()里的内容。正则里面容易让人困惑的是转义特殊字符。

4.2 常用变量

  • $args : #这个变量等于请求行中的参数,同$query_string
  • $content_length : 请求头中的Content-length字段。
  • $content_type : 请求头中的Content-Type字段。
  • $document_root : 当前请求在root指令中指定的值。
  • $host : 请求主机头字段,否则为服务器名称。
  • $http_user_agent : 客户端agent信息
  • $http_cookie : 客户端cookie信息
  • $limit_rate : 这个变量可以限制连接速率。
  • $request_method : 客户端请求的动作,通常为GET或POST。
  • $remote_addr : 客户端的IP地址。
  • $remote_port : 客户端的端口。
  • $remote_user : 已经经过Auth Basic Module验证的用户名。
  • $request_filename : 当前请求的文件路径,由root或alias指令与URI请求生成。
  • $scheme : HTTP方法(如http,https)。
  • $server_protocol : 请求使用的协议,通常是HTTP/1.0或HTTP/1.1。
  • $server_addr : 服务器地址,在完成一次系统调用后可以确定这个值。
  • $server_name : 服务器名称。
  • $server_port : 请求到达服务器的端口号。
  • $request_uri : 包含请求参数的原始URI,不包含主机名,如:”/foo/bar.php?arg=baz”。
  • $uri : 不带请求参数的当前URI,$uri不包含主机名,如”/foo/bar.html”。
  • $document_uri : 与$uri相同。

4.3 flag标志位

  • last : 相当于Apache的[L]标记,表示完成rewrite
  • break : 停止执行当前虚拟主机的后续rewrite指令集
  • redirect : 返回302临时重定向,地址栏会显示跳转后的地址
  • permanent : 返回301永久重定向,地址栏会显示跳转后的地址
     

$host详解

$host变量的官方解释

$host:in this order of precedence: host name from the request line, or host name from the “Host” request header field, or the server name matching a request

host变量的值按照如下优先级获得:

  1. 请求行中的host.
  2. 请求头中的Host头部.
  3. 与一条请求匹配的server name.

什么是请求行中的host

我们知道,HTTP是一个文本协议,建立在一个可靠的传输层协议之上。这个传输层协议要是可靠的,面向连接的。由于TCP的普及程度,让它成了HTTP下层协议事现上的标准。但我们要知道,HTTP并不仅限于建立在TCP之上。只要是可靠的,面向连接的传输层协议,都可以用来传输HTTP。下面所说的HTTP,都是指搭载在TCP之上的HTTP。

一个HTTP请求过程是这样的,客户端先与服务器建立起TCP连接,然后再与服务器端进行请求和回复的收发。请求包含请求行、请求头和请求体,其中,根据请求方法的不同,请求体是可选的。

在发送请求行之前,客户端与服务器已经建立了连接。所以此时请求行中并不需要有服务器的信息。我们用telnet测试, 例如:

GET /index.php HTTP/1.1

这就是一个完整的HTTP请求行。虽然请求行中不需要有服务器的信息,但仍然可以在请求行中包含服务器的信息。例如:

GET www.test.info/index.php HTTP/1.1

两者一比较,就很容易理解什么叫请求行中的host了。第一个请求行中,就没有host,第二种请求行中,就带了host,为www.test.info

Host请求头与HTTP/1.0、HTTP/1.1

一个请求,请求行下面就是一些列的请求头。这些请求头,在HTTP/1.0中,都是可选的,且HTTP/1.0不支持Host请求头;而在HTTP/1.1中,Host请求头部必须存在,否则会返回400 Bad Request
我们看个例子, 使用telnet 连接:

GET /index.php HTTP/1.1

HTTP/1.1 400 Bad Request
Server: nginx/1.4.6 (Ubuntu)

但是HTTP/1.0是不支持Host头部的,所以请求,不需要带这个Host,我们也测试一下:

HEAD /rec/app/detail/youxidaren.html HTTP/1.0

HTTP/1.1 404 NOT FOUND
Server: nginx/1.4.6 (Ubuntu)

可以看到没有返回400, 而是返回了404,说明这个请求还是来到nginx处理,命中了其中一个配置的"虚拟主机", 我到nginx下面看access_log,看到日志写在了第一个的nginx虚拟主机配置的日志文件下面,说明http1.0情况下,没有带host头部,请求默认来到了nginx 第一个虚拟主机下处理。

什么是与请求匹配的server name

server name是指在Nginx配置文件中,在server块中,用server_name指令设置的值。一个server可以多次使用server_name指令,来实现俗称的“虚拟主机”。例如:

server {  
    listen      80;  
    server_name example.org www.example.org;  
    ...  
}  
  
server {  
    listen      80;  
    server_name example.net www.example.net;  
    ...  
}  
  
server {  
    listen      80;  
    server_name example.com www.example.com;  
    ...  
}  

关于虚拟主机的确定方法,还是引用Nginx的官方文档:

在这个配置中,nginx仅仅检查请求的“Host”头以决定该请求应由哪个虚拟主机来处理。如果Host头没有匹配任意一个虚拟主机,或者请求中根本没有包含Host头,那nginx会将请求分发到定义在此端口上的默认虚拟主机。在以上配置中,第一个被列出的虚拟主机即nginx的默认虚拟主机——这是nginx的默认行为。而且,可以显式地设置某个主机为默认虚拟主机,即在”listen”指令中设置”default_server”参数:
server {
listen 80 default_server;
server_name example.net www.example.net;

}

这就解释了上面的HTTP1.0请求,不带Host头,默认来到了第一个配置的server处理了。
然后我测试一下把www.test.info这个域名设成默认的主机default_server,看请求能不能正常来到www.test.info这个server来处理。

nginx 配置修改:

server {
    listen      80 default_server;
    server_name www.test.info
}

再次请求:

HEAD /index.php HTTP/1.0

HTTP/1.1 200 OK
Server: nginx/1.4.6 (Ubuntu)

实际测试,正常,default_server确实起作用了。

延伸: Nginx 的 $host 与 $http_host 的区别

$host 是nginx的官方变量,可以从官方查询
$http_host 则是读取请求头header里面的key,所有请求头里面的key再nginx里面都可以通过小写和下划线来让nginx读取。例如header里面的Host就能转成$http_host, user_agent可以转成$http_user_agent。
所以,只要是header的请求头都可以这样被nginx读取, 我们测试一下:

HEAD /rec/app/detail/youxidaren.html HTTP/1.1 
Host: mo.ouwan.com
Content-type: html/txt
Test-key: test-value

HTTP/1.1 200 OK
Server: nginx/1.4.6 (Ubuntu)
Date: Thu, 22 Mar 2018 12:28:56 GMT
Content-Type: text/html; charset=utf-8
Connection: keep-alive
Vary: Cookie
# 这三个头都是我请求的时候加的。
x_host: mo.ouwan.com
x_test_key: test-value
x_content_type: html/txt

当然这个几个头部能在response显示是因为在nginx加了add_header控制的:

location / {
        add_header x_host   $http_host;
        add_header x_test_key $http_test_key;
        add_header x_content_type $http_content_type;
}

$http_header的应用:当我们一个项目部署在两个服务器下面,然后在另外一个服务器搭建nginx反响代理,反响代理把请求转发给两个服务器的时候,他们的日志记录的是反向代理的ip, 而不是真正请求的用户IP, 这时就可以通过配置proxy_set_header 把真实IP设置给一个X-forwarded-For 或者 X-Real-IP 转给后端服务器,然后后端服务器读取通过http_x_real_ip来读取真实IP, 记录到access_log下面

 location / {
                proxy_pass http://tg_web_cluster;
                proxy_set_header Host      $host;
                proxy_set_header X-Real-IP $remote_addr;
                proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
                # proxy_set_header X-Forwarded-Proto $scheme;
        }

日志的格式把第一个IP换成刚才转发过来的头部X-Real-IP就可以记录用户IP了:

    log_format tg_log '$http_x_real_ip - $remote_user [$time_local] '
                '"$request" $status $body_bytes_sent '
                '"$http_referer" "$http_user_agent" "$gzip_ratio" - $request_time';

总结:

  • $host变量的值按照如下优先级获得:
  1. 请求行中的host.
  2. 请求头中的Host头部.
  3. 与一条请求匹配的server name.
  • nginx 可以通过$http_header读取请求头的值,实际应用就可以负载均衡的时候读取IP

来源:https://www.jianshu.com/p/0850db5af284