Nginx 配置初步
Nginx 是一款轻量级的 Web 服务器、反向代理服务器,由于它的内存占用少,启动极快,高并发能力强,在互联网项目中广泛应用。这里实践一下 nginx 的配置
安装
下载必要组件
nginx 下载地址
1
http://nginx.org/en/download.html
pcre 库下载地址,nginx 需要
1
http://sourceforge.net/projects/pcre/files/pcre/
zlib 下载地址,nginx 需要
1
http://www.zlib.net/
openssl 下载地址,nginx 需要
1
https://github.com/openssl/openssl
在同级目录下,解压安装 zlib、openssl、pcre
进入 nginx 目录,进行配置安装
1 | ./configure \ |
下面可直接复制粘贴
1 | ./configure --prefix=/usr/local/nginx --with-http_ssl_module --with-http_flv_module --with-http_stub_status_module --with-http_gzip_static_module --with-pcre=../pcre-8.39 --with-zlib=../zlib-1.2.8 --with-openssl=../openssl-master |
编译安装
1 | make && sudo make install |
Nginx 会被安装在 /usr/local/nginx 目录下(也可以使用参数 —prefix = 指定自己需要的位置), 安装成功后 /usr/local/nginx 目录下有四个子目录分别是:conf、html、logs、sbin 。 其中 Nginx 的配置文件存放于 conf/nginx.conf, bin 文件是位于 sbin 目录下的 nginx 文件。 确保系统的 80 端口没被其他程序占用,运行 sbin/nginx 命令来启动 Nginx,
启动 nginx
1 | sudo /usr/local/nginx/sbin/nginx |
打开浏览器访问此机器的 IP,如果浏览器出现 Welcome to nginx! 则表示 Nginx 已经安装并运行成功
1 | # 检查配置文件是否正确 |
配置
nginx.conf 配置文件,基本就分为以下几块:
1 | main |
nginx 配置文件主要分为六个区域:
- main (全局设置)
- events (nginx 工作模式)
- http (http 设置)
- sever (主机设置)
- location (URL 匹配)
- upstream (负载均衡服务器设置)
下面依次来看下具体内容
- main 模块
下面时一个 main 区域,他是一个全局的设置:
1 | user nobody nobody; |
user 来指定 Nginx Worker 进程运行用户以及用户组,默认由 nobody 账号运行。
worker_processes 来指定了 Nginx 要开启的子进程数。每个 Nginx 进程平均耗费 10M~12M 内存。根据经验,一般指定 1 个进程就足够了,如果是多核 CPU,建议指定和 CPU 的数量一样的进程数即可。我这里写 2,那么就会开启 2 个子进程,总共 3 个进程。
error_log 用来定义全局错误日志文件。日志输出级别有 debug、info、notice、warn、error、crit 可供选择,其中,debug 输出日志最为最详细,而 crit 输出日志最少。
pid 用来指定进程 id 的存储文件位置。
worker_rlimit_nofile 用于指定一个 nginx 进程可以打开的最多文件描述符数目,这里是 65535,需要使用命令 “ulimit -n 65535” 来设置。
- events 模块
events 模块来用指定 nginx 的工作模式和工作模式及连接数上限,一般是这样:
1 | events { |
use 用来指定 Nginx 的工作模式。Nginx 支持的工作模式有 select、poll、kqueue、epoll、rtsig 和 /dev/poll。其中 select 和 poll 都是标准的工作模式,kqueue 和 epoll 是高效的工作模式,不同的是 epoll 用在 Linux 平台上,而 kqueue 用在 BSD 系统中,对于 Linux 系统,epoll 工作模式是首选。
worker_connections 用于定义 Nginx 每个进程的最大连接数,即接收前端的最大请求数,默认是 1024。最大客户端连接数由 worker_processes 和 worker_connections 决定,即 Max_clients=worker_processesworker_connections,在作为反向代理时,Max_clients 变为:Max_clients = worker_processes worker_connections/4。 进程的最大连接数受 Linux 系统进程的最大打开文件数限制,在执行操作系统命令 “ulimit -n 65536” 后 worker_connections 的设置才能生效。
- http 模块
http 模块可以说是最核心的模块了,它负责 HTTP 服务器相关属性的配置,它里面的 server 和 upstream 子模块,至关重要,等到反向代理和负载均衡以及虚拟目录等会仔细说。
1 | http{ |
下面详细介绍下这段代码中每个配置选项的含义。
include 来用设定文件的 mime 类型,类型在配置文件目录下的 mime.type 文件定义,来告诉 nginx 来识别文件类型。
default_type 设定了默认的类型为二进制流,也就是当文件类型未定义时使用这种方式,例如在没有配置 asp 的 locate 环境时,Nginx 是不予解析的,此时,用浏览器访问 asp 文件就会出现下载了。
log_format 用于设置日志的格式,和记录哪些参数,这里设置为 main,刚好用于 access_log 来纪录这种类型。
main 的类型日志如下:也可以增删部分参数。
1 | 127.0.0.1 - - [21/Apr/2015:18:09:54 +0800] "GET /index.php HTTP/1.1" 200 87151 "-" "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.76 Safari/537.36" |
access_log
用来纪录每次的访问日志的文件地址,后面的 main 是日志的格式样式,对应于 log_format 的 main。
sendfile 参数用于开启高效文件传输模式。将 tcp_nopush 和 tcp_nodelay 两个指令设置为 on 用于防止网络阻塞。
keepalive_timeout 设置客户端连接保持活动的超时时间。在超过这个时间之后,服务器会关闭该连接。
- server 模块
sever 模块是 http 的子模块,它用来定一个虚拟主机,我们先讲最基本的配置,这些在后面再讲。
我们看一下一个简单的 server 是如何做的?
1 | server { |
server 标志定义虚拟主机开始。
listen 用于指定虚拟主机的服务端口。
server_name 用来指定 IP 地址或者域名,多个域名之间用空格分开。
root 表示在这整个 server 虚拟主机内,全部的 root web 根目录。注意要和 locate {} 下面定义的区分开来。
index 全局定义访问的默认首页地址。注意要和 locate {} 下面定义的区分开来。
charset 用于设置网页的默认编码格式。
access_log 用来指定此虚拟主机的访问日志存放路径,最后的 main 用于指定访问日志的输出格式。
- location 模块
location 模块是 nginx 中用的最多的,也是最重要的模块了,什么负载均衡啊、反向代理啊、虚拟域名啊都与它相关。慢慢来讲:
location 根据它字面意思就知道是来定位的,定位 URL,解析 URL,所以,它也提供了强大的正则匹配功能,也支持条件判断匹配,用户可以通过 location 指令实现 Nginx 对动、静态网页进行过滤处理。像我们的 php 环境搭建就是用到了它。
我们先来看这个,设定默认首页和虚拟机目录。
1 | location / { |
location / 表示匹配访问根目录。
root 指令用于指定访问根目录时,虚拟主机的 web 目录,这个目录可以是相对路径(相对路径是相对于 nginx 的安装目录)。也可以是绝对路径。
1 | # 反向代理配置 |
- upstram 模块
upstream 模块负债负载均衡模块,通过一个简单的调度算法来实现客户端 IP 到后端服务器的负载均衡。我先学习怎么用,具体的使用实例以后再说。
1 | upstream test.com{ |
在上面的例子中,通过 upstream 指令指定了一个负载均衡器的名称 test.com。这个名称可以任意指定,在后面需要的地方直接调用即可。
里面是 ip_hash 这是其中的一种负载均衡调度算法。
Nginx 的负载均衡模块目前支持 4 种调度算法:
- weight 轮询(默认)。每个请求按时间顺序逐一分配到不同的后端服务器,如果后端某台服务器宕机,故障系统被自动剔除,使用户访问不受影响。weight。指定轮询权值,weight 值越大,分配到的访问机率越高,主要用于后端每个服务器性能不均的情况下。
- ip_hash。每个请求按访问 IP 的 hash 结果分配,这样来自同一个 IP 的访客固定访问一个后端服务器,有效解决了动态网页存在的 session 共享问题。
- fair。比上面两个更加智能的负载均衡算法。此种算法可以依据页面大小和加载时间长短智能地进行负载均衡,也就是根据后端服务器的响应时间来分配请求,响应时间短的优先分配。Nginx 本身是不支持 fair 的,如果需要使用这种调度算法,必须下载 Nginx 的 upstream_fair 模块。
- url_hash。按访问 url 的 hash 结果来分配请求,使每个 url 定向到同一个后端服务器,可以进一步提高后端缓存服务器的效率。Nginx 本身是不支持 url_hash 的,如果需要使用这种调度算法,必须安装 Nginx 的 hash 软件包。
在 HTTP Upstream 模块中,可以通过 server 指令指定后端服务器的 IP 地址和端口,同时还可以设定每个后端服务器在负载均衡调度中的状态。常用的状态有:
down,表示当前的 server 暂时不参与负载均衡。
backup,预留的备份机器。当其他所有的非 backup 机器出现故障或者忙的时候,才会请求 backup 机器,因此这台机器的压力最轻。
max_fails,允许请求失败的次数,默认为 1。当超过最大次数时,返回 proxy_next_upstream 模块定义的错误。
fail_timeout,在经历了 max_fails 次失败后,暂停服务的时间。max_fails 可以和 fail_timeout 一起使用。
注意 当负载调度算法为 ip_hash 时,后端服务器在负载均衡调度中的状态不能是 weight 和 backup。
备注: nginx 的 worker_rlimit_nofile 达到上限时,再有客户端链接报 502 错误。用了 log_format 指令设置了日志格式之后,需要用 access_log 指令指定日志文件的存放路径.
反向代理
正向代理,也就是传说中的代理,他的工作原理就像一个跳板,简单的说,我是一个用户,我访问不了某网站,但是我能访问一个代理服务器,这个代理服务器呢,他能访问那个我不能访问的网站,于是我先连上代理服务器,告诉他我需要那个无法访问网站的内容,代理服务器去取回来,然后返回给我。 从网站的角度,只在代理服务器来取内容的时候有一次记录,有时候并不知道是用户的请求,也隐藏了用户的资料,这取决于代理告不告诉网站。结论就是,正向代理 是一个位于客户端和原始服务器 (origin server) 之间的服务器,为了从原始服务器取得内容,客户端向代理发送一个请求并指定目标 (原始服务器),然后代理向原始服务器转交请求并将获得的内容返回给客户端。客户端必须要进行一些特别的设置才能使用正向代理。
反向代理(Reverse Proxy)方式是指以代理服务器来接受 internet 上的连接请求,然后将请求转发给内部网络上的服务器,并将从服务器上得到的结果返回给 internet 上请求连接的客户端,此时代理服务器对外就表现为一个反向代理服务器。
从用途上来讲:
- 正向代理的典型用途是为在防火墙内的局域网客户端提供访问 Internet 的途径。
- 正向代理还可以使用缓冲特性减少网络使用率。反向代理的典型用途是将防火墙后面的服务器提供给 Internet 用户访问。
- 反向代理还可以为后端的多台服务器提供负载平衡,或为后端较慢的服务器提供缓冲服务。
- 反向代理还可以启用高级 URL 策略和管理技术,从而使处于不同 web 服务器系统的 web 页面同时存在于同一个 URL 空间下。
反向代理服务器的基本配置
proxy_pass
1
2
3
4
5
6
7
8
9proxy_pass URL;
配置块 location if
此配置将当前请求代理到 URL 参数指定的服务器上,URL 可以是主机名或者 IP 地址加 PORT 的形式
proxy_pass http://localhost:8000;
也可以结合负载均衡实用 & lt; 负载均衡会说明这种情况 & gt;
也可以吧 HTTP 转换成 < span class="attribute">HTTPS
proxy_pass http://192.168.0.1;
默认情况反向代理不转发请求中的 Host 头部,如果需呀设置抓发头部
则 proxy_set_header Host $host;proxy_method
1
2
3
4
5proxy_method method_name;
配置块 http server location
此配置项表示转发时的协议方法名:
proxy_method POST;
那么客户端发来的 GET 请求在转发时方法改为 POST;proxy_hide_header
1
2
3
4
5
6proxy_hide_header header1;
配置块 http server location;
Nginx 会将上游服务器的响应转发给客户端,但默认不转发 HTTP 头部字段 (Date Server X-Pad X-Accel-* )
使用 proxy_hide_header 可以指定任意头部不能被转发
proxy_hide_header Cache-Control;
proxy_hide_header MicrosoftOfficeWebServer;proxy_pass_header
1
2
3
4proxy_pass_header header1;
配置块 http server location
功能与 proxy_hide_header 相反,是设置哪些头部允许转发.
proxy_pass_header X-Accel-Redirect;proxy_pass_request_body
1
2
3
4proxy_pass_request_body off|on;
默认 on
配置块 http server location;
确定上游服务器是否向上游服务器转发 HTTP 包体proxy_pass_request_header
1
2
3
4proxy_pass_request_header on | off;
默认 < span class="attribute">on
配置块 http server location
确定是否转发 HTTP 头部proxy_redirect
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26proxy_redirect [default | off |redirect |replacement]
默认 default
配置块 http server location
当上游服务响应时重定向或刷新 (HTTP 301 302),proxy_redirect 可以重设 HTTP 头部的 location 或 refresh 字段
proxy_redirect http://locahost:8000/two/http://frontend/one/;
上游响应 302,location 是 URI 是 http://locahost:8000/two/some/uri/
那是实际转发给客户端的是 http://frontend/one/some/uri/;
可以使用前面提到的 ngx_http_core_module 模块提供的变量
proxy_redirect http://locahost:8000/two/http://$host:server_port/;
可以省略 replacement 参数的主机名部分,这时候用虚拟主机名填充
proxy_redirect http://locahost:8000/two//one/;
使用 off 参数的时候,将使 < span class="section">location 和 refresh 的字段维持不变
proxy_redirect off;
如果使用的 proxy_redirect default;
下面两种配置是等效的
location /{
proxy_pass http://upstream:port/two/;
proxy_redirect default;
}
location /{
proxy_pass http://upstream:port/two/;
proxy_redirect http://upstream:port/two//one/;
}proxy_next_upstream
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16proxy_next_upstream [error |timeout |invalid_header |http_500 |http_502~504 |http_404 | off]
默认 proxy_next_upstream error timeout;
配置块 http server location
此配置表示上游一台服务器转发请求出现错误时,继续换一套服务器处理这个请求
其参数用来说明在那些情况下继续选择下一台上游服务器转发请求.
error 向上游发起连接 发送请求 读取响应时出错
timeout 发送请求或读取响应时出错
invalid_header 上游服务器发送的响应时不合法
http_500 上游响应 < span class="number">500
http_502 上游响应 < span class="number">502
http_503 上游响应 < span class="number">503
http_504 上游响应 < span class="number">504
http_404 上游响应 < span class="number">404
off 关闭 proxy_next_upstream 功能 只要一出错就选择另外一台上游再次出发
Nginx 反向代理模块中还提供很多配置,如设置连接的超时时间,临时文件如何存储,如何缓存上游服务器响应等功能.
可以通过阅读 ngx_http_proxy_module 了解更多详细情况
1 | #sudo vim /usr/local/nginx/conf/nginx.conf |
加一些判断条件 获取到 对方请求的主机 防止别人代理到自己的主机上
负载均衡
负载均衡是由多台服务器以对称的方式组成一个服务器集合,每台服务器都具有等价的地位,都可以单独对外提供服务而无须其他服务器的辅助。通过某种负载分担技术,将外部发送来的请求按照事先设定分配算法分配到对称结构中的某一台服务器上,而接收到请求的服务器独立地回应客户的请求。
均衡负载能够平均分配客户请求到服务器列阵,籍此提供快速获取重要数据,解决大量并发访问服务问题。
upstream 块
1
2
3
4
5
6
7
8
9
10
11
12
13
14upstream name {...}
配置块 http
upstream 块定义一个上游服务器的集群,便于反向代理中的 proxy_pass 使用
upstream mynet{
server www.wopai1.com;
server www.wopai2.com;
server www.wopai3.com;
}
server {
location /{
proxy_pass http://mynet;
}
}server
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15server name [paramenters]
配置块 upstream
server 配置项指定了一台上游服务器的名字,可以是域名 IP 地址端口 UNIX 句柄
weight= number; 设置向这台服务器转发的权重,默认为 1
max_fails=number; 该选项域 fail_timeout 配合使用
指在 fail_timeout 时间段内如果转发上游失败超过 number 次就认为当前的 fail_timeout 时间内
这台服务器不可用,max_fails 默认为 1 如果设置为 0 表示不检查失败次数
fail_timeout=time; fail_timeout 表示该时间内转发多少次失败后就认为上游不可用。默认 10s
down 表示上游服务器永久下线,只能在 ip_hash 配置时才有效
backup 在 ip_hash 配置时无效。只有所有非备份机都失败,才向上游备份服务器转发请求.
upstream mynet{
server www.wopai1.com weight=5;
server www.wopai2.com:8081 max_fails=3 fail_timeout=300s;
server www.wopai2.com down;
}ip_hash
1
2
3
4
5
6
7
8
9
10
11配置块 upstream
希望来自某一个用户的请求始终落在固定的一台服务器上进行处理.
根据客户端的 IP 散列计算出一个 key, 将 key 按照 < span class="section">upstream 集群中的上游服务器进行取模,求得的值对应的主机接收转发请求.
ip_hash 不可以与 weight 同时使用
如果 < span class="section">upstream 配置中有一台服务器暂时不可用,不能直接删除该配置,而应该使用 down 标识.
upstream mynet{
ip_hash;
server www.wowpai1.top;
server www.wowpai2.top;
server www.wowpai3.top down;
}
例子,服务器负载均衡基本配置,nginx 中可以进行负载均衡的相关设置:
1 | upstream my.net{ #my.net 是自定义的命名 在 server 结构中引用即可 |
动手开始配置才能慢慢上手 nginx 配置和使用。