nginx

Nginx是俄罗斯人用c++编写的十分轻量级的HTTP服务器,同时也能作为邮件服务器、反向代理服务器、静态资源服务器。

简介

  • Nginx以事件驱动的方式编写,所以有非常好的性能,同时也是一个非常高效的反向代理、负载平衡。其拥有匹配Lighttpd的性能,同时还没有Lighttpd的内存泄漏问题。
  • Nginx专为性能优化而开发,性能是其最重要的考量,实现上非常注重效率 。它支持内核Poll模型,能经受高负载的考验,有报告表明能支持高达 50,000个并发连接数。
  • Nginx具有很高的稳定性。其它HTTP服务器,当遇到访问的峰值,或者有人恶意发起慢速连接时,也很可能会导致服务器物理内存耗尽频繁交换,失去响应,只能重启服务器。例如当前apache一旦上到200个以上进程,web响应速度就明显非常缓慢了。而Nginx采取了分阶段资源分配技术,使得它的CPU与内存占用率非常低。nginx官方表示保持10,000个没有活动的连接,它只占2.5M内存,所以类似DOS这样的攻击对nginx来说基本上是毫无用处的。就稳定性而言,nginx比lighthttpd更胜一筹。
  • Nginx支持热部署。它的启动特别容易, 并且几乎可以做到7*24不间断运行,即使运行数个月也不需要重新启动。你还能够在不间断服务的情况下,对软件版本进行进行升级。
  • ……

HTTP基础功能:

  • 处理静态文件,索引文件以及自动索引;
  • 反向代理加速(无缓存);
  • FastCGI,简单的负载均衡和容错;
  • 模块化的结构。过滤器包括gzipping, byte ranges, chunked responses, 以及 SSI-filter 。在SSI过滤器中,到同一个 proxy 或者 FastCGI 的多个子请求并发处理;
  • SSL 和 TLS SNI 支持;

基本概念:

1.正向代理:

用户访问代理服务器。网站对用户不透明。对用户服务。

2.反向代理:

用户访问反向代理服务器。但是用户不知道访问的是反向代理服务器多个站点中的哪一个站点。对服务器服务。

3.负载均衡

nginx 的 upstream目前支持 4 种方式的分配
1)、轮询(默认):每个请求按时间顺序逐一分配到不同的后端服务器,如果后端服务器down掉,能自动剔除。
2)、weight:指定轮询几率,weight和访问比率成正比,用于后端服务器性能不均的情况。
2)、ip_hash :每个请求按访问ip的hash结果分配,这样每个访客固定访问一个后端服务器,可以解决session的问题。
3)、fair(第三方):按后端服务器的响应时间来分配请求,响应时间短的优先分配。
4)、url_hash(第三方)

4.异步非阻塞

和node类似Nginx 采用了异步非阻塞的方式来处理请求。Nginx 采用的是多 worker 的方式来处理请求,每个 worker 里面只有一个主线程,每个worker线程都继承了高并发的特性。
想想 apache 的常用工作方式(apache 也有异步非阻塞版本,但因其与自带某些模块冲突,所以不常用),每个请求会独占一个工作线程,当并发数上到几千时,就同时有几千的线程在处理请求了。这对操作系统来说,是个不小的挑战,线程带来的内存占用非常大,线程的上下文切换带来的 cpu 开销很大,自然性能就上不去了,而这些开销完全是没有意义的。

命令

1.安装

osx 用homebrew

1
brew install nginx

2.nginx命令

命令 注释
nginx 启动nginx,按照默认路径
nginx -t 测试配置正确性、也可查询默认配置路径
nignx -c 路径 按照指定路径[启动
nginx -s reload 平滑重启
nginx -s stop 停止nginx
nginx -v 显示 nginx 的版本
nginx -V nginx 的版本,编译器版本和配置参数。

3.nginx信号

启动nginx后会根据配置生成一个master进程和多个worker进程(由参数worker_processes配置,一般为机器cpu核数)master 来管理 worker 进程,所以我们只需要与 master 进程通信就行了。master 进程会接收来自外界发来的信号,再根据信号做不同的事情。所以我们要控制 Nginx,只需要通过 kill 向 master 进程发送信号就行了,例如:

1
2
3
4
5
kill -HUP pid
//平滑重启nginx
//pid是nginx的进程
//若在nginx.conf配置了pid文件存放路径则该文件存放的就是Nginx主进程号
//可用路径代替pid ,例如: '/usr/nginx/logs/nginx.pid'

master进程:

信号 注释
TERM, INT 快速关闭
QUIT 从容关闭
HUP 重载配置 | 用新的配置开始新的工作进程 | 从容关闭旧的工作进程
USR1 重新打开日志文件
USR2 平滑升级可执行程序。
WINCH 从容关闭工作进程

worker进程:

信号 注释
TERM, INT 快速关闭
QUIT 从容关闭
USR1 重新打开日志文件

conf配置

基本参数

1
2
3
4
5
6
7
8
9
10
11
12
#运行用户
user nobody;
#启动进程,通常设置成和cpu的数量相等
worker_processes 2;
#nginx pid进程号存储地址
pid logs/nginx.pid;

events {
#ulimit -n 一个进程所能够打开的文件的最大数
#反向代理,最大并发数 worker_connections * worker_processes/2
worker_connections 1024;
}

负载均衡

在http节点里添加:
# 定义负载均衡设备的 Ip及设备状态

1
2
3
4
5
6
7
upstream myServer {
server 127.0.0.1:9090 down;
server 127.0.0.1:8080 weight=2;
server 127.0.0.1:6060;
server 127.0.0.1:7070 backup;
ip_hash;
}

在需要使用负载的Server节点下添加

1
proxy_pass http://myServer;

upstream 每个设备的状态:

  • down :表示单前的server暂时不参与负载
  • weight :默认为1.weight越大,负载的权重就越大。
  • max_fails :允许请求失败的次数默认为1.当超过最大次数时,返回proxy_next_upstream 模块定义的错误
  • fail_timeout:max_fails 次失败后,暂停的时间。
  • backup: 其它所有的非backup机器down或者忙的时候,请求backup机器。所以这台机器压力会最轻。

ip_hash
使用负载均衡服务器一多就会出现一个问题,那怎么实现多台服务器之间session的共享。其中一个方案就是ip_hash。nginx中的ip_hash能够将某个ip的请求定向到同一台后端,这样一来这个ip下的某个客户端和某个后端就能建立起稳固的session;

nginx 编程

1.nginx变量

Nginx 变量的创建和赋值操作发生在全然不同的时间阶段。Nginx 变量的创建只能发生在 Nginx 配置加载的时候,或者说 Nginx 启动的时候;而赋值操作则只会发生在请求实际处理的时候。这意味着不创建而直接使用变量会导致启动失败,同时也意味着我们无法在请求处理时动态地创建新的 Nginx 变量。

1
2
3
4
5
6
7
8
9
10
server {
listen 8080;
location /foo {
echo "foo = [$foo]";
}
location /bar {
set $foo 32;
echo "foo = [$foo]";
}
}

我们使用了标准ngx_rewrite模块的set配置指令对变量\$a进行了赋值操作。特别地,我们把字符串hello world赋给了它。这里我们使用第三方ngx_echo模块的echo配置指令将\$foo变量的值作为当前请求的响应体输出。

我们用curl访问地址:

1
2
$ curl 'http://localhost:8080/foo'     //foo = []
$ curl 'http://localhost:8080/bar' //foo = [32]

2.Nginx 内建变量

例如由 ngx_http_core 模块提供的内建变量 $uri,可以用来获取当前请求的 URI(经过解码,并且不含请求参数),而 $request_uri 则用来获取请求最原始的 URI (未经解码,并且包含请求参数)。但是大部分内建变量类似保留值不可被赋值。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
location /test {
echo "uri = $uri";
echo "request_uri = $request_uri";
echo "name: $arg_name";//name不区分大小写
}

$ curl "http://localhost:8080/test?Name=aaa"
:uri = /test
:request_uri = /test
:name: aaa

$ curl "http://localhost:8080/test?a=3&b=4"
:uri = /test
:request_uri = /test?a=3&b=4
:name:

也有一些内建变量是支持改写的,其中一个例子是 $args. 这个变量在读取时返回当前请求的 URL 参数串(即请求 URL 中问号后面的部分,如果有的话),而在赋值时可以直接修改参数串:

1
2
3
4
5
6
7
8
9
10
location /test {
set $orig_a $arg_a;
set $args "a=5";
echo "original a: $orig_a";
echo "a: $arg_a";
}

$ curl 'http://localhost:8080/test?a=3'
:original a: 3
:a: 5

原本$arg_a应该返回参数a=3,但是访问时赋值了$args ‘a=5’,所以取$arg_a时返回了5;

参考链接:
http://www.ttlsa.com/nginx/nginx-tutorial-from-entry-to-the-master-ttlsa/
https://openresty.org/download/agentzh-nginx-tutorials-zhcn.html
http://wiki.jikexueyuan.com/project/nginx/nginx-framework.html