nginx优化突破十万并发

nginx的安装与基本配置文档网上已经有很多了，但具体讲优化的文章还比较少，偶尔发现有这么一篇《nginx优化突破十万并发》仔细拜读后，转至此做以收藏，感谢原作的辛苦编写。

一般来说nginx配置文件中对优化比较有作用的为以下几项：

 
      1 
      worker_processes 8;

nginx进程数，建议按照cpu数目来指定，一般为它的倍数。

 
      1 
      worker_cpu_affinity 00000001 00000010 00000100 00001000 00010000 00100000 01000000 10000000;

为每个进程分配cpu，上例中将8个进程分配到8个cpu，当然可以写多个，或者将一个进程分配到多个cpu。

 
      1 
      worker_rlimit_nofile 102400;

这个指令是指当一个nginx进程打开的最多文件描述符数目，理论值应该是最多打开文件数（ulimit -n）与nginx进程数相除，但是nginx分配请求并不是那么均匀，所以最好与ulimit -n的值保持一致。

 
      1 
      use epoll;

使用epoll的I/O模型，这个不用说了吧。

 
      1 
      worker_connections 102400;

每个进程允许的最多连接数，理论上每台nginx服务器的最大连接数为worker_processes*worker_connections。

 
      1 
      keepalive_timeout 60;

keepalive超时时间。

 
      1 
      client_header_buffer_size 4k;

客户端请求头部的缓冲区大小，这个可以根据你的系统分页大小来设置，一般一个请求的头部大小不会超过1k，不过由于一般系统分页都要大于1k，所以这里设置为分页大小。分页大小可以用命令getconf PAGESIZE取得。

 
      1 
      open_file_cache max=102400 inactive=20s;

这个将为打开文件指定缓存，默认是没有启用的，max指定缓存数量，建议和打开文件数一致，inactive是指经过多长时间文件没被请求后删除缓存。

 
      1 
      open_file_cache_valid 30s;

这个是指多长时间检查一次缓存的有效信息。

 
      1 
      open_file_cache_min_uses 1;

open_file_cache指令中的inactive参数时间内文件的最少使用次数，如果超过这个数字，文件描述符一直是在缓存中打开的，如上例，如果有一个文件在inactive时间内一次没被使用，它将被移除。

关于内核参数的优化：

 
      1 
      net.ipv4.tcp_max_tw_buckets = 6000

timewait的数量，默认是180000。

 
      1 
      net.ipv4.ip_local_port_range = 1024    65000

允许系统打开的端口范围。

 
      1 
      net.ipv4.tcp_tw_recycle = 1

启用timewait快速回收。

 
      1 
      net.ipv4.tcp_tw_reuse = 1

开启重用。允许将TIME-WAIT sockets重新用于新的TCP连接。

 
      1 
      net.ipv4.tcp_syncookies = 1

开启SYN Cookies，当出现SYN等待队列溢出时，启用cookies来处理。

 
      1 
      net.core.somaxconn = 262144

web应用中listen函数的backlog默认会给我们内核参数的net.core.somaxconn限制到128，而nginx定义的NGX_LISTEN_BACKLOG默认为511，所以有必要调整这个值。

 
      1 
      net.core.netdev_max_backlog = 262144

每个网络接口接收数据包的速率比内核处理这些包的速率快时，允许送到队列的数据包的最大数目。

 
      1 
      net.ipv4.tcp_max_orphans = 262144

系统中最多有多少个TCP套接字不被关联到任何一个用户文件句柄上。如果超过这个数字，孤儿连接将即刻被复位并打印出警告信息。这个限制仅仅是为了防止简单的DoS攻击，不能过分依靠它或者人为地减小这个值，更应该增加这个值(如果增加了内存之后)。

 
      1 
      net.ipv4.tcp_max_syn_backlog = 262144

记录的那些尚未收到客户端确认信息的连接请求的最大值。对于有128M内存的系统而言，缺省值是1024，小内存的系统则是128。

 
      1 
      net.ipv4.tcp_timestamps = 0

时间戳可以避免序列号的卷绕。一个1Gbps的链路肯定会遇到以前用过的序列号。时间戳能够让内核接受这种“异常”的数据包。这里需要将其关掉。

 
      1 
      net.ipv4.tcp_synack_retries = 1

为了打开对端的连接，内核需要发送一个SYN并附带一个回应前面一个SYN的ACK。也就是所谓三次握手中的第二次握手。这个设置决定了内核放弃连接之前发送SYN+ACK包的数量。

 
      1 
      net.ipv4.tcp_syn_retries = 1

在内核放弃建立连接之前发送SYN包的数量。

 
      1 
      net.ipv4.tcp_fin_timeout = 1

如果套接字由本端要求关闭，这个参数决定了它保持在FIN-WAIT-2状态的时间。对端可以出错并永远不关闭连接，甚至意外当机。缺省值是60秒。 2.2 内核的通常值是180秒，你可以按这个设置，但要记住的是，即使你的机器是一个轻载的WEB服务器，也有因为大量的死套接字而内存溢出的风险，FIN- WAIT-2的危险性比FIN-WAIT-1要小，因为它最多只能吃掉1.5K内存，但是它们的生存期长些。

 
      1 
      net.ipv4.tcp_keepalive_time = 30

当keepalive起用的时候，TCP发送keepalive消息的频度。缺省是2小时。

下面贴一个完整的内核优化设置：

 
      01 
      net.ipv4.ip_forward = 0 
     
      02 
      net.ipv4.conf.default.rp_filter = 1 
     
      03 
      net.ipv4.conf.default.accept_source_route = 0 
     
      04 
      kernel.sysrq = 0 
     
      05 
      kernel.core_uses_pid = 1 
     
      06 
      net.ipv4.tcp_syncookies = 1 
     
      07 
      kernel.msgmnb = 65536 
     
      08 
      kernel.msgmax = 65536 
     
      09 
      kernel.shmmax = 68719476736 
     
      10 
      kernel.shmall = 4294967296 
     
      11 
      net.ipv4.tcp_max_tw_buckets = 6000 
     
      12 
      net.ipv4.tcp_sack = 1 
     
      13 
      net.ipv4.tcp_window_scaling = 1 
     
      14 
      net.ipv4.tcp_rmem = 4096        87380   4194304 
     
      15 
      net.ipv4.tcp_wmem = 4096        16384   4194304 
     
      16 
      net.core.wmem_default = 8388608 
     
      17 
      net.core.rmem_default = 8388608 
     
      18 
      net.core.rmem_max = 16777216 
     
      19 
      net.core.wmem_max = 16777216 
     
      20 
      net.core.netdev_max_backlog = 262144 
     
      21 
      net.core.somaxconn = 262144 
     
      22 
      net.ipv4.tcp_max_orphans = 3276800 
     
      23 
      net.ipv4.tcp_max_syn_backlog = 262144 
     
      24 
      net.ipv4.tcp_timestamps = 0 
     
      25 
      net.ipv4.tcp_synack_retries = 1 
     
      26 
      net.ipv4.tcp_syn_retries = 1 
     
      27 
      net.ipv4.tcp_tw_recycle = 1 
     
      28 
      net.ipv4.tcp_tw_reuse = 1 
     
      29 
      net.ipv4.tcp_mem = 94500000 915000000 927000000 
     
      30 
      net.ipv4.tcp_fin_timeout = 1 
     
      31 
      net.ipv4.tcp_keepalive_time = 30 
     
      32 
      net.ipv4.ip_local_port_range = 1024    65000

下面是一个简单的nginx配置文件：

 
      01 
      user  www www; 
     
      02 
      worker_processes 8; 
     
      03 
      worker_cpu_affinity 00000001 00000010 00000100 00001000 00010000 00100000 01000000; 
     
      04 
      error_log  /www/log/nginx_error.log  crit; 
     
      05 
      pid        /usr/local/nginx/nginx.pid; 
     
      06 
      worker_rlimit_nofile 204800; 
     
      07 
        
      08 
      events 
     
      09 
      { 
     
      10 
         use epoll;  
     
      11 
         worker_connections 204800;  
     
      12 
      } 
     
      13 
        
      14 
      http 
     
      15 
      { 
     
      16 
         include       mime.types;  
     
      17 
         default_type  application/octet-stream;  
     
      18 
        
      19 
         charset  utf-8;  
     
      20 
        
      21 
         server_names_hash_bucket_size 128;  
     
      22 
         client_header_buffer_size 2k;  
     
      23 
         large_client_header_buffers 4 4k;  
     
      24 
         client_max_body_size 8m;  
     
      25 
        
      26 
         sendfile on;  
     
      27 
         tcp_nopush     on;  
     
      28 
        
      29 
         keepalive_timeout 60;  
     
      30 
        
      31 
         fastcgi_cache_path /usr/local/nginx/fastcgi_cache levels=1:2  
     
      32 
                       keys_zone=TEST:10m  
     
      33 
                       inactive=5m;  
     
      34 
         fastcgi_connect_timeout 300;  
     
      35 
         fastcgi_send_timeout 300;  
     
      36 
         fastcgi_read_timeout 300;  
     
      37 
         fastcgi_buffer_size 16k;  
     
      38 
         fastcgi_buffers 16 16k;  
     
      39 
         fastcgi_busy_buffers_size 16k;  
     
      40 
         fastcgi_temp_file_write_size 16k;  
     
      41 
         fastcgi_cache TEST;  
     
      42 
         fastcgi_cache_valid 200 302 1h;  
     
      43 
         fastcgi_cache_valid 301 1d;  
     
      44 
         fastcgi_cache_valid any 1m;  
     
      45 
         fastcgi_cache_min_uses 1;  
     
      46 
         fastcgi_cache_use_stale error timeout invalid_header http_500;  
     
      47 
          
      48 
         open_file_cache max=204800 inactive=20s;  
     
      49 
         open_file_cache_min_uses 1;  
     
      50 
         open_file_cache_valid 30s;  
     
      51 
          
      52 
        
      53 
        
      54 
         tcp_nodelay on;  
     
      55 
          
      56 
         gzip on;  
     
      57 
         gzip_min_length  1k;  
     
      58 
         gzip_buffers     4 16k;  
     
      59 
         gzip_http_version 1.0;  
     
      60 
         gzip_comp_level 2;  
     
      61 
         gzip_types       text/plain application/x-javascript text/css application/xml;  
     
      62 
         gzip_vary on;  
     
      63 
        
      64 
        
      65 
         server  
     
      66 
         {  
     
      67 
           listen       8080;  
     
      68 
           server_name  backup.aiju.com;  
     
      69 
           index index.php index.htm;  
     
      70 
           root  /www/html/;  
     
      71 
        
      72 
           location /status  
     
      73 
           {  
     
      74 
               stub_status on;  
     
      75 
           }  
     
      76 
        
      77 
           location ~ .*\.(php|php5)?$  
     
      78 
           {  
     
      79 
               fastcgi_pass 127.0.0.1:9000;  
     
      80 
               fastcgi_index index.php;  
     
      81 
               include fcgi.conf;  
     
      82 
           }  
     
      83 
        
      84 
           location ~ .*\.(gif|jpg|jpeg|png|bmp|swf|js|css)$  
     
      85 
           {  
     
      86 
             expires      30d;  
     
      87 
           }  
     
      88 
        
      89 
           log_format  access  '$remote_addr - $remote_user [$time_local] "$request" '  
     
      90 
                     '$status $body_bytes_sent "$http_referer" '  
     
      91 
                     '"$http_user_agent" $http_x_forwarded_for';  
     
      92 
           access_log  /www/log/access.log  access;  
     
      93 
             }  
     
      94 
      }

关于FastCGI的几个指令：

 
      1 
      fastcgi_cache_path /usr/local/nginx/fastcgi_cache levels=1:2 keys_zone=TEST:10m inactive=5m;

这个指令为FastCGI缓存指定一个路径，目录结构等级，关键字区域存储时间和非活动删除时间。

 
      1 
      fastcgi_connect_timeout 300;

指定连接到后端FastCGI的超时时间。

 
      1 
      fastcgi_send_timeout 300;

向FastCGI传送请求的超时时间，这个值是指已经完成两次握手后向FastCGI传送请求的超时时间。

 
      1 
      fastcgi_read_timeout 300;

接收FastCGI应答的超时时间，这个值是指已经完成两次握手后接收FastCGI应答的超时时间。

 
      1 
      fastcgi_buffer_size 16k;

指定读取FastCGI应答第一部分需要用多大的缓冲区，这里可以设置为fastcgi_buffers指令指定的缓冲区大小，上面的指令指定它将使用1 个16k的缓冲区去读取应答的第一部分，即应答头，其实这个应答头一般情况下都很小（不会超过1k），但是你如果在fastcgi_buffers指令中指定了缓冲区的大小，那么它也会分配一个fastcgi_buffers指定的缓冲区大小去缓存。

 
      1 
      fastcgi_buffers 16 16k;

指定本地需要用多少和多大的缓冲区来缓冲FastCGI的应答，如上所示，如果一个php脚本所产生的页面大小为256k，则会为其分配16个16k的缓冲区来缓存，如果大于256k，增大于256k的部分会缓存到fastcgi_temp指定的路径中，当然这对服务器负载来说是不明智的方案，因为内存中处理数据速度要快于硬盘，通常这个值的设置应该选择一个你的站点中的php脚本所产生的页面大小的中间值，比如你的站点大部分脚本所产生的页面大小为 256k就可以把这个值设置为16 16k，或者4 64k 或者64 4k，但很显然，后两种并不是好的设置方法，因为如果产生的页面只有32k，如果用4 64k它会分配1个64k的缓冲区去缓存，而如果使用64 4k它会分配8个4k的缓冲区去缓存，而如果使用16 16k则它会分配2个16k去缓存页面，这样看起来似乎更加合理。

 
      1 
      fastcgi_busy_buffers_size 32k;

这个指令我也不知道是做什么用，只知道默认值是fastcgi_buffers的两倍。

 
      1 
      fastcgi_temp_file_write_size 32k;

在写入fastcgi_temp_path时将用多大的数据块，默认值是fastcgi_buffers的两倍。

 
      1 
      fastcgi_cache TEST

开启FastCGI缓存并且为其制定一个名称。个人感觉开启缓存非常有用，可以有效降低CPU负载，并且防止502错误。但是这个缓存会引起很多问题，因为它缓存的是动态页面。具体使用还需根据自己的需求。

 
      1 
      fastcgi_cache_valid 200 302 1h; 
     
      2 
      fastcgi_cache_valid 301 1d; 
     
      3 
      fastcgi_cache_valid any 1m;

为指定的应答代码指定缓存时间，如上例中将200，302应答缓存一小时，301应答缓存1天，其他为1分钟。

 
      1 
      fastcgi_cache_min_uses 1;

缓存在fastcgi_cache_path指令inactive参数值时间内的最少使用次数，如上例，如果在5分钟内某文件1次也没有被使用，那么这个文件将被移除。

 
      1 
      fastcgi_cache_use_stale error timeout invalid_header http_500;

不知道这个参数的作用，猜想应该是让nginx知道哪些类型的缓存是没用的。
以上为nginx中FastCGI相关参数，另外，FastCGI自身也有一些配置需要进行优化，如果你使用php-fpm来管理FastCGI，可以修改配置文件中的以下值：

 
      1 
      <value name="max_children">60</value>

同时处理的并发请求数，即它将开启最多60个子线程来处理并发连接。

 
      1 
      <value name="rlimit_files">102400</value>

最多打开文件数。

 
      1 
      <value name="max_requests">204800</value>

每个进程在重置之前能够执行的最多请求数。

下面贴几张测试结果图。

静态页面为我在squid配置4W并发那篇文章中提到的测试文件，下图为同时在6台机器运行webbench -c 30000 -t 600 http://www.yanghengfei.com/ 命令后的测试结果：

1.jpg大小: 21.44 K尺寸: 298 x 83浏览: 86 次点击打开新窗口浏览全图

使用netstat过滤后的连接数：

php页面在status中的结果（php页面为调用phpinfo）：

3.jpg大小: 21.08 K尺寸: 311 x 86浏览: 73 次点击打开新窗口浏览全图

php页面在netstat过滤后的连接数：

未使用FastCGI缓存之前的服务器负载：

此时打开php页面已经有些困难，需要进行多次刷新才能打开。上图中cpu0负载偏低是因为测试时将网卡中断请求全部分配到cpu0上，并且在nginx中开启7个进程分别制定到cpu1-7。
使用FastCGI缓存之后：

此时可以很轻松的打开php页面。

这个测试并没有连接到任何数据库，所以并没有什么参考价值，不过不知道上述测试是否已经到达极限，根据内存和cpu的使用情况来看似乎没有，但是已经没有多余的机子来让我运行webbench了。囧，但至少可以说明加载FastCGI缓存之后，还有是些效果的。以图为证嘛。

nginx优化 突破十万并发

猜你喜欢

nginx优化突破十万并发