高并发场景下,Nginx如何抗住千万级流量?
关注△mikechen△,十余年BAT架构经验倾囊相授!
大家好,我是mikechen。
Nginx在大型架构被广泛使用,下面我就重点来详解Nginx高并发技术@mikechen
文章来源:mikechen.cc
Nginx如何应对高并发
在现代互联网中,高并发流量是许多应用的常态,尤其在:秒杀系统、直播平台,还是大型电商活动。
这些场景会带来技术挑战,所以,就需要来解决高并发流量。
Nginx 不仅仅是一个 Web 服务器,它是 现代互联网系统的流量总管,在高并发架构中扮演着至关重要的角色。
Nginx 能够支撑高并发流量,背后有几项关键技术支撑:
多进程 + 事件驱动架构
使用 Master-Worker 多进程模型,主进程负责管理,子进程负责处理请求;
Master 进程的职责:
- 管理 Worker 进程: Master 进程负责启动、停止和重启 Worker 进程,确保系统的稳定运行。
- 加载配置文件: 它负责读取和解析 Nginx 的配置文件(nginx.conf),并将配置信息传递给 Worker 进程。
Worker 进程的职责:
- 处理客户端请求: Worker 进程是实际处理客户端请求的进程。
- 执行网络 I/O 操作: 它负责接收和发送网络数据,处理 HTTP 请求和响应。
- 每个 Worker 进程都是独立的: 这意味着它们之间互不干扰,即使某个 Worker 进程出现问题,也不会影响其他进程的运行。
异步非阻塞处理机制
通过 epoll 和非阻塞 I/O 的结合使用,Nginx 能够高效地处理大量的并发连接。
它能够在一个线程中同时处理多个连接,从而提高了系统的并发处理能力。
单线程高效处理连接:
每个 Worker 进程都是单线程的,这避免了多线程上下文切换的开销,提高了性能。
为了高效地处理大量并发连接,Nginx 使用了 epoll(在 Linux 系统上)等多路复用技术。
epoll 的作用:
epoll 是一种 I/O 多路复用技术,它允许一个线程同时监听多个文件描述符(例如,网络连接)。
当某个文件描述符上有事件发生(例如,数据到达),epoll 会通知线程,线程再进行处理。
epoll相比于select,poll,在大数量连接的情况下,性能会更好。
非阻塞 I/O:
Nginx 使用非阻塞 I/O,这意味着当线程执行 I/O 操作时,不会等待操作完成,而是立即返回。
线程可以继续执行其他任务,当 I/O 操作完成后,通过事件通知机制进行处理。
非阻塞IO,可以避免线程在等待IO的时候,被阻塞。
Nginx高并发配置实战
1. 启用多进程并发 + 高效事件模型
worker_processes auto; worker_cpu_affinity auto;
events { use epoll; # Linux 平台推荐使用 epoll worker_connections 10240; multi_accept on; }
worker_processes auto
:自动设置为 CPU 核心数,充分利用多核优势。
- use epoll
- :Linux 下的高性能事件驱动模型。
- worker_connections
- :单个 worker 支持的最大连接数(理论并发 = workers × connections)。
- multi_accept on
- :允许 worker 一次接受多个连接,提高接入效率。
实战建议:在压力测试中逐步调整 worker_connections 以找到最佳吞吐点。
2. 提升 TCP 连接效率(长连接+连接复用)
keepalive_timeout 65; keepalive_requests 1000; tcp_nodelay on; tcp_nopush on;
- keepalive_timeout
- :保持连接存活时间,减少频繁建立/释放的开销。
- keepalive_requests
- :单连接最大请求数,配合 upstream keepalive 使用。
- tcp_nodelay
- :加速小包传输,避免延迟。
- tcp_nopush
- :优化响应包发送,减少数据包数量。
3.. 开启缓存机制,减轻后端压力
proxy_cache_path /data/nginx/cache levels=1:2 keys_zone=static_cache:50m inactive=1h max_size=2g;
server { location /static/ { proxy_cache static_cache; proxy_pass http://backend_servers; proxy_cache_valid 200 1h; proxy_cache_use_stale error timeout updating; } }
- proxy_cache_path
- :设置缓存路径、层级结构、大小上限;
- proxy_cache_valid
- :为不同状态码配置缓存时间;
- proxy_cache_use_stale
- :后端出问题时使用过期缓存兜底,提升系统容错。
5. 设置限流防护,抵御突发流量冲击
limit_conn_zone $binary_remote_addr zone=addr_limit:10m;
limit_conn addr_limit 20;
limit_req_zone $binary_remote_addr zone=req_limit:10m rate=10r/s; limit_req zone=req_limit burst=20 nodelay;
- limit_conn
- :限制单 IP 最大连接数;
- limit_req
- :限制请求速率(如:每秒10次),防止恶意刷接口。
场景举例:
- 防止爬虫恶意抓取;
- 限制高频 API 调用;
- 缓解峰值时段突发请求。
6. 优化文件传输性能:
sendfile on; aio on; output_buffers 1 512k;
- sendfile
- :启用零拷贝机制,减少磁盘 → 网络的数据搬运消耗;
- aio
- :启用异步文件 IO,提升大文件传输效率。
7. 启用 Gzip 压缩减少带宽占用
gzip on; gzip_types text/plain application/json application/javascript text/css; gzip_comp_level 5;
- 适用于静态资源、JSON 接口响应等场景;
- 在带宽紧张时非常有效,但注意不要压缩已压缩格式(如 .zip, .jpg)。
以上
文章来源:mikechen.cc