参考书籍: 《Nginx高性能Web服务器详解》

Web 服务器和客户端是一对多的关系,Web 服务器必须有能力同时为多个客户端提供服务。一般来说,完成并行处理请求工作有三种可供选择:多进程方式、多线程方式和异步方式。

多进程方式

多进程方式是指,服务器没当接收到一个客户端时,就由服务器主进程生成一个子进程出来和该客户端建立连接进行交互,直到连接断开,该子进程就结束了。

多进程方式的优点在于,设计和实现相对简单,各个子进程之间相互独立,处理客户端请求的过程彼此不受到干扰,并且当一个子进程产生问题时,不容易将影响蔓延到其他进程中,这保证了提供服务的稳定性。当子进程退出时,其占用资源会被操作系统回收,也不会留下任何垃圾。而其缺点也是很明显的。操作系统中生成一个子进程需要进行内存复制等操作,在资源和时间上会产生一定的额外开销。因此,如果 Web 服务器接收大量并发请求,就会对系统资源造成压力,导致系统性能下降。

初期的 Apache 服务器就是采用这种方式对外提供服务的。为了应对大量并发请求,Apache 服务器采用「预生成进程」的机制对多进程的方式进行了改进。「预生成进程」的工作方式很好理解。它将生成子进程的时机提前,在客户端请求还没有到来之前就预先生成好,当请求到来时,主进程分配一个子进程和该客户端进行交互,交互完成之后,该进程也不结束,而被主进程管理起来等待下一个客户端请求的到来。改进的多进程方式在一定程度上环节了大量并发请求情形下 Web 服务器对系统资源造成的压力。但是由于 Apache 服务器在最初的架构设计上采用了多进程的方式,因此这不能从根本上解决问题。

多线程方式

多线程和多进程方式相似,它是指,服务器每当接收一个客户端时,会由服务端主进程派生一个线程出来和该客户端进行交互。

由于操作系统产生一个线程的开销远远小于一个进程的开销,所以多线程方式在很大程度上减轻了 Web 服务器对系统资源的要求。该方式使用线程进行任务调度,开发方面可以遵循一定的标准,这相对来说比较规范和有利于协作。但在线程管理方面,该方式有一定的不足。多个线程位于同一个进程内,可以访问同样的内存空间,彼此之间相互影响;同时,在开发过程中不可避免地要由开发者自己对内存进行管理,其增加了出错的风险。服务器系统需要长时间连续不停地运转,错误的逐渐积累可能最终对整个服务器产生重大影响。

IIS 服务器使用了多线程方式对外提供服务,它的稳定相相对来说还是不错的,但对于经验丰富的 Web 服务器管理人员而言,他们通常还是会定期检查和重启服务器,以预防不可预料的故障发生。

异步方式

异步方式是和多进程方式完全不同的一种处理服务端请求的方式。

同步机制和异步机制是描述通信模式的概念,阻塞和非阻塞是用来描述进程处理调用的方式。两对概念有一定的区别,不能混淆。

  • 同步阻塞方式,发送方向接收方发送请求后,一直等待响应;接收方处理请求时进行的IO操作如果不能马上得到结果,就一直等到返回结果后,才响应发送方,期间不能进行其他工作。比如,在超市排队付账时,客户(发送方)向收银员(接收方)付款(发送请求)后需要等待收银员找零,期间不能做其他的事情;而收银员要等待收款机返回结果(IO操作)后才能把零钱取出来交给客户(响应请求),期间也只能等待,不能做其他事情。这种方式实现简单,但是效率不高。
  • 同步非阻塞方式,发送方向接收方发送请求后,一直等待响应;接收方处理请求时进行的IO操作如果不能马上得到结果,就立即返回,去做其他事情,但由于没有得到请求处理结果,不响应发送方,发送方一直等待。一直到IO操作完成后,接收方获得结果响应发送方后,接收方才进入下一次请求过程。在实际中不使用这种方式。
  • 异步阻塞方式。发送方向接收方发送请求后,不用等待响应,可以接着进行其他工作;接收方处理请求时进行的IO操作如果不能马上得到结果,就一直等到返回结果后,才响应发送方,期间不能进行其他工作。这种方式在实际中也不使用。
  • 异步非阻塞方式,发送方向接收方发送请求后,不用等待响应,可以继续其他工作;接收方处理请求时进行的IO操作如果不能马上得到结果,也不等待,而是马上发挥去做其他事情。当IO操作完成以后,将完成状态和结果通知接收方,接收方再响应发送方。继续使用在超市排队付账的例子。客户(发送方)向收银员(接收方)付款(发送请求)后在等待收银员昭陵的过程中,还可以做其他事情,比如打电话、聊天等;而收银员在等待收款机处理交易(IO操作)的过程中可以帮助客户将商品打包,当收款机产生结果后,收银员给客户结账(响应请求)。在这四种方式中,这种方式是发送方和接收方通信效率最高的一种。

Nignx 服务器的一个显著优势是能够同时处理大量并发请求。它结合多进程机制和异步机制对外提供服务。异步机制使用的是异步非阻塞的方式。