nginx、swoole高併發原理初探

Nginx Apache 中央處理器程序員操作系統奶茶騰訊QQ java互聯網架構 2019-04-07

閱前熱身

為了更加形象的說明同步異步、阻塞非阻塞，我們以小明去買奶茶為例。

同步與異步

同步與異步的重點在消息通知的方式上，也就是調用結果通知的方式。

同步：當一個同步調用發出去後，調用者要一直等待調用結果的通知，直到得到調用結果。

異步：當一個異步調用發出去後，調用者不能立即得到調用結果的返回。

異步調用，要想獲得結果，一般有兩種方式：

1、主動輪詢異步調用的結果;

2、被調用方通過callback來通知調用方調用結果。

舉個栗子：

同步買奶茶：小明點單交錢，然後等著拿奶茶；

異步買奶茶：小明點單交錢，店員給小明一個小票，等小明奶茶做好了，再來取。

異步買奶茶，小明要想知道奶茶是否做好了，有兩種方式：

1、小明主動去問店員，一會就去問一下：“奶茶做好了嗎？”...直到奶茶做好。

2、等奶茶做好了，店員喊一聲：“小明，奶茶好了！”，然後小明去取奶茶。

阻塞與非阻塞

阻塞與非阻塞的重點在於進/線程等待消息時候的行為，也就是在等待消息的時候，當前進/線程是掛起狀態，還是非掛起狀態。

1、阻塞調用發出去後，在消息返回之前，當前進/線程會被掛起，直到有消息返回，當前進/線程才會被激活。

2、非阻塞調用發出去後，不會阻塞當前進/線程，而會立即返回。

舉個栗子：

1、阻塞買奶茶：小明點單交錢，乾等著拿奶茶，什麼事都不做；

2、非阻塞買奶茶：小明點單交錢，等著拿奶茶，等的過程中，時不時刷刷微博、朋友圈...

Submit

同步與異步，重點在於消息通知的方式;

阻塞與非阻塞，重點在於等消息時候的行為。

所以，就有了下面4種組合方式

同步阻塞：小明在櫃檯乾等著拿奶茶；

同步非阻塞：小明在櫃檯邊刷微博邊等著拿奶茶；

異步阻塞：小明拿著小票啥都不幹，一直等著店員通知他拿奶茶；

異步非阻塞：小明拿著小票，刷著微博，等著店員通知他拿奶茶。

2Nginx如何處理高併發

Apache面對高併發，為什麼很無力？

Apache處理一個請求是同步阻塞的模式。如圖：

每到達一個請求，Apache都會去fork一個子進程去處理這個請求，直到這個請求處理完畢。

面對低併發，這種模式沒什麼缺點，但是，面對高併發，就是這種模式的軟肋了。

1個客戶端佔用1個進程，那麼，進程數量有多少，併發處理能力就有多少，但操作系統可以創建的進程數量是有限的。

並且，多進程就會有進程間的切換問題，而進程間的切換調度勢必會造成CPU的額外消耗。當進程數量達到成千上萬的時候，進程間的切換就佔了CPU大部分的時間片，而真正進程的執行反而佔了CPU的一小部分，這就得不償失了。

下面，舉例說明這2種場景是多進程模式的軟肋：

1、及時消息通知程序比如及時聊天程序，一臺服務器可能要維持數十萬的連接(典型的C10K問題)，那麼就要啟動數十萬的進程來維持。這顯然不可能。

2、調用外部Http接口時假設Apache啟動100個進程來處理請求，每個請求消耗100ms，那麼這100個進程能提供1000qps。

但是，在我們調用外部Http接口時，比如QQ登錄、微博登錄，耗時較長，假設一個請求消耗10s，也就是1個進程1s處理0.1個請求，那麼100個進程只能達到10qps，這樣的處理能力就未免太差了。

注：什麼是C10K問題？網絡服務在處理數以萬計的客戶端連接時，往往出現效率低下甚至完全癱瘓，這被稱為C10K問題。（concurrent 10000 connection）

綜上，我們可以看出，Apache是同步阻塞的多進程模式，面對高併發等一些場景，是很蒼白的。

Nginx何以問鼎高併發

傳統的服務器模型就是這樣，因為其同步阻塞的多進程模型，無法面對高併發。

那麼，有沒有一種方式，可以讓我們在一個進程處理所有的併發I/O呢？

答案是有的，這就是I/O複用技術。

①、I/O複用是神馬？

所謂的I/O複用，就是多個I/O可以複用一個進程。

上面說的同步阻塞的多進程模型不適合處理高併發，那麼，我們再來考慮非阻塞的方式。

採用非阻塞的模式，當一個連接過來時，我們不阻塞住，這樣一個進程可以同時處理多個連接了。

比如一個進程接受了10000個連接，這個進程每次從頭到尾的問一遍這10000個連接：“有I/O事件沒？有的話就交給我處理，沒有的話我一會再來問一遍。”

然後進程就一直從頭到尾問這10000個連接，如果這1000個連接都沒有I/O事件，就會造成CPU的空轉，並且效率也很低，不好不好。

於是偉大的程序猿們日思夜想的去解決這個問題...終於！

我們能不能引入一個代理，這個代理可以同時觀察許多I/O流事件呢？

當沒有I/O事件的時候，這個進程處於阻塞狀態；當有I/O事件的時候，這個代理就去通知進程醒來？

於是，早期的程序猿們發明了兩個代理---select、poll。

select、poll代理的原理是這樣的：

當連接有I/O流事件產生的時候，就會去喚醒進程去處理。

但是進程並不知道是哪個連接產生的I/O流事件，於是進程就挨個去問：“請問是你有事要處理嗎？”......問了99999遍，哦，原來是第100000個進程有事要處理。那麼，前面這99999次就白問了，白白浪費寶貴的CPU時間片了！痛哉，惜哉...

注:select與poll原理是一樣的，只不過select只能觀察1024個連接，poll可以觀察無限個連接。

上面看了，select、poll因為不知道哪個連接有I/O流事件要處理，性能也挺不好的。

那麼，如果發明一個代理，每次能夠知道哪個連接有了I/O流事件，不就可以避免無意義的空轉了嗎？

於是，超級無敵、閃閃發光的epoll被偉大的程序員發明出來了。

epoll代理的原理是這樣的：

當連接有I/O流事件產生的時候，epoll就會去告訴進程哪個連接有I/O流事件產生，然後進程就去處理這個進程。

如此，多高效！

②、基於epoll的Nginx

有了epoll，理論上1個進程就可以無限數量的連接，而且無需輪詢，真正解決了c10k的問題。

Nginx是基於epoll的，異步非阻塞的服務器程序。自然，Nginx能夠輕鬆處理百萬級的併發連接，也就無可厚非了。

3swoole如何處理高併發以及異步I/O的實現

swoole介紹

swoole是PHP的一個擴展。

簡單理解：swoole=異步I/O+網絡通信

PHPer可以基於swoole去實現過去PHP無法實現的功能。

具體請參考swoole官網。

swoole如何處理高併發

Reactor模型介紹

IO複用異步非阻塞程序使用經典的Reactor模型，Reactor顧名思義就是反應堆的意思，它本身不處理任何數據收發。只是可以監視一個socket(也可以是管道、eventfd、信號)句柄的事件變化。

注:什麼是句柄？句柄英文為handler，可以形象的比喻為鍋柄、勺柄。也就是資源的唯一標識符、資源的ID。通過這個ID可以操作資源。

Reactor只是一個事件發生器，實際對socket句柄的操作，如connect/accept、send/recv、close是在callback中完成的。

swoole的架構

swoole採用 多線程Reactor+多進程Worker

swoole的架構圖如下：

swoole的處理連接流程圖如下：

當請求到達時,swoole是這樣處理的：

因為reactor基於epoll，所以每個reactor可以處理無數個連接請求。如此，swoole就輕鬆的處理了高併發。

swoole如何實現異步I/O

基於上面的Swoole結構圖，我們看到swoole的worker進程有2種類型：

一種是普通的worker進程，一種是 task worker進程。

worker進程是用來處理普通的耗時不是太長的請求；task worker進程用來處理耗時較長的請求，比如數據庫的I/O操作。

我們以異步Mysql舉例：

如此，通過worker、task worker結合的方式，我們就實現了異步I/O。

文章來源：https://mp.weixin.qq.com/s/WMi7LZj0bqXa72V9fRhwCA

nginx、swoole高併發原理初探

相關推薦