日韩精品专区av无码,99热在线精品播放,久久精品国产日本波多野结衣

簡介： NPTL 成為 glibc "正選"線程庫后，它的性能如何受到很多人的關注。本文就針對NPTL 與 LinuxThreads 的性能比較，以及超線程、內(nèi)核可搶占等特性對線程性能的影響進行了全面評測。

在 Linux 2.6.x 內(nèi)核中，調(diào)度性能的改進是其中最引人注目的一部分[1]。NPTL（Native Posix Thread Library）[2]使用內(nèi)核的新特性重寫了 Linux 的線程庫，取代歷史悠久而備受爭議的 LinuxThreads[3] 成為 glibc 的首選線程庫。

NPTL 的性能究竟如何？相對 LinuxThreads 又有哪些明顯的改進？在對NPTL進行全面分析之前，本文針對這兩種線程庫，以及內(nèi)核中"內(nèi)核可搶占"（Preemptible）和超線程（HyperThreading）[4]等特性進行了全面的性能評測，結(jié)果表明NPTL絕對值得廣大服務器系統(tǒng)期待和使用。

回頁首

二、 Benchmark

1. 測試平臺

進行本測試的硬件平臺為浪潮NF420R服務器[7]，4個Hyperthreading-enabled Intel Xeon 2.2G處理器，4G內(nèi)存。Linux選擇了Slackware 9.0發(fā)行版[8]，所使用的內(nèi)核源碼來自 www.kernel.org 。

2. 針對測試：LMBench

lmbench是一個用于評價系統(tǒng)綜合性能的多平臺開源benchmark[5]，但其中沒有對線程的支持。其中有兩個測試進程性能的benchmark：lat_proc用于評測進程創(chuàng)建和終止的性能，lat_ctx用于評測進程切換的開銷。lmbench擁有良好的benchmark結(jié)構(gòu)，只需要修改具體的Target程序（如lat_proc.c和lat_ctx.c），就可以借用lmbench的計時、統(tǒng)計系統(tǒng)得到我們關心的線程庫性能的數(shù)據(jù)。

基于lat_proc和lat_ctx的算法，本文實現(xiàn)了lat_thread和lat_thread_ctx兩個benchmark。在lat_thread中，lat_proc被改造成使用線程，用pthread_create()替代了fork()，用pthread_join()替代wait()；在lat_thread_ctx中，沿用lat_ctx的評測算法（見lat_ctx手冊頁），將創(chuàng)建進程的過程改寫為創(chuàng)建線程，仍然使用管道進行通信和同步。

lat_thread null

null參數(shù)表示線程不進行任何實際操作，創(chuàng)建后即刻返回。

lat_thread_ctx -s<size> #threads

size參數(shù)與lat_ctx定義相同，可表示線程的大小（實際編程時為分配<size>K數(shù)據(jù)；#threads參數(shù)為線程數(shù)，即參與令牌傳遞的線程總數(shù)，相當于程序負載情況。

3. 綜合測試：Volanomark

volanomark是一個純java的benchmark，專門用于測試系統(tǒng)調(diào)度器和線程環(huán)境的綜合性能[6]，它建立一個模擬Client/Server方式的Java聊天室，通過獲取每秒平均發(fā)送的消息數(shù)來評測宿主機綜合性能（數(shù)值越大性能越好）。Volanomark測試與Java虛擬機平臺相關，本文使用Sun Java SDK 1.4.2作為測試用Java平臺，Volanomark版本2.5.0.9。

回頁首

三、測試結(jié)果

測試計劃中將內(nèi)核分為2.4.26、2.6.6/支持內(nèi)核搶占和2.6.6/不支持內(nèi)核搶占三類；通過配置內(nèi)核以及NF420R的BIOS實現(xiàn)三類SMP規(guī)模：單處理機(UP)、4CPU的SMP（SMP4）和打開超線程支持的虛擬8CPU SMP（SMP8*）。內(nèi)核配置和SMP規(guī)模的每一種組合都針對LinuxThreads和NPTL使用lat_thread、lat_thread_ctx和volanomark獲取一組數(shù)據(jù)。由于NPTL無法在2.4.x內(nèi)核上使用，該項數(shù)據(jù)空缺。

回頁首

四、結(jié)果分析

1. LinuxThreads vs NPTL：線程創(chuàng)建/銷毀開銷

使用2.6.6/preemptible內(nèi)核配置下UP和SMP4的測試數(shù)據(jù)獲得下圖：

圖1

在線程創(chuàng)建/銷毀開銷方面，NPTL的改進相當明顯（降低約600%）。實際上，NPTL不再像LinuxThreads那樣需要使用用戶級的管理線程來維護線程的創(chuàng)建和銷毀[9]，因此，很容易理解它在這方面的開銷能夠大幅度降低。

同時，由圖可見，單CPU下創(chuàng)建線程總是比多CPU下迅速。

2. LinuxThreads vs NPTL：線程切換開銷

同樣使用2.6.6/preemptible內(nèi)核配置下UP和SMP4的數(shù)據(jù)：

圖2

隨著lat_thread_ctx的參與線程增多，不管是哪個線程庫，單處理機條件下的線程切換開銷都陡峭上升，而SMP條件下則上升比較平緩。在這方面，LinuxThreads和NPTL表現(xiàn)基本相同。

3. 內(nèi)核影響

圖3

圖4

圖5

圖6

從上面四張圖中我們可以得出兩點結(jié)論：

"內(nèi)核可搶占"是Linux對實時應用提供更好支持的有力保障，但對線程性能影響很小，甚至有一點損失，畢竟搶占鎖的開銷不可忽略；
升級內(nèi)核并不會對LinuxThreads線程庫性能帶來多少變化，因此，對于服務器系統(tǒng)而言，不能指望僅僅編譯使用新內(nèi)核就能提高性能。

圖7

圖8

從圖3、圖4我們已經(jīng)知道，打開超線程支持對線程創(chuàng)建/銷毀性能幾乎沒有影響，而這兩張圖表也進一步說明，超線程技術(shù)對于線程切換開銷也沒有明顯的影響。超線程技術(shù)是CPU內(nèi)部的優(yōu)化技術(shù)，和真正的雙CPU完全不同。大量研究表明，如果沒有內(nèi)核與用戶應用相結(jié)合的專門優(yōu)化措施，超線程并不會帶來很大的性能變化。除非是高負載綜合服務器系統(tǒng)（例如繁忙的數(shù)據(jù)庫系統(tǒng)），購買超線支持的CPU并不能帶來多少好處。

4. 綜合性能

圖9

圖9

前面幾節(jié)分析讓我們了解了線程庫性能改進的細節(jié)，通過volanomark測試，我們可以近似得到在綜合應用環(huán)境下，特別是網(wǎng)絡服務需求中線程庫以及內(nèi)核對系統(tǒng)整體性能的影響程度。

圖9綜合了不同內(nèi)核、不同處理機數(shù)條件下，兩種線程庫的volanomark結(jié)果。從圖中可以觀察到以下三點：

NPTL能極大提高SMP環(huán)境下服務器系統(tǒng)的整體性能（超過65%），相對而言，對單處理機系統(tǒng)影響較小（10%左右）；
2.6內(nèi)核的搶占特性對系統(tǒng)性能影響很小（不超過±1%），某些情況下甚至有所下降；
超線程技術(shù)在LinuxThreads中的影響是負面的，在NPTL中是正面的，但影響幅度都很小（5%-6%）。

以上結(jié)論中前兩點與LMBench針對性測試結(jié)果完全吻合，第三點的偏差實際上反映了超線程技術(shù)對于綜合服務器環(huán)境還是有一定加速的。

回頁首

五、總結(jié)

我們的評測為廣大Linux用戶，特別是服務器用戶提供了一點有價值的參考：

如果你的是多處理機系統(tǒng)，那么毫不猶豫地升級你的內(nèi)核，并記住，一定要同時升級你的線程庫，它通常與glibc緊密耦合；
如果你的系統(tǒng)并沒有實時應用，不要打開"內(nèi)核可搶占"開關，它只會讓你的系統(tǒng)更慢；
慎重考慮是否使用超線程技術(shù)，即使你已經(jīng)購買了支持超線程的CPU，有時關閉它可能更適合你的需求。

參考資料

[pubb@163.net，2004] Linux 2.6調(diào)度系統(tǒng)分析，IBM DeveloperWorks, www.ibm.com/developerworks/cn/linux/kernel/l-kn26sch/index.shtml
[Ulrich Drepper，2002] Native Posix Threading Library， people.redhat.com/drepper/nptl-design.pdf
[Xavier.Leroy@inria.fr，1996] LinuxThreads線程庫， pauillac.inria.fr/~xleroy/linuxthreads/
[Intel Co.，2002]HyperThreading超線程技術(shù)， www.intel.com/technology/hyperthread/
[Larry McVoy,lm@bitmover.com，1998]LMbench， www.bitmover.com/lmbench/
[volano LLC，2004] Volanomark Benchmark， http://www.volano.com/benchmarks.html
[Slackware，1993]Slackware Linux Distribution， www.slackware.com
[pubb@163.net，2003] Linux 線程實現(xiàn)機制分析， www.ibm.com/developerworks/cn/linux/kernel/l-thread/index.shtml
[jim@2cpu.com，2004] Exploring Hyper-Threading Performance ， http://www.2cpu.com/articles/42_1.html

Linux 線程庫性能測試與分析

更多文章、技術(shù)交流、商務合作、聯(lián)系博主

微信掃碼或搜索：z360901061

微信掃一掃加我為好友

QQ號聯(lián)系： 360901061

您的支持是博主寫作最大的動力，如果您喜歡我的文章，感覺我的文章對您有幫助，請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧，狠狠點擊下面給點支持吧，站長非常感激您！手機微信長按不能支付解決辦法：請將微信支付二維碼保存到相冊，切換到微信，然后點擊微信右上角掃一掃功能，選擇支付二維碼完成支付。

【本文對您有幫助就好】元

2元

5元

10元

20元

自定義

亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频