?一個常見的編程問題: 遍歷 同樣大小的數組和鏈表, 哪個比較快? 如果按照大學教科書上的算法分析方法,你會得出結論,這2者一樣快, 因為時間復雜度都是 O(n)。 但是在實踐中, 這2者卻有極大的差異。?? 通過下面的分析你會發現, 其實數組比鏈表要快很多。
?
首先介紹一個概念:memory hierarchy (存儲層次結構),電腦中存在多種不同的存儲器,如下表
- CPU?寄存器 – immediate access (0-1個CPU時鐘周期)
- CPU L1?緩存 ? – fast access (3個CPU時鐘周期)
- CPU L2 緩存 – slightly slower access (10個CPU時鐘周期)
- 內存?(RAM) ? ?– slow access (100個CPU時鐘周期)
- 硬盤?(file system) ?– very slow (10,000,000個CPU時鐘周期)
????? (數據來自 http://www.answers.com/topic/locality-of-reference )
?
各級別的存儲器速度差異非常大,CPU寄存器速度是內存速度的100倍! 這就是為什么CPU產商發明了CPU緩存。 而這個CPU緩存,就是數組和鏈表的區別的關鍵所在。
?
CPU緩存會把一片連續的內存空間讀入, 因為數組結構是 連續的內存地址 ,所以數組全部或者部分元素被連續存在CPU緩存里面, 平均讀取每個元素的時間只要3個CPU時鐘周期。?? 而鏈表的節點是 分散 在堆空間里面的,這時候CPU緩存幫不上忙,只能是去讀取內存,平均讀取時間需要100個CPU時鐘周期。 這樣算下來, 數組訪問的速度比鏈表快33倍! (這里只是介紹概念,具體的數字因CPU而異)
?
因此,程序中盡量使用連續的數據結構,這樣可以充分發揮CPU緩存的威力。 這種對緩存友好的算法稱為 Cache-oblivious algorithm , 有興趣可以參考相關資料。再舉一個簡單例子:
?
對比
for i in 0..n
?
for j in 0..m
???
for k in 0..p
????? C[i][j] = C[i][j] + A[i][k] * B[k][j];
和
for i in 0..n
?
for k in 0..p
???
for j in 0..m
????? C[i][j] = C[i][j] + A[i][k] * B[k][j];
?
雖然兩者執行結果一樣,算法復雜度也一樣,但是你會發現第二種寫法要快很多。?
?
總結一下, 各種存儲器的速度差異很大,在編程中絕對有必要考慮這個因素。 比如,內存速度比硬盤快1萬倍,所以程序中應該盡量避免頻繁的硬盤讀寫;CPU緩存比內存快幾十倍,在程序中盡量多加利用。
?
?
?>> 原創文章的版權屬于作者,轉載請注明出處和作者信息( http://blog.csdn.net/WinGeek/ ), 謝謝。 <<
?
?
?
?
?
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
