文章來源: http://www.ibm.com/developerworks/cn/linux/l-tune-lamp-1/index.html
LAMP 系統性能調優,第 1 部分: 理解 LAMP 架構LAMP 系統的工作原理、性能度量方法及底層操作系統的調優方法 ![]() |
![]() |
![]() |
級別: 中級
Sean A. Walberg
(
sean@ertw.com
), 高級網絡工程師
2007 年 5 月 09 日 如今,使用 LAMP(Linux?、Apache、MySQL 和 PHP/Perl)架構的應用程序不斷被開發和部署。 但是,服務器管理員對應用程序本身幾乎沒有控制能力,因為應用程序是別人編寫的。這份共三部分的系列文章將討論許多服務器配置問題,這些配置會影響應用程序的性能。第一篇文章討論 LAMP 架構、一些性能度量技術以及一些基本的 Linux 內核、硬盤和文件系統調節。后續的文章將研究 Apache、MySQL 和 PHP 組件的調優。<!--START RESERVED FOR FUTURE USE INCLUDE FILES--><!-- include java script once we verify teams wants to use this and it will work on dbcs and cyrillic characters --><!--END RESERVED FOR FUTURE USE INCLUDE FILES--> Linux、Apache、MySQL 和 PHP(或 Perl)是許多 Web 應用程序的基礎 —— 從 to-do 列表到 blog,再到電子商務站點。WordPress 和 Pligg 是兩個支持大容量 Web 站點的常用軟件包。這種架構簡稱為 LAMP。幾乎每個 Linux 發布版都包含 Apache、MySQL、PHP 和 Perl,所以安裝 LAMP 軟件是非常容易的。 安裝的簡便性使人誤以為這些軟件會自行順利地運行,但是實際情況并非如此。最終,應用程序的負載會超出后端服務器自帶設置的處理能力,應用程序的性能會降低。LAMP 安裝需要不斷監控、調優和評估。 系統調優對于不同的人有不同的含義。本系列主要關注 LAMP 組件(Linux、Apache、MySQL 和 PHP)的調優。對應用程序本身進行調優是另一個復雜的問題。應用程序和后端服務器之間存在一種共生關系:未能適當調優的服務器甚至會使最好的應用程序在負載之下崩潰,而借助充分的調優,完全可以避免編寫得很糟糕的應用程序使服務器緩慢如牛。幸運的是,正確的系統調優和監視可以指出應用程序中的問題。 對任何系統進行調優的第一步都是了解它的工作原理。按照最簡單的形式,基于 LAMP 的應用程序是用 PHP 這樣的腳本語言編寫的,它們作為 Linux 主機上運行的 Apache Web 服務器的一部分運行。 PHP 應用程序通過請求的 URL、所有表單數據和已捕獲的任意會話信息從客戶機獲得信息,從而確定應該執行什么操作。如有必要,服務器會從 MySQL 數據庫(也在 Linux 上運行)獲得信息,將這些信息與一些 Hypertext Markup Language(HTML)模板組合在一起,并將結果返回給客戶機。當用戶在應用程序中導航時,這個過程重復進行;當多個用戶訪問系統時,這個過程會并發進行。但是,數據流不是單向的,因為可以用來自用戶的信息更新數據庫,包括會話數據、統計數據(包括投票)和用戶提交的內容(比如評論或站點更新)。除了動態元素之外,還有靜態元素,比如圖像、JavaScript 代碼和層疊樣式表(CSS)。
在研究 LAMP 系統中的請求流之后,就來看看可能出現性能瓶頸的地方。數據庫提供許多動態信息,所以數據庫對查詢的響應延遲都會反映在客戶機中。Web 服務器必須能夠快速地執行腳本,還要能夠處理多個并發請求。最后,底層操作系統必須處于良好的狀態才能支持應用程序。通過網絡在不同服務器之間共享文件的其他設置也可能成為瓶頸。 持續地對性能進行度量在兩個方面有幫助。首先,度量可以幫助了解性能趨勢,包括好壞兩方面的趨勢。作為一個簡單的方法,查看一下 Web 服務器上的中央處理單元(CPU)使用率,就可以了解 CPU 是否負載過重。同樣,查看過去使用的總帶寬并推斷未來的變化,可以幫助判斷什么時候需要進行網絡升級。這些度量最好與其他度量和觀測結合考慮。例如,當用戶抱怨應用程序太慢時,可以檢查磁盤操作是否達到了最大容量。 性能度量的第二個用途是,判斷調優是對系統性能有幫助,還是使它更糟糕了。方法是比較修改之前和之后的度量結果。但是,為了進行有效的比較,每次應該只修改一個設置,然后對適當的指標進行比較以判斷修改的效果。每次只修改一個設置的原因應該是很明顯的:同時做出的兩個修改很可能會相互影響。選擇用來進行比較的指標比較微妙。 選擇的指標必須能夠反映應用程序用戶感覺到的響應。如果一項修改的目標是減少數據庫的內存占用量,那么取消各種緩沖區肯定會有幫助,但是這會犧牲查詢速度和應用程序性能。所以,應該選擇應用程序響應時間這樣的指標,這會使調優向著正確的方向發展,而不僅僅是針對數據庫內存使用量。
可以以許多方式度量應用程序響應時間。最簡單的方法可能是使用
清單 1. 使用 cURL 度量 Web 站點的響應時間
清單 1 給出對一個流行的新聞站點執行
表 1. curl 使用的計時器 計時器 描述 time_connect time_starttransfer time_total
這些計時器都相對于事務的起始時間,甚至要先于 Domain Name Service(DNS)查詢。因此,在發出請求之后,Web 服務器處理請求并開始發回數據所用的時間是 0.272 - 0.081 = 0.191 秒。客戶機從服務器下載數據所用的時間是 0.779 - 0.272 = 0.507 秒。
通過觀察
當然,Web 站點不僅僅由頁面組成。它還有圖像、JavaScript 代碼、CSS 和 cookie 要處理。
用于 Firefox 瀏覽器的 Tamper Data 擴展(參見 參考資料 一節中的鏈接)可以在日志中記錄 Web 瀏覽器發出的每個請求,并顯示每個請求所用的下載時間。使用這個擴展的方法是,選擇 Tools > Tamper Data 來打開 Ongoing requests 窗口。裝載要考察的頁面,然后就會看到瀏覽器發出的每個請求的狀態和裝載每個元素所用的時間。圖 1 給出裝載 developerWorks 主頁的結果。 圖 1. 用于裝載 developerWorks 主頁的請求細目 ![]() 每一行描述一個元素的裝載情況。顯示的數據包括發出請求的時間、裝載所用的時間、大小和結果。Duration 欄列出裝載元素本身所用的時間,Total Duration 欄列出所有子元素所用的時間。在圖 1 中,裝載主要頁面所用的時間是 516 毫秒(ms),但是裝載所有東西并顯示整個頁面所用的時間是 5101 ms。 Tamper Data 擴展有一種有用的模式,將頁面裝載數據的輸出繪制成圖形。右擊 Ongoing requests 窗口上半部分的任何地方,并選擇 Graph all 。圖 2 顯示圖 1 中數據的圖形化視圖。 圖 2. 用于裝載 developerWorks 主頁的請求的圖形化視圖 ![]() 在圖 2 中,每個請求的持續時間顯示為深藍色,并相對于頁面裝載的啟始時間顯示。所以,可以看出哪些請求使整個頁面的裝載變慢了。
盡管關注的重點是頁面裝載時間和用戶體驗,但是也不要忽視核心系統指標,比如磁盤、內存和網絡。有許多實用程序可以捕獲這些信息;其中最有幫助的可能是
在對系統的 Apache、PHP 和 MySQL 組件進行調優之前,應該花一些時間確保底層 Linux 組件的運行正常。還應該對正在運行的服務進行縮減,只運行需要的那些服務。這不但是一種良好的安全實踐,而且可以節省內存和 CPU 時間。
大多數 Linux 發布版都定義了適當的緩沖區和其他 Transmission Control Protocol(TCP)參數。可以修改這些參數來分配更多的內存,從而改進網絡性能。設置內核參數的方法是通過
清單 2. 包含較為激進的網絡設置的 /etc/sysctl.conf
將這些設置添加到
啟用 TCP 窗口伸縮使客戶機能夠以更高的速度下載數據。TCP 允許在未從遠程端收到確認的情況下發送多個數據包,默認設置是最多 64 KB,在與延遲比較大的遠程客戶機進行通信時這個設置可能不夠。窗口伸縮會在頭中啟用更多的位,從而增加窗口大小。 后面四個配置項增加 TCP 發送和接收緩沖區。這使應用程序可以更快地丟掉它的數據,從而為另一個請求服務。還可以強化遠程客戶機在服務器繁忙時發送數據的能力。 最后一個配置項增加可用的本地端口數量,這樣就增加了可以同時服務的最大連接數量。
在下一次引導系統時,或者下一次運行
磁盤在 LAMP 架構中扮演著重要的角色。靜態文件、模板和代碼都來自磁盤,組成數據庫的數據表和索引也來自磁盤。對磁盤的許多調優(尤其是對于數據庫)集中于避免磁盤訪問,因為磁盤訪問的延遲相當高。因此,花一些時間對磁盤硬件進行優化是有意義的。
首先要做的是,確保在文件系統上禁用
清單 3. 演示如何啟用 noatime 的 fstab 示例
在清單 3 中只修改了 ext3 文件系統,因為
有多種磁盤硬件組合,而且 Linux 不一定能夠探測出訪問磁盤的最佳方式。可以使用
清單 4. 在 /dev/hd 上執行的速度測試
這一測試說明,在這個磁盤上讀取數據的速度是大約每秒 60 MB。 在嘗試一些磁盤調優選項之前,必須注意一個問題。錯誤的設置可能損害文件系統。有時候會出現一個警告,指出這個選項與硬件不兼容;但是,有時候沒有警告消息。因此,在將系統投入生產之前,必須對設置進行徹底的測試。在所有服務器上都采用標準的硬件也會有所幫助。 表 2 列出比較常用的一些選項。 表 2. hdparm 的常用選項 選項 描述 -vi -c -m -d 1 -X
不幸的是,對于 Fiber Channel and Small Computer Systems Interface(SCSI)系統,調優依賴于具體的驅動器。
必須將有幫助的設置添加到啟動腳本中,比如
網絡文件系統(NFS)是一種通過網絡共享磁盤的方法。NFS 可以幫助確保每個主機具有相同數據的拷貝,并確保修改反映在所有節點上。但是,在默認情況下,NFS 的配置不適合大容量磁盤。
每個客戶機應該用
可以將這些設置放在
在服務器端,一定要確保有足夠的 NFS 內核線程來處理所有客戶機。在默認情況下,只啟動一個線程,但是 Red Hat 和 Fedora 系統會啟動 8 個線程。對于繁忙的 NFS 服務器,應該提高這個數字,比如 32 或 64。可以用
清單 5. 顯示 NFS 客戶機的 RPC 統計數據
第二列
關于 NFS,最后要注意一點:如果可能的話,應該避免使用 NFSv2,因為 NFSv2 的性能比 v3 和 v4 差得多。在現代的 Linux 發行版中這應該不是問題,但是可以在服務器上檢查
本文討論了 LAMP 的一些基本知識以及 LAMP 安裝的一些簡單 Linux 調優措施。除了 NFS 內核線程之外,可以設置本文中討論的參數,然后就不用理會它們了。本系列中的后兩篇文章主要關注 Apache、MySQL 和 PHP 調優。這些組件的調優與 Linux 的調優有很大的差異,因為隨著通信量的增長、讀寫操作分布情況的變化和應用程序的演化,需要不斷重新考察這些參數。 |
更多文章、技術交流、商務合作、聯系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
