無論您的服務器是在Windows還是Unix上運行,這些關鍵性能領域都可以作為任何服務器監控策略的良好起點,跟蹤這些性能指標作為性能瓶頸的指標非常重要。那么如何監控服務器性能?
1、中央處理器 (CPU) 和內存
每當服務器性能下降時,通常會懷疑服務器CPU利用率和內存資源。如果您的服務器的CPU使用率異常高或內存使用率很高(可用的可用內存空間較少),您的應用程序的性能將受到影響。
很高興知道服務器上最消耗 CPU 和內存的進程是什么。這對于快速修復資源使用問題很重要。要測量的指標包括 CPU 進程計數、CPU 線程計數和 CPU % 中斷時間。
您需要監控服務器的內存使用情況。這包括可用的可用內存、寫入速率頁面以釋放物理內存空間等。所有這些指標都可以幫助您隨時了解服務器的運行狀況。
2、服務器正常運行時間
您的網站必須全天候運行并可用。服務器正常運行時間衡量系統運行的時間量。當系統可能在不知不覺中重新啟動時,此指標可用于提醒您。
如果您發現預期的服務器可用性周期與服務器正常運行時間數據之間存在差異,則系統至少發生了一次故障。確認所有預計在系統發生故障時運行的計劃任務是否已完成。
3、磁盤活動
磁盤活動是磁盤驅動器主動處理請求所花費的時間。必須監控幾個關鍵指標:
磁盤繁忙時間 - 測量磁盤處于活動狀態的時間百分比。如果這個值很高,這意味著你訪問磁盤的請求正在堆積。
輸入和輸出操作 (I/OP) – 指示磁盤驅動器上的工作負載。監控此指標有助于了解您的磁盤正在承受的工作負載。
磁盤讀/寫——測量從磁盤讀/寫數據塊所花費的時間。較低的值意味著性能良好。
磁盤隊列長度——衡量為隊列中的請求提供服務所花費的時間。為了獲得最佳性能,磁盤隊列長度應該最小。
請注意,監視磁盤的性能對于 I/OP 密集型任務非常重要。
4、頁面文件使用
未使用或未訪問的數據存儲在頁面文件中。超出操作系統 (OS)有限隨機存取存儲器 (RAM)空間的操作也會發送到頁面文件中進行存儲。
當您發現它的使用率很高時,這意味著系統的頁面文件不足以滿足您的服務器的需求。
另一個重要指標是頁面交換。每當您的服務器工作內存不足時,都會保留一塊磁盤空間來臨時保存數據,從而釋放更多空間。我們不建議頁面交換。通常,這意味著您沒有配置足夠的內存來運行您的服務器。
請記住,頁面交換是內存容量耗盡的短期解決方案。由于頁面交換減少了響應時間,因此應該避免這種情況。
5、上下文切換
上下文切換是一個密集的過程。它發生在內核(計算機操作系統核心的計算機程序)將處理器從一個進程或線程切換到另一個時。每次發生上下文切換時都會使用 CPU 資源。所以當發生大范圍的上下文切換時,會占用越來越多重要的 CPU 資源。
這是由運行多個繁忙進程或應用程序錯誤導致的,這些錯誤會增加上下文切換的次數。服務器上上下文切換的突然增加可能表明存在問題。因此,監視上下文切換對于服務器的性能至關重要。
6、時間同步
同一網絡上共享文件或相互通信的系統具有有時限的活動。那么,想象一下系統時鐘是否不同步?結果可能是災難性的。
不準確的時鐘可能會導致數據被覆蓋或產生版本沖突。更糟糕的是,它可能導致程序無法正常運行。始終根據參考時鐘監控系統時鐘偏移。
7、處理用法
句柄是指應用程序引用的資源。在您的服務器上運行的應用程序請求和接收資源使用它們,然后將它們返回給操作系統。有時,由于程序錯誤,應用程序“忘記”在使用后返回句柄。這是句柄泄漏。
請記住,服務器上的資源是有限的。隨著時間的推移,重復的句柄泄漏可能會“耗盡”服務器,從而導致服務器的性能下降。隨著時間的推移密切監控和處理使用情況。如果打開句柄的數量急劇或持續增加,這可能意味著句柄泄漏。
您需要調查并確定罪魁禍首。您可以終止此類進程或修補程序。
8、過程活動
可能存在應用程序創建新進程而不停止先前啟動的進程的情況。跨這些進程的處理和多任務處理會給您的服務器帶來負擔。
結果,您的服務器性能將受到嚴重影響。確保應用程序正確運行并正確退出。為此,您需要跟蹤和監控服務器上的所有流程活動。
9、網絡流量
網絡活動監控對于衡量服務器性能至關重要。每個網絡接口都提供網絡活動負載的指示。如果帶寬使用量接近網絡接口的最大速度,這可能表明存在瓶頸。
通過持續監控網卡上的輸入和輸出 (I/O)活動,您可以發現可能的硬件故障或過載。您還可以規劃硬件要求以確保最佳服務器性能。
10、TCP 活動
您的應用程序是面向連接的。他們使用TCP作為傳輸協議。HTTP、SQL、SMTP 在下面使用 TCP。如果 TCP 層性能下降,應用程序的性能也會下降。
有幾個重要的指標有助于監控 TCP:
進出服務器的連接速率有助于指示服務器工作負載。
服務器上的連接斷開數。高數字可能表明存在問題。
重傳百分比——當服務器沒有收到來自客戶端的確認時發生重傳。超時后,服務器必須再次發送傳輸。為確保良好的 TCP 性能,請盡量減少重傳。請記住,重復重傳可能會導致吞吐量嚴重下降。
11、操作系統日志文件
監控服務器運行狀況的最常用方法可能是操作系統日志,因為它們包含錯誤詳細信息、崩潰和其他類型的異常,可幫助您解決任何問題。
雖然Windows提供系統、安全和應用程序日志文件,但Unix將系統日志和 cron 日志文件存儲在 /var/log 目錄中。定期對日志事件進行監控、分析和警報有助于提醒您注意任何服務器異常。
審核編輯 黃昊宇
-
監控
+關注
關注
6文章
2306瀏覽量
56524 -
服務器性能
+關注
關注
0文章
3瀏覽量
7069
發布評論請先 登錄

基于華為云 Flexus X 實例部署 Uptime-Kuma 服務器監控面板

Flexus 云服務器 X 實例實踐:部署 ServerBee 監控工具

Flexus 云服務器 X 實例實踐:安裝 Ward 服務器監控工具

評論