摘要:在互聯網信息爆炸式快速發展的今天,各類復雜多樣的平臺系統相繼涌出。如何選擇**的監控產品以更好地維護這些平臺和系統是每個 IT 人員都需面臨的難題。本文將從開源監控產品的起源和發展,詳細解析各個時代熱門監控產品的優勢和劣勢,并結合各個監控產品的使用場景,幫你選擇出***適合自己的開源監控產品。因篇幅和時間原因,下面介紹的資料和理解可能和實際情況有所偏差,歡迎大家留言或者加入微信群批評指正。
作者:Ethan Chen 云智慧解決方案架構師,擁有豐富的運維理論及實戰經驗。致力于將客戶需求有效地轉化為公司產品場景,讓客戶更有效率地理解公司產品并為其提供優質的技術支撐。
Zabbix于1998年開發,2004年正式Release。較于其他開源監控產品,Zabbix擁有強大的指標數據存儲功能、畫圖功能,并且真正地做到了All in One全面監控,解決了運維人力和時間成本上的問題。
豐富的插件。Zabbix擁有豐富的MiB庫資源以及模版等850多個插件;
易用性、依賴少?;赑HP與MySQL搭建,可用性比較強;
可進行一定顆粒度的權限控制;
文檔完善。Zabbix本身定位為企業級分布式監控系統,故擁有完善的文檔,活躍的官方社區,且本身也更新得比較頻繁,開發比較積極;
國內市場有相關的商業支持。
MySQL數據量問題。當MySQL數據量比較大時,存儲性能容易出現問題;
可視化問題。自身可視化靈活性較差,需用Grafana等進行彌補;
監控基礎設施。主機、網絡設備監控等;
中小規模監控;
Nagios是一個主要用于監控系統運行狀態和網絡信息的監控系統。Nagios能監控所指定的本地或遠程主機以及服務,同時提供異常通知等功能。
Nagios擁有4000多個插件,且在很早之前就開始擁有自己的官方插件社區。這里面包括很多應用級別的監控插件。此外,Nagios的通知雖然簡單但能覆蓋所有場景,以及本身擁有強大的監控任務調度的能力。
功能過于單一,只能通過主動檢測告知結果是否匹配,被動檢測功能原生功能較弱;
小場景簡單監控。對于一些網站、端口等可進行簡單監控;
Centreon是一款開源的軟件,主要用于對Nagios的一些功能增強??赏ㄟ^頁面管理Nagios,通過第三方插件實現對網絡,操作系統,應用程序的監控。
界面友好
維護方便
統一管理
修改配置需要重啟或者重載Nagios主進程
MySQL依然存在數據問題
適用于百臺規模的中等監控
Check_MK是一款通用的Nagios/Icinga增強工具集。其插件有著相當成熟的檢測機制和對硬件服務器的檢測手段。非常適合對硬件服務器進行“體檢”。
界面友好
維護方便
統一管理
增加變更需要重啟Nagios主進程。
因后端存儲使用RRD,導致分布式擴展較為困難。
適用于百臺到千臺以內中等規模監控
網絡設備支持好
有權限控制
有漢化版
資料老舊
簡單的IDC托管
網絡運維
Ganglia是UC Berkeley發起的一個開源集群監視項目,設計用于測量數以千計的節點。主要是用來監控系統性能,如:CPU 、內存、硬盤利用率, I/O負載、網絡流量情況等。
數據集中,部署分布式
適合大規模部署
對集群熱點觀測性支持較好
大數據應用
監控寶是云智慧推出的新一代用戶體驗監控工具,從全球節點主動模擬真實用戶訪問,提供網站性能監控、API監控等服務,持續監測應用程序、網站、網絡和數字化服務的可用性和性能,提前診斷,實時告警,幫助客戶提升網絡應用效能。
專業的分析報告。提供綜合排名、競品分析、同比/環比、日/周報等多維度的數據報告,滿足專業化定制需求。
API接口監測。通過監控API接口的響應時間、可用性和正確性并及時告警來保證API服務的可靠性,可用于API接口性能優化、第三方API接口監控等使用場景。
Graphite是一個開源實時的、顯示時間序列度量數據的圖形系統,通過其后端接收度量數據,然后以實時方式查詢、轉換、組合這些度量數據。
指標點分概念引入
Grafana支持較早的協議之一
統計函數支持(140+)
指標無Label支持
在做好數據歸并時可用于大規模場景
Prometheus 是由 SoundCloud 開源的監控告警解決方案。存儲的是時序數據,即按相同時序(相同名稱和標簽),以時間維度存儲連續的數據的集合。
時序型存儲、查詢效率高。
支持集群模式,擴展性強。
一些Exporter采集的指標眾多,需進行適當裁剪。
自定義采集腳本需要腳本開發能力(Golang、Python),相比Shell腳本來說學習成本更高一些。
對于云計算、容器化場景更適合
夜鶯是一套分布式高可用的運維監控系統,前身是國內大名鼎鼎的open-falcon?;谝恍﹪鴥忍厥獾倪\維場景和習慣,在運維圈中有著不俗的場景理解和用戶體驗。
社區活躍,有open-falcon群眾基礎。
產品設計靈活,人性化。
v4版本自帶小型CMDB和自動化。
v5版本全面擁抱開源體系(Prometheus Telegraf)。
v5剛發布,仍然需要一定的時間積累
后端存儲的選型多樣,需要根據場景進行選擇
缺少日志類和Tracing類的監控場景
往期精彩回顧
河北亞特爾弱電公司做為京津冀一流的安防監控公司,專注、安防工程、監控公司、安防系統、安防監控十八年,經驗豐富,成功案例覆蓋京津冀地區,為客戶提供咨詢、規劃、設計、施工、運維一站式解決方案,咨詢電話:400-0330-600!更多弱電安防資訊 請訪問河北亞特爾:http://www.southernafricadirect.com/