歡迎來到智恒信-讓您工作更智能、管理更高效官方網(wǎng)站!
現(xiàn)在運維監(jiān)控工具非常多,哪個好,哪個不好,哪個適合你,哪個不適合你,其實只有你了解了他們的特性后,才知道,接下來咱們從這里開始講常見的運維資源監(jiān)控工具。
一. 常見的運維監(jiān)控工具
現(xiàn)在運維監(jiān)控工具非常多,哪個好,哪個不好,哪個適合你,哪個不適合你,其實只有你了解了他們的特性后,才知道,所以從這里開始講起。
1. Cacti
Cacti是一套基于PHP,MySQL,SNMP及RRDTool開發(fā)的網(wǎng)絡(luò)流量監(jiān)測圖形分析工具。
簡單的說Cacti就是一個PHP程序。它通過使用SNMP協(xié)議獲取遠(yuǎn)端網(wǎng)絡(luò)設(shè)備和相關(guān)信息,(其實就是使用Net-SNMP 軟件包的snmpget 和snmpwalk 命令獲?。┎⑼ㄟ^RRDTOOL工具繪圖,通過PHP程序展現(xiàn)出來。我們使用它可以展現(xiàn)出監(jiān)控對象一段時間內(nèi)的狀態(tài)或者性能趨勢圖。
Cacti是很老的一款監(jiān)控工具了,其實說它是一款流量監(jiān)控工具更合適,對流量監(jiān)控比較精準(zhǔn),但缺點很多,出圖不好看,不支持分布式,也沒有告警功能,所以使用的人會越來越少。
2. Zabbix
Zabbix是一個基于WEB界面的提供分布式系統(tǒng)監(jiān)視以及網(wǎng)絡(luò)監(jiān)視功能的企業(yè)級的開源解決方案。zabbix能監(jiān)視各種網(wǎng)絡(luò)參數(shù),保證服務(wù)器系統(tǒng)的安全運營;并提供強大的通知機制以讓系統(tǒng)運維人員快速定位/解決存在的各種問題。
Zabbix由2部分構(gòu)成,zabbix server與可選組件zabbix agent。zabbix server可以通過SNMP,zabbix agent,ping,端口監(jiān)視等方法提供對遠(yuǎn)程服務(wù)器/網(wǎng)絡(luò)狀態(tài)的監(jiān)視,數(shù)據(jù)收集等功能,它可以運行在Linux, Solaris, HP-UX, AIX, Free BSD, Open BSD, OS X等平臺上。
Zabbix解決了cacti沒有告警的不足,也解決了nagios不能通過web配置的缺點,同時還支持分布式部署,這使得它迅速流行起來,zabbix也成為目前中小企業(yè)監(jiān)控最流行的運維監(jiān)控平臺。
3. Prometheus
Prometheus是一套開源的系統(tǒng)監(jiān)控報警框架,它既適用于面向服務(wù)器等硬件指標(biāo)的監(jiān)控,也適用于高動態(tài)的面向服務(wù)架構(gòu)的監(jiān)控。
4. Nagios
Nagios是一款開源的免費網(wǎng)絡(luò)監(jiān)視工具,能有效監(jiān)控Windows、Linux和Unix的主機狀態(tài),交換機路由器等網(wǎng)絡(luò)設(shè)置,打印機等。在系統(tǒng)或服務(wù)狀態(tài)異常時發(fā)出郵件或短信報警第一時間通知網(wǎng)站運維人員,在狀態(tài)恢復(fù)后發(fā)出正常的郵件或短信通知。
Nagios主要的特征是監(jiān)控告警,最強大的就是告警功能,可支持多種告警方式,但缺點是沒有強大的數(shù)據(jù)收集機制,并且數(shù)據(jù)出圖也很簡陋,當(dāng)監(jiān)控的主機越來越多時,添加主機也非常麻煩,配置文件都是基于文本配置的,不支持web方式管理和配置,這樣很容易出錯,不宜維護(hù)。
5. Ganglia
Ganglia是一款為HPC(高性能計算)集群而設(shè)計的可擴展的分布式監(jiān)控系統(tǒng),它可以監(jiān)視和顯示集群中的節(jié)點的各種狀態(tài)信息,它由運行在各個節(jié)點上的gmond守護(hù)進(jìn)程來采集CPU 、內(nèi)存、硬盤利用率、I/O負(fù)載、網(wǎng)絡(luò)流量情況等方面的數(shù)據(jù),然后匯總到gmetad守護(hù)進(jìn)程下,使用rrdtool存儲數(shù)據(jù),最后將歷史數(shù)據(jù)以曲線方式通過PHP頁面呈現(xiàn)。
Ganglia監(jiān)控系統(tǒng)有三部分組成,分別是gmond、gmetad、webfrontend。gmond安裝在需要收集數(shù)據(jù)的客戶端,gmetad是服務(wù)端,webfrontend是一個php的web ui界面,ganglia通過gmond收集數(shù)據(jù),然后在webfrontend進(jìn)行展示。
Ganglia的主要特征是收集數(shù)據(jù),并集中展示數(shù)據(jù),這是ganglia的優(yōu)勢和特色,ganglia可以將所有數(shù)據(jù)匯總到一個界面集中展示,并且支持多種數(shù)據(jù)接口,可以很方便的擴展監(jiān)控,同時,最為重要的是,ganglia收集數(shù)據(jù)非常輕量級,客戶端的gmond程序基本不耗費系統(tǒng)資源,而這個特點剛好彌補了zabbix消耗性能的不足。
最后,Ganglia在對大數(shù)據(jù)平臺的監(jiān)控更為智能,只需要一個配置文件,即可開通Ganglia對hadoop、spark的監(jiān)控,監(jiān)控指標(biāo)有近千個,完全滿足了對大數(shù)據(jù)平臺的監(jiān)控需求。
對于現(xiàn)在流行的微服務(wù),Prometheus的多維度數(shù)據(jù)收集和數(shù)據(jù)篩選查詢語言也是非常的強大。Prometheus是為服務(wù)的可靠性而設(shè)計的,當(dāng)服務(wù)出現(xiàn)故障時,它可以使你快速定位和診斷問題。
6. Grafana
Grafana是一個開源的度量分析與可視化套件,通俗的說,Grafana就是一個圖形可視化展示平臺,它通過各種炫酷的界面效果展示我們的監(jiān)控數(shù)據(jù),如果你覺得zabbix的出圖界面不夠好看,逼格不夠高,就可以使用Grafana的可視化展示,同時,Grafana支持許多不同的數(shù)據(jù)源,Graphite,InfluxDB,OpenTSDB,Prometheus,Elasticsearch,CloudWatch和KairosDB都可以完美支持。
文章推薦:合肥自動化運維是什么?