歡迎來到智恒信-讓您工作更智能、管理更高效官方網(wǎng)站!
現(xiàn)在運(yùn)維監(jiān)控工具非常多,哪個(gè)好,哪個(gè)不好,哪個(gè)適合你,哪個(gè)不適合你,其實(shí)只有你了解了他們的特性后,才知道,接下來咱們從這里開始講常見的運(yùn)維資源監(jiān)控工具。
一. 常見的運(yùn)維監(jiān)控工具
現(xiàn)在運(yùn)維監(jiān)控工具非常多,哪個(gè)好,哪個(gè)不好,哪個(gè)適合你,哪個(gè)不適合你,其實(shí)只有你了解了他們的特性后,才知道,所以從這里開始講起。
1. Cacti
Cacti是一套基于PHP,MySQL,SNMP及RRDTool開發(fā)的網(wǎng)絡(luò)流量監(jiān)測圖形分析工具。
簡單的說Cacti就是一個(gè)PHP程序。它通過使用SNMP協(xié)議獲取遠(yuǎn)端網(wǎng)絡(luò)設(shè)備和相關(guān)信息,(其實(shí)就是使用Net-SNMP 軟件包的snmpget 和snmpwalk 命令獲?。┎⑼ㄟ^RRDTOOL工具繪圖,通過PHP程序展現(xiàn)出來。我們使用它可以展現(xiàn)出監(jiān)控對象一段時(shí)間內(nèi)的狀態(tài)或者性能趨勢圖。
Cacti是很老的一款監(jiān)控工具了,其實(shí)說它是一款流量監(jiān)控工具更合適,對流量監(jiān)控比較精準(zhǔn),但缺點(diǎn)很多,出圖不好看,不支持分布式,也沒有告警功能,所以使用的人會(huì)越來越少。
2. Zabbix
Zabbix是一個(gè)基于WEB界面的提供分布式系統(tǒng)監(jiān)視以及網(wǎng)絡(luò)監(jiān)視功能的企業(yè)級的開源解決方案。zabbix能監(jiān)視各種網(wǎng)絡(luò)參數(shù),保證服務(wù)器系統(tǒng)的安全運(yùn)營;并提供強(qiáng)大的通知機(jī)制以讓系統(tǒng)運(yùn)維人員快速定位/解決存在的各種問題。
Zabbix由2部分構(gòu)成,zabbix server與可選組件zabbix agent。zabbix server可以通過SNMP,zabbix agent,ping,端口監(jiān)視等方法提供對遠(yuǎn)程服務(wù)器/網(wǎng)絡(luò)狀態(tài)的監(jiān)視,數(shù)據(jù)收集等功能,它可以運(yùn)行在Linux, Solaris, HP-UX, AIX, Free BSD, Open BSD, OS X等平臺(tái)上。
Zabbix解決了cacti沒有告警的不足,也解決了nagios不能通過web配置的缺點(diǎn),同時(shí)還支持分布式部署,這使得它迅速流行起來,zabbix也成為目前中小企業(yè)監(jiān)控最流行的運(yùn)維監(jiān)控平臺(tái)。
3. Prometheus
Prometheus是一套開源的系統(tǒng)監(jiān)控報(bào)警框架,它既適用于面向服務(wù)器等硬件指標(biāo)的監(jiān)控,也適用于高動(dòng)態(tài)的面向服務(wù)架構(gòu)的監(jiān)控。
4. Nagios
Nagios是一款開源的免費(fèi)網(wǎng)絡(luò)監(jiān)視工具,能有效監(jiān)控Windows、Linux和Unix的主機(jī)狀態(tài),交換機(jī)路由器等網(wǎng)絡(luò)設(shè)置,打印機(jī)等。在系統(tǒng)或服務(wù)狀態(tài)異常時(shí)發(fā)出郵件或短信報(bào)警第一時(shí)間通知網(wǎng)站運(yùn)維人員,在狀態(tài)恢復(fù)后發(fā)出正常的郵件或短信通知。
Nagios主要的特征是監(jiān)控告警,最強(qiáng)大的就是告警功能,可支持多種告警方式,但缺點(diǎn)是沒有強(qiáng)大的數(shù)據(jù)收集機(jī)制,并且數(shù)據(jù)出圖也很簡陋,當(dāng)監(jiān)控的主機(jī)越來越多時(shí),添加主機(jī)也非常麻煩,配置文件都是基于文本配置的,不支持web方式管理和配置,這樣很容易出錯(cuò),不宜維護(hù)。
5. Ganglia
Ganglia是一款為HPC(高性能計(jì)算)集群而設(shè)計(jì)的可擴(kuò)展的分布式監(jiān)控系統(tǒng),它可以監(jiān)視和顯示集群中的節(jié)點(diǎn)的各種狀態(tài)信息,它由運(yùn)行在各個(gè)節(jié)點(diǎn)上的gmond守護(hù)進(jìn)程來采集CPU 、內(nèi)存、硬盤利用率、I/O負(fù)載、網(wǎng)絡(luò)流量情況等方面的數(shù)據(jù),然后匯總到gmetad守護(hù)進(jìn)程下,使用rrdtool存儲(chǔ)數(shù)據(jù),最后將歷史數(shù)據(jù)以曲線方式通過PHP頁面呈現(xiàn)。
Ganglia監(jiān)控系統(tǒng)有三部分組成,分別是gmond、gmetad、webfrontend。gmond安裝在需要收集數(shù)據(jù)的客戶端,gmetad是服務(wù)端,webfrontend是一個(gè)php的web ui界面,ganglia通過gmond收集數(shù)據(jù),然后在webfrontend進(jìn)行展示。
Ganglia的主要特征是收集數(shù)據(jù),并集中展示數(shù)據(jù),這是ganglia的優(yōu)勢和特色,ganglia可以將所有數(shù)據(jù)匯總到一個(gè)界面集中展示,并且支持多種數(shù)據(jù)接口,可以很方便的擴(kuò)展監(jiān)控,同時(shí),最為重要的是,ganglia收集數(shù)據(jù)非常輕量級,客戶端的gmond程序基本不耗費(fèi)系統(tǒng)資源,而這個(gè)特點(diǎn)剛好彌補(bǔ)了zabbix消耗性能的不足。
最后,Ganglia在對大數(shù)據(jù)平臺(tái)的監(jiān)控更為智能,只需要一個(gè)配置文件,即可開通Ganglia對hadoop、spark的監(jiān)控,監(jiān)控指標(biāo)有近千個(gè),完全滿足了對大數(shù)據(jù)平臺(tái)的監(jiān)控需求。
對于現(xiàn)在流行的微服務(wù),Prometheus的多維度數(shù)據(jù)收集和數(shù)據(jù)篩選查詢語言也是非常的強(qiáng)大。Prometheus是為服務(wù)的可靠性而設(shè)計(jì)的,當(dāng)服務(wù)出現(xiàn)故障時(shí),它可以使你快速定位和診斷問題。
6. Grafana
Grafana是一個(gè)開源的度量分析與可視化套件,通俗的說,Grafana就是一個(gè)圖形可視化展示平臺(tái),它通過各種炫酷的界面效果展示我們的監(jiān)控?cái)?shù)據(jù),如果你覺得zabbix的出圖界面不夠好看,逼格不夠高,就可以使用Grafana的可視化展示,同時(shí),Grafana支持許多不同的數(shù)據(jù)源,Graphite,InfluxDB,OpenTSDB,Prometheus,Elasticsearch,CloudWatch和KairosDB都可以完美支持。