足球资料库数据/孙祥/nba五佳球/足球直播哪个平台好 - cctv5今日现场直播

首頁 > 知識庫 > 正文

WOT2016吳兆松:Zabbix監控自動化的未來如何發展
2016-03-04 15:26:49   來源: 孫淑娟 51CTO.com    評論:0 點擊:

對IT運維工程師來說,構建一個真正可用的監控告警系統是一項艱巨的任務。本次51CTO記者特別采訪了【WOT2016互聯網運維與開發者峰會】特邀講師、OneOaaS技術合伙人吳兆松,他將和大家分享Zabbix監控自動化如何發展和優秀運維工程師需要具備的特質。

“運籌帷幄之中,決勝千里之外。”在IT運維中,監控占據著很重要的地位,按比例來說,以30%來計一點也不為過。對IT運維工程師來說,構建一個真正可用的監控告警系統是一項艱巨的任務。在監控系統的開源軟件中,可供選擇的工具眾多,然而真正適合自己需求,能夠真正解決自己業務問題的監控系統軟件卻鳳毛麟角。

本次51CTO記者特別采訪了【WOT2016互聯網運維與開發者峰會】特邀講師、OneOaaS技術合伙人吳兆松,他將和大家分享Zabbix監控自動化如何發展和優秀運維工程師需要具備的特質。在他的運維職業生涯中,監控系統用過Cacti、Nagios,以及公司自行開發的監控告警系統,直到接觸了Zabbix,才發現這個靈活而強大的自動化監控工具正是他所尋找的。

講師介紹

\

OneOaaS技術合伙人  吳兆松

吳兆松,曾任職餓了么,后離職創業。目前就職于OneOaaS,作為公司技術合伙人,主要從事運維工具開發,Zabbix監控服務和二次開發。OneOaaS是一家集運維工具開發,監控服務,運維架構咨詢于一體的運維服務公司,同時也是中國地區的Zabbix官方合作伙伴。

1.在餓了么的工作經歷,對您現在的創業有什么影響嗎?您有哪些創業經驗分享給想創業的朋友們?

餓了么是一家很重視技術的公司,員工非常年輕,是一群有想法、有追求的年輕人。因此,我與這么多有激情,富有創造力的同事在一起工作是非常開心的事情。餓了么的專注,效率和執行力是大家有目共睹的,這些對我的影響很大。

在創業前期,我還是一個“小學生”,還要向更多前輩學習。對于第一次創業的朋友們提下小建議,也是自我的感受:創業前的你一定要想好所具備的資源,選擇方向的發展前景,如果這兩點已經確認了,那么你就要十分專注,為了家人、伙伴和完美的人生去勇敢的拼搏一次。

2.您工作中所使用的Zabbix監控自動化處于什么階段呢?您對于它的未來發展有哪些期待?

Zabbix是一個基于Web界面,提供分布式系統監視以及網絡監視功能的企業級開源解決方案。它能監視各種網絡參數,保證服務器系統的安全運營,并提供柔軟的通知機制以讓系統管理員快速定位/解決存在的各種問題,是企業自動化運維監控的利器。Zabbix靈活的設計為用戶提供了易用的二次開發接口,讓用戶既可以使用Zabbix本身提供的功能,又可以自定義更多的監控項功能,從硬件監控,到操作系統,再到服務進程,以及網絡設備。

目前,我們為客戶提供Zabbix監控的咨詢架構與設計實現中,規模有大有小,既有多達幾千臺規模的服務器,也有幾百臺規模的服務器。環境有物理機,網絡設備,虛擬化,存儲,也有云環境,如AWS,阿里云等。甚至有些客戶監控點的物理位置分布在全球各地,因網絡環境造成的監控波動比較嚴重。我們所涉及到的監控需求是比較復雜的。

就監控系統的自動化運維發展階段來說,我們可以從幾個方面來理解。

(1)設備添加的自動化,是指監控系統能夠通過一定規則來實現監控的自動添加,如主動上報,被動掃描。

(2)監控指標添加的自動化,對發現后的設備,添加需要的監控指標,或根據業務指標,或根據設備類型指標。

(3)失效監控指標自動清理,過期自動清理無效的監控指標。

(4)監控客戶端配置的自動化,實現配置管理的自動化。

(5)對故障處理的自動化,在出現故障后,需要能夠實現故障自愈,自動去修復。

在實現自動化的過程中,監控系統與資產管理系統(CMDB)需要有效的結合。資產管理的重要性相信大家都深有體會,作為所有資產信息的唯一入口,例如上線、下線、發布、維護,均需要準確的資產信息。監控系統與資產管理系統有機結合,可以實現不誤報,不漏報,不會添加錯監控項,同時還能夠發現資產與監控不一致的記錄。

對于應用的監控,由于環境的多樣,其復雜程度較高,需要監控系統能夠自動發現監控的指標,自動配置監控指標項,自動配置告警的閾值,以及需要告警匯聚、合并等,如對周期出現的故障,最好能自我修復。

對于未來的發展,希望Zabbix能夠在監控的可視化方面有更好的展示效果,如自動拓撲的生成,實現類似zatree,graph tree的樹形圖形展示功能,在報表分析方面有更方便的功能,能夠提供環比功能等。

3.日常工作中,您有哪些軟件及開源工具推薦給大家?它們有哪些優點和需要注意的地方?

我把日常工作中,使用比較順手的三類開源工具推薦給大家,希望對大家有所幫助。

(1)配置管理類開源工具,我推薦ansible和saltstack。

ansible是基于ssh協議,無agent模式,方便快捷,適合于機器初始化,代碼發布,集中管理配置等場景。而saltstack是屬于socket通信協議,執行效率高,功能模塊也非常全面,社區響應快,文檔豐富。在大多數場景下,這兩者可以結合起來使用。

(2)API離線文檔神器

我推薦Mac下的dash和Windows下的zeal,它們集合了100多種API離線文檔,方便離線搜索。

(3)監控系統,我推薦Zabbix 、Open-falcon。

Open-falcon屬于后起之秀,它吸收了opentsdb,Zabbix等監控工具的一些長處,維護非常方便。它的缺點是當前支持監控協議的種類還偏少。但一般中大型互聯網公司,因為監控對象比較固定,所以完全可以滿足他們的使用需求。

4.您心目中優秀的運維工程師是怎樣的?

我覺得一位優秀的運維工程師,應該具備以下特點。相信擁有這些特質的他們,不管到哪里工作,都會很受歡迎。

(1)具有一定的視野。對業務、對技術才會有很好的把控能力,讓技術為業務服務。

(2)具有良好的學習能力。對于新技術能夠很快掌握,并能為業務服務。

(3)良好的溝通能力。運維工作中,工程師常常需要跨部門溝通,與業務的上下游,與部門同事、領導溝通,這都需要主動積極去推動工作的進行。

(4)良好的團隊協作能力。

(5)應該掌握一門編程語言,如Python,Perl等。具有編碼能力的運維工程師才能將工作做得更得心應手,因為開源工具雖多,但需求總會有新的,總會有開源工具無法滿足的場景。因此,掌握編碼是每個運維工程師必備的技能

(6)文檔能力也不可缺少。

5.您將在4月份北京舉行的WOT互聯網運維和開發者峰會上分享哪些內容?

在本次的峰會上,我主要會分享Zabbix監控運維自動化的相關知識點。例如,如何做運維基礎設施監控,如何做業務監控,如何實現監控的自動化,如何告警和告警中涉及難點的解決方案,以及分享我們對Zabbix進行二次開發的工具等。總體來說,干貨很多,值得大家期待!

【編輯推薦】

  1. 中小企業運維需要重視日志分析
  2. 運維中性能優化的常見模式及趨勢
  3. 大眾點評高可用性系統運維經驗分享
  4. 論開發與運維沖突的根源、表現形式及其解決方案
  5. WOT2016黃繼:小米運維發展中的關鍵節點有哪些?
【責任編輯:火鳳凰 TEL:(010)68476606】

相關熱詞搜索:Zabbix WOT2016 運維

上一篇:經過無數經驗教訓后我給獨立程序員的建議
下一篇:運維必備制度:故障分級和處罰規范

分享到: 收藏