技術(shù)專題:智能化運(yùn)維
2016-02-20 19:34:22 來源: 孫淑娟 51CTO.com 評(píng)論:0 點(diǎn)擊:
一、曲顯平
曲顯平,百度智能運(yùn)維監(jiān)控負(fù)責(zé)人,在運(yùn)維監(jiān)控、大數(shù)據(jù)處理與分析方向有著豐富的經(jīng)驗(yàn)。
點(diǎn)評(píng)內(nèi)容:
2015年是中國(guó)互聯(lián)網(wǎng)智能化運(yùn)維發(fā)展的元年,BAT等相繼提出這一思路,在這一領(lǐng)域進(jìn)行了一些卓有成效的嘗試。隨著互聯(lián)網(wǎng)產(chǎn)品的蓬勃發(fā)展,和PAAS、APM、智能異常檢測(cè)、大數(shù)據(jù)分析、機(jī)器學(xué)習(xí)等技術(shù)的興起和逐漸成熟,運(yùn)維技術(shù)也開啟了一個(gè)新的篇章,不難看出,這些技術(shù)都是希望解放人的大腦和雙手,而智能化便是大勢(shì)所趨,眾望所歸的結(jié)果。
智能化運(yùn)維,顧名思義,與平臺(tái)化運(yùn)維和自動(dòng)化運(yùn)維有著明顯的不同。平臺(tái)化運(yùn)維注重的是入口的統(tǒng)一,運(yùn)維服務(wù)或能力的復(fù)用,減少重復(fù)勞動(dòng),規(guī)范化操作;自動(dòng)化運(yùn)維注重的是大規(guī)模、批量化操作,一個(gè)程序一次性部署在成千上萬(wàn)的服務(wù)器上,或者針對(duì)某些特定場(chǎng)景,能夠進(jìn)行簡(jiǎn)單的邏輯執(zhí)行,把繁雜的運(yùn)維工作組織為一個(gè)有機(jī)的過程,一次性執(zhí)行。而智能化運(yùn)維,是更大跨度的向前一步,這個(gè)標(biāo)志應(yīng)該是運(yùn)維工作從依靠人工決策,逐步轉(zhuǎn)為依靠機(jī)器決策。舉幾個(gè)例子,故障的發(fā)現(xiàn),以前多靠人工經(jīng)驗(yàn)來設(shè)定監(jiān)控閾值,而機(jī)器可以通過歷史監(jiān)控?cái)?shù)據(jù)規(guī)律的學(xué)習(xí),自動(dòng)生成更加準(zhǔn)確的閾值或通過異常模式識(shí)別去主動(dòng)判斷異常的發(fā)生。這不僅能夠大量簡(jiǎn)化人的工作,而且比人更精準(zhǔn);故障的定位,以前多靠人翻閱大量的監(jiān)控?cái)?shù)據(jù)、服務(wù)器日志,甚至聯(lián)絡(luò)各相關(guān)團(tuán)隊(duì)工程師,分析線上所有變更事件等才能定位一個(gè)問題,而機(jī)器可以根據(jù)系統(tǒng)中的網(wǎng)絡(luò)、機(jī)房、程序上下游調(diào)用關(guān)系等,綜合所有監(jiān)控?cái)?shù)據(jù)和采集日志,來綜合分析和定位,這比人的效率更高且更全面;擴(kuò)縮容、止損和預(yù)案操作等也是類似,還有很多其它的例子。智能化運(yùn)維是希望終有一天,機(jī)器決策能夠大幅超越人工決策,那也就是運(yùn)維人性解放的時(shí)刻。
2016年將是智能化運(yùn)維全面鋪開,得到大力發(fā)展的一年。APM、智能異常檢測(cè)等技術(shù)將更加普及,逐漸取代運(yùn)維工程師手工配置監(jiān)控和實(shí)施策略。而智能化的故障定位技術(shù)也將覆蓋更廣泛,數(shù)據(jù)中心、網(wǎng)絡(luò)、程序、業(yè)務(wù)等各個(gè)層面的故障定位能力將得到全面提升,極大解放oncall工程師的大腦和雙手。而在故障恢復(fù)決策方面,智能化的監(jiān)控系統(tǒng)將能夠和PAAS或預(yù)案管理等系統(tǒng)結(jié)合起來,由監(jiān)控系統(tǒng)給出判斷決策,通知PAAS或預(yù)案執(zhí)行系統(tǒng)來進(jìn)行相應(yīng)的降級(jí)或者止損操作。在不久的將來,相信運(yùn)維工程師的雙手會(huì)得到極大解放,逐漸告別繁復(fù)的基礎(chǔ)運(yùn)維工作,讓他們?cè)诎l(fā)展DevOps的道路上走得更加深入,每個(gè)人都成為領(lǐng)域?qū)<摇?/p>
相關(guān)熱詞搜索:智能化運(yùn)維 運(yùn)維 自動(dòng)化運(yùn)維
上一篇:如何在一分鐘內(nèi)對(duì)Linux服務(wù)器進(jìn)行最佳性能診斷
下一篇:移動(dòng)游戲技術(shù)優(yōu)化的解決方案簡(jiǎn)述

頻道總排行
- Cisco NetFlow v9為何無人問津?
- 技術(shù)專題:智能化運(yùn)維
- 開源代碼管理:如何安全地使用開源庫(kù)?
- Facebook架構(gòu)解讀
- IT運(yùn)維分析與海量日志搜索需要注意什么(1)
- 金山運(yùn)維肖力:如何將業(yè)務(wù)遷移到虛擬化環(huán)境并穩(wěn)定運(yùn)行(1)
- Apache Ignite(四):基于Ignite的分布式ID生成器
- CrazyEye,一款國(guó)人開源的堡壘機(jī)軟件(1)
- SDN時(shí)代的網(wǎng)絡(luò)管理系統(tǒng)會(huì)走向何方
- WOT2016吳兆松:Zabbix監(jiān)控自動(dòng)化的未來如何發(fā)展
頻道本月排行
- 8你消費(fèi)我買單——"漏洞"天使OneRASP...
- 7有了Jenkins,為什么還需要一個(gè)獨(dú)立...
- 6IT運(yùn)維分析與海量日志搜索需要注意什么(1)
- 5新浪微博王傳鵬:微博推薦架構(gòu)的演進(jìn)(1)
- 4史上最大機(jī)器學(xué)習(xí)數(shù)據(jù)集,雅虎對(duì)外開...
- 4雅虎開源可以提升流操作速度的DataSketches
- 4大眾點(diǎn)評(píng)高可用性系統(tǒng)運(yùn)維經(jīng)驗(yàn)分享
- 4云運(yùn)維如何選擇部署適合自身的IDC和...
- 4開源還是商用?十大云運(yùn)維監(jiān)控工具測(cè)...
- 4論開發(fā)與運(yùn)維沖突的根源、表現(xiàn)形式及...