技術(shù)專(zhuān)題:智能化運(yùn)維
2016-02-20 19:34:22 來(lái)源: 孫淑娟 51CTO.com 評(píng)論:0 點(diǎn)擊:
一、曲顯平
曲顯平,百度智能運(yùn)維監(jiān)控負(fù)責(zé)人,在運(yùn)維監(jiān)控、大數(shù)據(jù)處理與分析方向有著豐富的經(jīng)驗(yàn)。
點(diǎn)評(píng)內(nèi)容:
2015年是中國(guó)互聯(lián)網(wǎng)智能化運(yùn)維發(fā)展的元年,BAT等相繼提出這一思路,在這一領(lǐng)域進(jìn)行了一些卓有成效的嘗試。隨著互聯(lián)網(wǎng)產(chǎn)品的蓬勃發(fā)展,和PAAS、APM、智能異常檢測(cè)、大數(shù)據(jù)分析、機(jī)器學(xué)習(xí)等技術(shù)的興起和逐漸成熟,運(yùn)維技術(shù)也開(kāi)啟了一個(gè)新的篇章,不難看出,這些技術(shù)都是希望解放人的大腦和雙手,而智能化便是大勢(shì)所趨,眾望所歸的結(jié)果。
智能化運(yùn)維,顧名思義,與平臺(tái)化運(yùn)維和自動(dòng)化運(yùn)維有著明顯的不同。平臺(tái)化運(yùn)維注重的是入口的統(tǒng)一,運(yùn)維服務(wù)或能力的復(fù)用,減少重復(fù)勞動(dòng),規(guī)范化操作;自動(dòng)化運(yùn)維注重的是大規(guī)模、批量化操作,一個(gè)程序一次性部署在成千上萬(wàn)的服務(wù)器上,或者針對(duì)某些特定場(chǎng)景,能夠進(jìn)行簡(jiǎn)單的邏輯執(zhí)行,把繁雜的運(yùn)維工作組織為一個(gè)有機(jī)的過(guò)程,一次性執(zhí)行。而智能化運(yùn)維,是更大跨度的向前一步,這個(gè)標(biāo)志應(yīng)該是運(yùn)維工作從依靠人工決策,逐步轉(zhuǎn)為依靠機(jī)器決策。舉幾個(gè)例子,故障的發(fā)現(xiàn),以前多靠人工經(jīng)驗(yàn)來(lái)設(shè)定監(jiān)控閾值,而機(jī)器可以通過(guò)歷史監(jiān)控?cái)?shù)據(jù)規(guī)律的學(xué)習(xí),自動(dòng)生成更加準(zhǔn)確的閾值或通過(guò)異常模式識(shí)別去主動(dòng)判斷異常的發(fā)生。這不僅能夠大量簡(jiǎn)化人的工作,而且比人更精準(zhǔn);故障的定位,以前多靠人翻閱大量的監(jiān)控?cái)?shù)據(jù)、服務(wù)器日志,甚至聯(lián)絡(luò)各相關(guān)團(tuán)隊(duì)工程師,分析線上所有變更事件等才能定位一個(gè)問(wèn)題,而機(jī)器可以根據(jù)系統(tǒng)中的網(wǎng)絡(luò)、機(jī)房、程序上下游調(diào)用關(guān)系等,綜合所有監(jiān)控?cái)?shù)據(jù)和采集日志,來(lái)綜合分析和定位,這比人的效率更高且更全面;擴(kuò)縮容、止損和預(yù)案操作等也是類(lèi)似,還有很多其它的例子。智能化運(yùn)維是希望終有一天,機(jī)器決策能夠大幅超越人工決策,那也就是運(yùn)維人性解放的時(shí)刻。
2016年將是智能化運(yùn)維全面鋪開(kāi),得到大力發(fā)展的一年。APM、智能異常檢測(cè)等技術(shù)將更加普及,逐漸取代運(yùn)維工程師手工配置監(jiān)控和實(shí)施策略。而智能化的故障定位技術(shù)也將覆蓋更廣泛,數(shù)據(jù)中心、網(wǎng)絡(luò)、程序、業(yè)務(wù)等各個(gè)層面的故障定位能力將得到全面提升,極大解放oncall工程師的大腦和雙手。而在故障恢復(fù)決策方面,智能化的監(jiān)控系統(tǒng)將能夠和PAAS或預(yù)案管理等系統(tǒng)結(jié)合起來(lái),由監(jiān)控系統(tǒng)給出判斷決策,通知PAAS或預(yù)案執(zhí)行系統(tǒng)來(lái)進(jìn)行相應(yīng)的降級(jí)或者止損操作。在不久的將來(lái),相信運(yùn)維工程師的雙手會(huì)得到極大解放,逐漸告別繁復(fù)的基礎(chǔ)運(yùn)維工作,讓他們?cè)诎l(fā)展DevOps的道路上走得更加深入,每個(gè)人都成為領(lǐng)域?qū)<摇?/p>
二、王津銀
王津銀,自稱(chēng)老王(非隔壁那位)。2007年進(jìn)入騰訊公司接觸運(yùn)維,經(jīng)歷服務(wù)器從百到萬(wàn)的運(yùn)維歷程,先后在YY和UC參與不同業(yè)務(wù)形態(tài)的運(yùn)維,期間帶過(guò)前端運(yùn)維、數(shù)據(jù)存儲(chǔ)運(yùn)維、YY語(yǔ)音、游戲運(yùn)維、運(yùn)維研發(fā)等多種運(yùn)維團(tuán)隊(duì),對(duì)運(yùn)維有著全面的理解。極力倡導(dǎo)互聯(lián)網(wǎng)價(jià)值運(yùn)維理念,即面向用戶(hù)的價(jià)值是由自動(dòng)化平臺(tái)交付傳遞,同時(shí)由數(shù)據(jù)化來(lái)提煉和衡量。
點(diǎn)評(píng)內(nèi)容:
智能運(yùn)維有著更強(qiáng)的技術(shù)驅(qū)動(dòng)因素,因此,從運(yùn)維的技術(shù)發(fā)展進(jìn)程來(lái)看,我們可以看到幾個(gè)階段:
1.腳本時(shí)代
用ssh+exp代替了手工登錄服務(wù)器維護(hù)的模式。
2.工具時(shí)代
以chef/puppet配置工具為代表,把運(yùn)維的能力變成一個(gè)個(gè)的工具能力。
3.平臺(tái)時(shí)代
隨著IT敏捷性要求越來(lái)越高,需要把運(yùn)維工具能力平臺(tái)化,進(jìn)一步固化運(yùn)維的常見(jiàn)場(chǎng)景。
4.智能時(shí)代
運(yùn)維的精細(xì)化要求越來(lái)越高,從運(yùn)維走向了IT運(yùn)營(yíng),智能可以讓運(yùn)維更簡(jiǎn)單。
智能時(shí)代的確需要更多、更綜合的運(yùn)維能力沉淀,需要更全面的自動(dòng)化能力和數(shù)據(jù)分析能力,具體的實(shí)現(xiàn)需要考慮如下因素:
1.多邊系統(tǒng)集成
基于IaaS/PaaS的運(yùn)維模式,引申出運(yùn)維平臺(tái)的幾種模型,但該模型還遠(yuǎn)遠(yuǎn)不夠,他們存在邊界的割接,因此需要一個(gè)運(yùn)維平臺(tái)來(lái)統(tǒng)一集成多方
的平臺(tái)能力。
2.多運(yùn)維平臺(tái)的閉環(huán)對(duì)接
資源管理、業(yè)務(wù)信息管理平臺(tái)、自動(dòng)化平臺(tái)、監(jiān)控平臺(tái)、IT數(shù)據(jù)運(yùn)營(yíng)平臺(tái)等多個(gè)平臺(tái)要閉環(huán)對(duì)接,才能提供一站式的運(yùn)維服務(wù)能力。
3.場(chǎng)景化的智能模式抽象
基于變更/故障/異常分析/預(yù)測(cè)等各個(gè)運(yùn)維場(chǎng)景,都可以找到智能化的模型/具體實(shí)現(xiàn)。
4.IT大數(shù)據(jù)分析提供智能決策
需要更強(qiáng)的大數(shù)據(jù)實(shí)時(shí)分析能力,提供實(shí)時(shí)的變更和調(diào)度智能決策能力。
5.技術(shù)架構(gòu)的智能化
無(wú)論是微服務(wù)還是Cloud Native的實(shí)現(xiàn),其實(shí)都是從更高的技術(shù)架構(gòu)要求上提供了自治能力,智能化的技術(shù)架構(gòu)讓智能運(yùn)維真正有了可能。
三、韓曉光
韓曉光,專(zhuān)業(yè)運(yùn)維、兼職開(kāi)發(fā)、干過(guò)商務(wù),從事系統(tǒng)運(yùn)維工作近10年?,F(xiàn)就職于新華網(wǎng)(http://www.xinhuanet.com/),帶領(lǐng)運(yùn)維開(kāi)發(fā)團(tuán)隊(duì),承擔(dān)社交互動(dòng)媒體幾十套業(yè)務(wù)系統(tǒng)、技術(shù)平臺(tái)運(yùn)維。曾就職于中航信旗下航空結(jié)算公司,承擔(dān)國(guó)內(nèi)外幾十家民航業(yè)務(wù)系統(tǒng)運(yùn)維。具有“信息系統(tǒng)項(xiàng)目管理師”、“IBM CATE”、“ITIL Foundation”、“RHCE”專(zhuān)業(yè)資格認(rèn)證。
點(diǎn)評(píng)內(nèi)容:
2016年以及未來(lái)一段時(shí)間,“智能”將會(huì)更加普遍的應(yīng)用到現(xiàn)實(shí)中,使我們的體驗(yàn)更加豐富多元與深刻入微。比如人工智能、虛擬現(xiàn)實(shí)、物聯(lián)網(wǎng)、大數(shù)據(jù)、圖文識(shí)別等各種技術(shù)、產(chǎn)品將會(huì)深刻融入我們?nèi)粘I畹姆椒矫婷妗?/p>
與此同時(shí),運(yùn)維工作也將更加體現(xiàn)在智能化。運(yùn)維智能化背后則是各種運(yùn)維理念、技術(shù)、產(chǎn)品的升級(jí)優(yōu)化,以及創(chuàng)新。運(yùn)維智能化將更多體現(xiàn)在對(duì)各種技術(shù)創(chuàng)新的融合方面。
以往簡(jiǎn)單的運(yùn)維監(jiān)控,僅僅依靠幾個(gè)互相獨(dú)立監(jiān)控網(wǎng)管軟件來(lái)做。而運(yùn)維智能化將更多體現(xiàn)在對(duì)各種運(yùn)維信息的采集、分析、匯總、收斂、智能預(yù)警與智能自愈方面。
以往簡(jiǎn)單的運(yùn)維操作,通常寫(xiě)幾個(gè)腳本、用幾個(gè)運(yùn)維工具就是運(yùn)維的主要工作了。而運(yùn)維智能化則更多體現(xiàn)在DevOps敏捷運(yùn)營(yíng)上,快速有效規(guī)范地開(kāi)發(fā)與部署,不斷地持續(xù)交付迭代。
以往簡(jiǎn)單的運(yùn)維規(guī)范,通常是沒(méi)有太多規(guī)范的。開(kāi)發(fā)、業(yè)務(wù)有需要,運(yùn)維則被動(dòng)執(zhí)行一些運(yùn)維工作。人員職責(zé)不清,設(shè)備資產(chǎn)管理混亂,運(yùn)維工作隨意沒(méi)有規(guī)矩。而運(yùn)維智能化則更多體現(xiàn)在標(biāo)準(zhǔn)規(guī)范上,大體量高規(guī)格,以及良好的應(yīng)急機(jī)制。
綜上可見(jiàn),由于運(yùn)維智能化,運(yùn)維工作不會(huì)是越來(lái)越清閑了,相反承擔(dān)的企業(yè)發(fā)展戰(zhàn)略的責(zé)任越來(lái)越大了。運(yùn)維部門(mén)將由傳統(tǒng)的IT成本中心更多地轉(zhuǎn)向IT服務(wù)中心、價(jià)值輸出中心、利潤(rùn)輸出中心轉(zhuǎn)變。
四、編輯
系統(tǒng)頻道編輯 孫淑娟
虛擬化、容器、移動(dòng)化、Hadoop、Docker......層出不窮,令人眼花繚亂,云計(jì)算、大數(shù)據(jù)、移動(dòng)通信等互聯(lián)網(wǎng)新技術(shù)不斷演進(jìn),運(yùn)維的技術(shù)含量越來(lái)越大,相應(yīng)對(duì)運(yùn)維人員的綜合素質(zhì)及能力要求也越來(lái)越高,運(yùn)維也不再是部署系統(tǒng)、寫(xiě)管理腳本那么簡(jiǎn)單了。
而且,隨著業(yè)務(wù)應(yīng)用越來(lái)越復(fù)雜,設(shè)備數(shù)量越來(lái)越多,管理難度越來(lái)越高,運(yùn)維人員必須高屋建瓴,全面謀劃,有能力提供一個(gè)全局性、高效健壯、標(biāo)準(zhǔn)規(guī)范、自動(dòng)化乃至智能化的解決方案并加以實(shí)現(xiàn)。
智能化運(yùn)維是用機(jī)器來(lái)代替運(yùn)維人員,在最少人工干預(yù)下,結(jié)合運(yùn)用腳本與第三方工具,保證業(yè)務(wù)7*24小時(shí)高效穩(wěn)定運(yùn)行,這也是運(yùn)維工作的終極目標(biāo)。智能化運(yùn)維要做到事前預(yù)警、事中恢復(fù)和事后存檔,實(shí)際上有大量的工作要完成。智能化運(yùn)維不僅可以將運(yùn)維人員從繁瑣的工作中解放出來(lái),而且還大大提升了運(yùn)維工作的效率,是2016年運(yùn)維發(fā)展的主要方向。
相關(guān)技術(shù)點(diǎn)推薦:
◆ DevOps
◆ 持續(xù)交付
◆ Docker
◆ Python
相關(guān)熱詞搜索:智能化運(yùn)維 運(yùn)維 自動(dòng)化運(yùn)維
上一篇:如何在一分鐘內(nèi)對(duì)Linux服務(wù)器進(jìn)行最佳性能診斷
下一篇:移動(dòng)游戲技術(shù)優(yōu)化的解決方案簡(jiǎn)述

頻道總排行
- Cisco NetFlow v9為何無(wú)人問(wèn)津?
- 技術(shù)專(zhuān)題:智能化運(yùn)維
- 開(kāi)源代碼管理:如何安全地使用開(kāi)源庫(kù)?
- Facebook架構(gòu)解讀
- IT運(yùn)維分析與海量日志搜索需要注意什么(1)
- 金山運(yùn)維肖力:如何將業(yè)務(wù)遷移到虛擬化環(huán)境并穩(wěn)定運(yùn)行(1)
- Apache Ignite(四):基于Ignite的分布式ID生成器
- CrazyEye,一款國(guó)人開(kāi)源的堡壘機(jī)軟件(1)
- SDN時(shí)代的網(wǎng)絡(luò)管理系統(tǒng)會(huì)走向何方
- WOT2016吳兆松:Zabbix監(jiān)控自動(dòng)化的未來(lái)如何發(fā)展
頻道本月排行
- 8你消費(fèi)我買(mǎi)單——"漏洞"天使OneRASP...
- 7有了Jenkins,為什么還需要一個(gè)獨(dú)立...
- 6IT運(yùn)維分析與海量日志搜索需要注意什么(1)
- 5新浪微博王傳鵬:微博推薦架構(gòu)的演進(jìn)(1)
- 4史上最大機(jī)器學(xué)習(xí)數(shù)據(jù)集,雅虎對(duì)外開(kāi)...
- 4雅虎開(kāi)源可以提升流操作速度的DataSketches
- 4大眾點(diǎn)評(píng)高可用性系統(tǒng)運(yùn)維經(jīng)驗(yàn)分享
- 4云運(yùn)維如何選擇部署適合自身的IDC和...
- 4開(kāi)源還是商用?十大云運(yùn)維監(jiān)控工具測(cè)...
- 4論開(kāi)發(fā)與運(yùn)維沖突的根源、表現(xiàn)形式及...