優(yōu)秀的運(yùn)維架構(gòu)師應(yīng)該具備哪些能力?(1)
2016-02-20 19:34:14 來源: 蘇君福 高效運(yùn)維 評論:0 點(diǎn)擊:
作者介紹
蘇君福(Jeff)
10多年運(yùn)營管理及系統(tǒng)架構(gòu)規(guī)劃經(jīng)驗(yàn),擅長ITIL企業(yè)實(shí)戰(zhàn)?,F(xiàn)任全時(shí)企業(yè)社交平臺總監(jiān)一職。
合格的運(yùn)營式運(yùn)維工程師
首先,我們總結(jié)下,關(guān)于談到何為一名合格的運(yùn)維運(yùn)營工程師,大概就是幾點(diǎn):
具備一定運(yùn)營技能;要有運(yùn)營意識;主動性要強(qiáng);學(xué)習(xí)能力要跟得上。
大家都會發(fā)現(xiàn)這些條件基本是主觀性方面的占的多一些,而與客觀沾邊的貌似只有一點(diǎn):學(xué)習(xí)能力問題。運(yùn)營技能差可以培養(yǎng),運(yùn)營意識差可以培養(yǎng),主動性差也可以受環(huán)境影響,可以熏陶。
而學(xué)習(xí)能力完全是一個(gè)人綜合能力的體現(xiàn),這一點(diǎn)個(gè)人覺得客觀性占絕大部分。最近發(fā)生的一系列事情,我頗有感觸,合格與不合格的運(yùn)營工程師就差在這里。接下來,我就簡單的跟大家分享一下。
回歸到我們OPS生產(chǎn)線運(yùn)營中來,大家分析一下自己的工作經(jīng)歷,都會發(fā)現(xiàn)我們之前做過一些“傻事”,比如:
運(yùn)營過程中RM掉lib目錄及關(guān)鍵的數(shù)據(jù)文件目錄;Drop掉數(shù)據(jù)庫,甚至就連自己遠(yuǎn)程管理的服務(wù)器,比如做一些安全策略等導(dǎo)致自己也連接不到自己的服務(wù)器,諸如此類。
這些都是大家成長的過程,通過時(shí)間的推移,我們都能吸取教訓(xùn)并總結(jié)經(jīng)驗(yàn)。可以說大家都會經(jīng)過“0”和“1”的過程,這些貌似我們都沒有什么區(qū)分。
但是,大家有沒有總結(jié)一下,“1”到“N”的過程,大家靜下心來仔細(xì)想想,自己的“N”是個(gè)位數(shù)或者是十位數(shù)或者甚至是百位數(shù),你會覺得有哪些感觸呢?
我想里面就能體現(xiàn)你的經(jīng)驗(yàn),更重要的是從這些經(jīng)驗(yàn)中學(xué)到了多少知識,這些將成為你的綜合能力素質(zhì)。
優(yōu)秀的運(yùn)維架構(gòu)師
回歸我們的主題,一名OPS架構(gòu)師,學(xué)習(xí)能力占了主要一部分(其實(shí)其他行業(yè)包括任何事情等等這都是關(guān)鍵一點(diǎn))。如果這塊缺失,僅憑一些生產(chǎn)線的經(jīng)驗(yàn)教訓(xùn),而不去反思,并從中總結(jié)出更多的經(jīng)驗(yàn)來,想成為一個(gè)架構(gòu)師那都是不現(xiàn)實(shí)的。
那么優(yōu)秀的OPS架構(gòu)師我個(gè)人覺得有四部分組成:
1.具備一定的溝通和協(xié)調(diào)能力;
2.具有突發(fā)故障應(yīng)急處理能力;
3.要有不斷反思的能力;
4.要有很強(qiáng)的知新能力。
下面我們來具體說一下。
1.溝通和協(xié)調(diào)能力
具備一定的溝通和協(xié)調(diào)能力,這個(gè)跟性格有關(guān)系。但是,做OPS久了你就會知道,如果你還沒具備一定的溝通和協(xié)調(diào)能力,那么趁早撤出這個(gè)行業(yè),因?yàn)檫@個(gè)職業(yè)不適合你。
我們從OPS的ITIL管理可以看到,幾乎每個(gè)流程都是需要溝通和協(xié)調(diào)的。就拿最基本的變更管理來說,所有的產(chǎn)品上線最后一個(gè)關(guān)口就是要進(jìn)入到生產(chǎn)線部署。
那么,如何協(xié)調(diào)好研發(fā)和測試等資源?做到合理的安排及變更過程中的井然有序?這個(gè)完全是OPS的架構(gòu)師或者說運(yùn)營工程師來驅(qū)動,他會影響變更的成敗。
所以,如果每次變更總是有問題,那么就要找找自己的問題,這個(gè)跟技術(shù)能力沒有多大的關(guān)系,關(guān)鍵在于你是否具備的溝通和協(xié)調(diào)資源的能力。
2.突發(fā)故障應(yīng)急處理能力

具備一定的突發(fā)故障的應(yīng)急處理能力。這個(gè)要求比較高,其實(shí),這個(gè)能力主要有兩個(gè)體現(xiàn):要有一定的技術(shù)能力;要有生產(chǎn)線運(yùn)營經(jīng)驗(yàn)。
技術(shù)能力,后天個(gè)人不斷學(xué)習(xí)去獲?。欢a(chǎn)線運(yùn)營經(jīng)驗(yàn),這些都是血的教訓(xùn)得來的,這個(gè)就是之前我們說的“N”,不過,并不見得“N”越多越好:
而是“N”中,所有的事故或者事件類型的都不重復(fù),或者說相關(guān)類型的不能重復(fù),這是最好的。
也就是,我們要從之前教訓(xùn)中不斷學(xué)習(xí)和武裝自己,讓自己變得更強(qiáng)大,每當(dāng)有新的問題發(fā)生或者降臨到你的身上,你具備快速的處理事件的一二三理念,很好的運(yùn)用事故處理的343法則,這是應(yīng)急處理的能力的關(guān)鍵點(diǎn)。
作為一名優(yōu)秀的OPS架構(gòu)師,毫無疑問以客戶為導(dǎo)向,服務(wù)可持續(xù)性為宗旨,要做的事情就是,快速恢復(fù)服務(wù),后續(xù)排查問題。這個(gè)看得簡單,其實(shí)在實(shí)際運(yùn)營中,往往被大家疏忽。所以,這點(diǎn)看,你是否具備了。
相關(guān)熱詞搜索:運(yùn)維 OPS 運(yùn)維架構(gòu)師
上一篇:從QQ運(yùn)維的歷史遺留問題看公司運(yùn)維的進(jìn)化過程
下一篇:IT運(yùn)維分析與海量日志搜索需要注意什么(1)

頻道總排行
- Cisco NetFlow v9為何無人問津?
- 技術(shù)專題:智能化運(yùn)維
- 開源代碼管理:如何安全地使用開源庫?
- Facebook架構(gòu)解讀
- IT運(yùn)維分析與海量日志搜索需要注意什么(1)
- 金山運(yùn)維肖力:如何將業(yè)務(wù)遷移到虛擬化環(huán)境并穩(wěn)定運(yùn)行(1)
- Apache Ignite(四):基于Ignite的分布式ID生成器
- CrazyEye,一款國人開源的堡壘機(jī)軟件(1)
- SDN時(shí)代的網(wǎng)絡(luò)管理系統(tǒng)會走向何方
- WOT2016吳兆松:Zabbix監(jiān)控自動化的未來如何發(fā)展
頻道本月排行
- 8你消費(fèi)我買單——"漏洞"天使OneRASP...
- 7有了Jenkins,為什么還需要一個(gè)獨(dú)立...
- 6IT運(yùn)維分析與海量日志搜索需要注意什么(1)
- 5新浪微博王傳鵬:微博推薦架構(gòu)的演進(jìn)(1)
- 4史上最大機(jī)器學(xué)習(xí)數(shù)據(jù)集,雅虎對外開...
- 4雅虎開源可以提升流操作速度的DataSketches
- 4大眾點(diǎn)評高可用性系統(tǒng)運(yùn)維經(jīng)驗(yàn)分享
- 4云運(yùn)維如何選擇部署適合自身的IDC和...
- 4開源還是商用?十大云運(yùn)維監(jiān)控工具測...
- 4論開發(fā)與運(yùn)維沖突的根源、表現(xiàn)形式及...