金山運維肖力:如何將業務遷移到虛擬化環境并穩定運行(1)
2016-02-20 19:33:25 來源: 高招CTO訓練營 51CTO.com 評論:0 點擊:
(1)說服老板的秘訣。
說服老板有兩個秘訣:“畫餅”和“挖坑”,往往老板比較好說服,因為虛擬化能給企業帶來真金白銀的好處。比如如果企業現在有2000臺服務器,即使按照一比二這樣一個比例實施虛擬化,立馬就可以節省50%服務器,50%的機柜。
所以,我們其實也不是在畫餅,這個餅真實存在,并且可以吃到的。但是畫餅的時候,要挖一個“坑”,因為在業務遷移虛擬化的時候,難免碰到這樣或者那樣的問題,碰到問題的時候,我們需要老板的支持,在做虛擬化遷移之前,我們就要和老板說好,虛擬化會給企業帶來巨大的利益,實施過程中我們會做好各種預案,充分做好測試,但是也難免會碰到問題,萬一碰到問題的時候需要老板支持我們,力挺我們。
(2)說服同事支持的秘訣。
往往說服同事支持很困難,因為大部分同事都是多一事不如少一事這樣的心態,如果業務在物理機上已經非常穩定了,大部分人肯定不愿意再折騰一次了。這時候說服同事的辦法就是樹立一個樣板,用事實說話,讓大家看到業務可以在虛擬化平臺上穩定運行。
如何選擇第一個虛擬化項目。
選擇第一個虛擬化項目非常重要,和打仗一樣,首戰必勝,這是一個戰略問題,如果第一個虛擬化項目失敗了,后面的工作就很難開展,萬事開頭難,那么如何選擇第一個虛擬化項目呢?適合虛擬化的業務有那些特征了呢?
(1)單進程
但進程的業務非常適合虛擬化,現在的CPU都是多核,單進程的業務只使用一個核,通過虛擬化就可以很好的將多個單進程的業務整合在一起,尤其是通過應用層很難進程優化的業務。
(2)利用率非常低
常年CPU利用率在20%以下,這種業務通過虛擬化也非常好整合,將幾個業務整合到一臺宿主機上,可以提高整體的利用率。
(3)頻繁變動的業務
這種業務搞虛擬化的動力最強,因為虛擬化快速部署的特點確實能解決他們的痛點。對運維來說,能節省成本他們不一定有動力,但是說能快速簡單實現,他們動力很足。
(4)非核心業務
一開始虛擬化的時候,最好不要選核心業務,否則出了問題,壓力會很大。核心業務應在口碑樹立起來之后,在逐步進行虛擬化。
第一個虛擬化項目應該從自己企業內部找一個最符合以上條件的業務,來進行虛擬化,以提高虛擬化的成功率。
另外,并不是所有的業務都適合虛擬化,那有哪些業務不適合虛擬化呢?
壓力特別高的業務不建議搞虛擬化,如果在物理機上CPU利用率已經80%了,就很難通過虛擬化進行壓縮。
虛擬化項目實施應該遵循哪些流程,能保證比較穩定的將業務遷移到虛擬化環境?
從我個人長期的實踐來看,虛擬化實施最好循序漸進,穩扎穩打,遵循以下的步驟,可以保證比較穩定的業務遷移到虛擬化環境。
(1)業務性能評估及壓力模型建立
項目啟動的時候,首先面臨的是虛擬化比例如何確定,到底是1虛5,還是1虛7比較合適,宿主機的配置如何確定,這些都需要依靠數據決定,所以我們首先需要收集現有業務的壓力數據,根據壓力數據分析業務的壓力模型。業務壓力模型建立方法,后面還有詳細介紹,有了壓力模型,虛擬化比例和宿主機選型就非常好確定。
(2)測試環境測試
虛擬化比例和宿主機確定好之后,然后應該進行測試,測試包括系統方面的測試和業務方面的測試,系統方面測試主要測試宿主機和虛擬機的壓力瓶頸點,看看宿主機和虛擬機最大的負載點在那里,為以后使用做到心里有底。
業務測試包括業務的功能測試和性能測試,功能測試主要測試業務在虛擬機上運行有沒有問題,性能測試主要測試業務在虛擬機上能夠承擔的最高負載,比如游戲行業能負載多少人數,web,數據庫能負載多少連接或者io,這個要根據每個業務的不同,使用業務應用層的測試方法進行測試。
通過測試,一方面我們可以測試穩定性,一方面可以得到業務在虛擬機上的最大負載,取得這些數據,我們就可以做到對以后的虛擬機使用心中有數。
(3)小規模部署
測試環境測試沒有問題,并且取得相關數據后,就可以在生產環境部署,先應該在生產環境小規模的進行部署,并且測試2周到一個月。小規模部署最好是業務壓力比較小的一臺虛擬機測試2周到一個月,沒有問題后在找業務壓力最大的一組進行虛擬化,在測試2周到一個月。
(4)全面部署
小規模部署沒有問題后,就可以逐步的進行全面虛擬化部署,按部就班的將業務遷移到虛擬化環境,直至進入最終的虛擬化運維。
▼下面介紹下業務壓力模型的構建方法。
下定決心做虛擬化之后,面臨的下一個問題是到底虛擬化比例如何確定,宿主機的配置如何選型,這時候就需要根據自己的業務特點,建立壓力模型,根據壓力模型確定虛擬化比例,宿主機、虛擬機的配置。
上一篇:去哪兒網使用的MySQL自動化運維工具Inception介紹
下一篇:運維朋友們,別再問需不需要學Python了
