足球资料库数据/孙祥/nba五佳球/足球直播哪个平台好 - cctv5今日现场直播

首頁 > 知識庫 > 正文

美團(tuán)如何從0到1構(gòu)建壓測工具
2016-02-20 19:34:20   來源: 佚名 美團(tuán)點(diǎn)評技術(shù)團(tuán)隊(duì)    評論:0 點(diǎn)擊:

美團(tuán)內(nèi)部的RPC服務(wù)大多構(gòu)建在Thrift之上,在日常開發(fā)服務(wù)的過程中,需要針對這些服務(wù)進(jìn)行壓力測試來發(fā)現(xiàn)潛在問題。本文詳細(xì)介紹了美團(tuán)的壓測工具選擇過程,新的壓測工具上線以來,已經(jīng)接入了20多個應(yīng)用,完成數(shù)百次打壓實(shí)驗(yàn),現(xiàn)在應(yīng)用的接入時間僅需要15~30分鐘。

 \

美團(tuán)內(nèi)部的RPC服務(wù)大多構(gòu)建在Thrift之上,在日常開發(fā)服務(wù)的過程中,需要針對這些服務(wù)進(jìn)行壓力測試(以下簡稱壓測)來發(fā)現(xiàn)潛在問題。常用的方法有:

◆使用一些腳本語言如:Python、Ruby等,讀取線上日志構(gòu)建請求,用多線程模擬用戶請求進(jìn)行壓測。

◆使用開源工具進(jìn)行壓測。

然而,無論采取哪種方法,壓測都是一個十分耗時而又繁瑣的過程,主要痛點(diǎn)有:

◆需要寫很多代碼解析日志,還原請求,對于比較復(fù)雜的請求,解析很容易出錯。

◆需要搭建腳本或者工具的運(yùn)行環(huán)境,通常這一過程比較耗時。

◆由于打壓方法沒有統(tǒng)一,導(dǎo)致打壓的結(jié)果指標(biāo)比較混亂,有的結(jié)果甚至以終端輸出的方式展示,非常不直觀。

◆對一個應(yīng)用的打壓測試,由于環(huán)境、代碼的問題,導(dǎo)致組內(nèi)同學(xué)很難共享。

針對上述問題,提供一個簡單好用的壓測工具是十分有必要的。

是否有必要重復(fù)造輪子

在構(gòu)建壓測工具之前,對于一些現(xiàn)有的開源工具進(jìn)行了調(diào)研。現(xiàn)在主流的壓測工具主要有以下幾個:

1.JMeter

JMeter是一個比較老牌的壓測工具,主要針對HTTP服務(wù)進(jìn)行打壓,該工具在以下方面并不滿足美團(tuán)內(nèi)部的壓測需求:

◆默認(rèn)不支持Thrift的打壓測試。

◆需要本地安裝,并且配置復(fù)雜。

◆對于用戶操作并不友好。

\ 

2.twitter/iago

iago 是一個由Twitter開源的壓測工具,支持對HTTP、Thrift等服務(wù)進(jìn)行壓測,其主要問題如下:

◆對每個壓測應(yīng)用都需要創(chuàng)建一個項(xiàng)目。

◆壓測結(jié)果并不直觀。

◆流量重放依賴本地文件。

◆項(xiàng)目依賴于一個較老版本的Scala,搭建不便。

◆相關(guān)文檔比較少。

除此之外,當(dāng)時還考察了Gatling、Grinder、Locust等一些常見的壓測工具,都因?yàn)檫m用場景和美團(tuán)的需求有些出入而排除了。

綜上,針對當(dāng)前壓測工具的一些現(xiàn)狀,構(gòu)建一個簡單易用的壓測工具還是很有必要的。

目標(biāo)

針對之前提到的痛點(diǎn),新的壓測工具主要提供以下功能:

◆線上流量拷貝。

◆簡單易用的操作界面(接入壓測的時間應(yīng)該控制在1小時以內(nèi))。

◆清晰的圖表能反映壓測應(yīng)用的各項(xiàng)指標(biāo)。

◆滿足包括Thrift、HTTP等服務(wù)的壓測需求。

如何構(gòu)建

抽象

目標(biāo)已經(jīng)明確,怎么實(shí)現(xiàn)呢?首先是抽象壓測的過程。

一個典型的壓測過程如圖所示,首先在init方法里面,進(jìn)行一些初始化的工作,比如連接數(shù)據(jù)庫,創(chuàng)建客戶端等。接下來,在run方法里面發(fā)出壓測請求,為了保證能夠?qū)Ψ?wù)產(chǎn)生足夠的壓力,這里通常采用多線程并發(fā)訪問,同時記錄每次請求的發(fā)起時間和結(jié)束時間,這兩個時間的簡單相減就能夠得到每次請求的響應(yīng)時間,利用該結(jié)果就可以計算出TP90、平均響應(yīng)時間、最大響應(yīng)時間等指標(biāo),等壓測結(jié)束后,通過destroy方法進(jìn)行資源回收等工作。

\ 

以上過程可以用接口表示,無論是壓測Thrift服務(wù)還是HTTP服務(wù),本質(zhì)上都是這三個方法實(shí)現(xiàn)的不同??紤]到壓測工具的靈活性和通用性,壓測工具可以將這個接口交給打壓測試的同學(xué)實(shí)現(xiàn),而壓測工具則重點(diǎn)實(shí)現(xiàn)多線程打壓,打壓結(jié)果的聚合等比較耗時的工作。

  1. interface Runner { 
  2.     def init(Test app) // 初始化壓測 
  3.     def run(Test app, String log) // 每次打壓請求,傳入log方便構(gòu)建請求 
  4.     def destroy(Test app) // 壓測完畢后,回收資源 

拷貝流量

Thrift服務(wù)打壓的難點(diǎn)之一就是如何簡單地拷貝線上真實(shí)流量用來構(gòu)建打壓請求。一些大型的Thrift服務(wù)數(shù)據(jù)結(jié)構(gòu)非常復(fù)雜,寫打壓腳本的時候,需要很多代碼來解析日志,而且容易出錯。 因此,提供一個簡單好用的拷貝流量方法是十分有必要的。

在這里壓測工具提供了一個叫VCR(錄像機(jī))的工具來拷貝流量。VCR能夠?qū)⒕€上的請求序列化后寫到Redis里面。

考慮到用戶需要查看具體請求和易用性等需求,最終選取了JSON格式作為序列化和反序列化的協(xié)議。同時,需要部署在生產(chǎn)環(huán)境,為了降低對線上服務(wù)的影響,這里采取了單線程異步寫的方式來拷貝流量。

\ 

聚合數(shù)據(jù)

應(yīng)用打壓完成后,需要一些指標(biāo)來評估壓測結(jié)果,常見的指標(biāo)有:

◆最大響應(yīng)時間

◆平均響應(yīng)時間

◆QPS

◆TP90

◆TP50

壓測工具采用了 InfluxDB 來完成數(shù)據(jù)的聚合工作。

以TP90為例子,僅需要一行查詢就能實(shí)現(xiàn)需求。

  1. SELECT PERCENTILE(response_time, 90) FROM test_series GROUP BY time(10s) 

架構(gòu)

整體而言,整個打壓過程如下:

\ 

實(shí)踐

拷貝流量

美團(tuán)內(nèi)部的服務(wù)大多使用Java來構(gòu)建,VCR以Maven Package的方式提供給用戶。

對用戶來說只需要2行代碼就可以拷貝流量。

為了不影響線上服務(wù),通常選取單臺機(jī)器進(jìn)行流量拷貝工作。

  1. public class TestAppRPC implements TestApp.Iface { 
  2.  
  3.     private Vcr _vcr = new Vcr("testapp"); // 指定拷貝流量的key 
  4.  
  5.     @Override 
  6.     public TestResponse echo(TestRequest req) throws TException { 
  7.         _vcr.copy(req); // 拷貝操作 
  8.         long start = System.currentTimeMillis(); 
  9.         TestResponse response = new TestResponse(); 
  10.         return response; 
  11.     } 

一旦流量拷貝完成后,通過Web界面,用戶能夠查看日志的收集情況和單條日志的詳情。

\ 

壓測邏輯實(shí)現(xiàn)

壓測工具采用Groovy來進(jìn)行編寫。對每個應(yīng)用來說,只需要實(shí)現(xiàn)runner接口就可以實(shí)現(xiàn)對應(yīng)用的打壓。

  1. interface Runner { 
  2.     def init(Test app) 
  3.     def run(Test app, String log) 
  4.     def destroy(Test app) 

以Thrift服務(wù)為例。

  1. class TestServiceRunner implements Runner { 
  2.  
  3.     RPCService.Client _client 
  4.     TTransport _transport; 
  5.  
  6.     @Override 
  7.     def init(Test app) { 
  8.         def conf = app.config // 讀取應(yīng)用配置 
  9.         _transport = new TFramedTransport(new TSocket(conf.get("thrift_service_host"as String, conf.get("thrift_service_port"as int)) 
  10.         TProtocol protocol = new TBinaryProtocol(_transport) 
  11.         _client = new RPCService.Client(protocol) 
  12.         _transport.open() 
  13.     } 
  14.  
  15.     @Override 
  16.     def run(Test app, String log) { 
  17.         TestRequest req = Vcr.deSerialize(log, TestRequest.class) // 將拷貝流量反序列化 
  18.         _client.echo(req) // 發(fā)送請求 
  19.     } 
  20.  
  21.     @Override 
  22.     def destroy(Test app) { 
  23.         _transport.close() // 關(guān)閉服務(wù) 
  24.     } 

創(chuàng)建應(yīng)用

實(shí)現(xiàn)以上接口后,就可以對應(yīng)用進(jìn)行打壓了。

用戶可以通過Web界面創(chuàng)建應(yīng)用,除了必填配置以外,用戶可以按照應(yīng)用靈活配置。

\ 

性能指標(biāo)

用戶可以通過直觀的圖表來查看應(yīng)用的各種性能指標(biāo)。

\ 

結(jié)束語

壓測工具上線以來,已經(jīng)接入了20多個應(yīng)用,完成數(shù)百次打壓實(shí)驗(yàn),現(xiàn)在應(yīng)用的接入時間僅需要15~30分鐘。保證了美團(tuán)服務(wù)的穩(wěn)定和節(jié)省了開發(fā)同學(xué)的時間,使大家告別了以往繁瑣冗長的打壓測試。

【編輯推薦】

  1. Firefox for Android 打造全新移動瀏覽體驗(yàn)
  2. Firefox for Android移動瀏覽體驗(yàn)也定制
  3. 打造五星瀏覽體驗(yàn) 傲游瀏覽器大測評
  4. 傲游云瀏覽器:全新無縫瀏覽體驗(yàn)
  5. 桌面版Opera 34發(fā)布 Turbo模式流量更省、瀏覽體驗(yàn)更快
【責(zé)任編輯:武曉燕 TEL:(010)68476606】

相關(guān)熱詞搜索:美團(tuán) 壓測工具 工具

上一篇:創(chuàng)業(yè)型小公司如何做好日常的監(jiān)控運(yùn)維
下一篇:PaaS時代來臨,運(yùn)維人要做哪些準(zhǔn)備工作

分享到: 收藏