2015數據庫年度盤點
2016-01-19 21:57:37 來源: mengyidan1988 評論:0 點擊:
毫無疑問,數據庫的專業化趨勢變得愈加明顯。這不但體現在專業的數據庫類型適應專業的工作負載,還體現在專業的DBA提供專業的數據庫服務上。 數據庫的多樣化 似乎在不久之前,業界
毫無疑問,數據庫的專業化趨勢變得愈加明顯。這不但體現在專業的數據庫類型適應專業的工作負載,還體現在專業的DBA提供專業的數據庫服務上。
數據庫的多樣化
似乎在不久之前,業界還在爭論到底是通用的數據庫方向還是專業化的數據庫方向代表未來。前者的典型案例就是Oracle,從一開始Oracle的路線就是AllinOne,即使收購了TimesTen,仍然堅持將其中的技術合并到Oracle中提供一個內存存儲的選項。于是乎在Oracle最新版本中,內存選項成為了亮點。但是我們看到的明顯的現象是什么呢?
CSDN的最新調查顯示,已經有很大一部分比例的用戶在其應用中混合采用了多種數據庫解決方案。比如MongoDB和Redis獲得了相當比例的用戶。其實我覺得這個調查甚至沒有反映更明顯的趨勢,因為它是按照用戶數,而不是數據規模來的。相當比例的用戶在分析型數據庫領域采用了GreenPlum、Verica和Gbase8a等專業的MPP數據庫,而因為用戶群在調研范圍外,所以未體現在調查報告之中。
除了關系數據庫的兩種主要形式:OLAP、OLTP,非關系型數據庫的四種主要形式:文檔、健值對、圖和列式,以及科學數據庫中的矩陣式和生物數據庫之外,2015年在數據庫的類型上專業化的趨勢得到了大力的延展。比如時間序列數據庫異軍突起。OpenTSDB、Blueflood、kairosDB、influxDB均得到了長足的發展并嵌入到多個開源項目,其他一些數據庫也開始考慮增強對時序數據的存儲和訪問能力,比如RapidDB。又比如支持全球分布式事務的數據庫的發展。這得益于Google的論文提出了Spanner,一系列類似的數據庫陸續被提出來。最近最火的當屬TiDB,因為其創始人夠牛、開源模式夠帥。
毫無疑問,未來的發展趨勢是專業的數據庫支持專業的負載。這里負載既包括數據的存和取,也包括在數據庫內的查詢和處理邏輯。基因、地理信息、網絡、視頻、圖像,不同負載的數據庫(這里也許是廣義的“數據”)會變得越加專業。
專業化分工是推動人類社會發展的動力,但前提是這種專業化分工是可以達到規模效應的,這就引出了第二個看點。
數據庫的云化
反思一下為什么數據庫會出現專業化的潮流,或者說為什么在現在出現而不是十多年前。當年通用數據庫是一個多么響亮的招牌,數個863項目都與此相關。我認為主要的原因是隨著軟硬件和商業模式的發展,每一個專業化的數據庫方向都有了足夠規模,無論是“錢”上的規模還是“量”上的規模。
在CSDN2015軟件開發者白皮書中,有一個調查非常有趣:“2015年數據庫開發人員比去年大幅下降15%”。毫無疑問,數據庫的使用量一定是增加了。那么問題來了,這些人去哪兒了呢?如果有一份數據可以補充在這里,也許我們會發現,AWS和阿里的云數據庫的用量增加,與這些減少,不過現在數據庫本身在實現DBaaS方面還有很多的不足,原生考慮了DBaaS的數據庫系統目前只有Google系和阿里的OceanBase,其他無非是通過虛擬機或者容器的方式,實現一個數據庫實例的快速安裝和配置。真正要享受DBaaS帶來的專業化分工的好處,必須是在數據庫之上實現“虛擬化”,在數據庫內部實現良好的多租戶隔離、負載管理和計費等。在這方面現在大部分數據庫都需要進行重新設計。
如果數據庫的趨勢是以云服務的方式提供,那么應用開發者如果保證不被Lockin,存儲在云端數據庫的數據是否還是自己的呢?這個問題,就要靠下一個趨勢來解決。
數據庫的開源化
回過頭來看圖1,其中開源數據庫軟件的已經超過閉源數據庫軟件了。開源作為軟件業的一個趨勢,更加證明了賣軟件許可的商業模式是難以持續的,只有開源軟件+專業化服務的模式才是王道。

而這種專業化服務,如果以本地安裝服務的方式成本太高,難以為繼,最理想的方式就是云服務模式。無論是針對中小企業的公有云服務還是面向大型、超大型企業的私有云服務。
數據庫軟件本身的開源提供了信任,無論是國家之間的信任還是企業之間的信任。2015年,一款經典的、重型的MPP數據庫——GreenPlum已經開始了自己的開源之旅,從年初宣布此事,到第四季度正式將代碼放到GitHub上為止,業界一直保持了持續的關注。相關的Meetup和社區快速的成長起來,據我所了解,某大廠正在基于此緊密開發自己的MPPDBaaS服務的人正相關。
云服務給應用開發者帶來了極大的便利,優化、備份等事情不再需要專業的DBA來實現,即買即用非常方便。對于云服務商來說,原來分散的那么多“業余”DBA可以集合成一位專業的大牛DBA,專業化分工帶來了效率的提升。這就是云服務的商業模式給提供者和使用者帶來的價值。由此應用開發者得以使用一大堆專業的數據庫來解決問題,而不再受限于技能只能選擇自己熟悉的MySQL等。數據庫的云化和專業化兩個進程是同步的。
DBaaS,這個詞匯在2015年進入了更多人的眼中。不僅是公有云的大廠們紛紛推出更多的數據庫云服務。就連一些互聯網大廠內部,也在普及自己的數據庫云服務。比如小米近期的分享中提及已經實現了MySQL和Redis的數據庫云化服務,通過RESTful的API為內部開發者快速提供數據庫的實例。一些專業提供PaaS的公司,例如MoPaaS、Pivotal等,也將數據庫服務作為首要為用戶提供的服務之一。
2016的期待
2015年數據庫業界尚未受到新硬件的沖擊,無論是超融合架構、3DFlash還是可持久化的內存,似乎離數據庫軟件都還有一截距離。但我們需要牢記摩爾定律的魅力(或者威力),牢記我們現在的數據庫軟件大多是為了30年前的硬件架構所設計的,他們中的大部分代碼比用他們的人的年紀還要長。硬件架構的革命性變化已經在眼前,隨著數據庫的專業化分工,原本耦合在一起的CPU、內存和外存已經不再適應多變的環境;機械式硬盤已經被電子盤所超越。一場血腥的創新數據庫服務提供商對傳統數據庫提供商的正在上演,未來就在眼前,讓我們拭目以待2016。
作者簡介:
何鴻凌,北京亞信智慧數據大數據平臺部總經理;曾任中國移動集團公司業務支撐系統部信息處副經理,高級工程師。工信部和人社部認證的高級程序員、系統分析師、網絡分析師,TDWI會員。
數據庫的多樣化
似乎在不久之前,業界還在爭論到底是通用的數據庫方向還是專業化的數據庫方向代表未來。前者的典型案例就是Oracle,從一開始Oracle的路線就是AllinOne,即使收購了TimesTen,仍然堅持將其中的技術合并到Oracle中提供一個內存存儲的選項。于是乎在Oracle最新版本中,內存選項成為了亮點。但是我們看到的明顯的現象是什么呢?
CSDN的最新調查顯示,已經有很大一部分比例的用戶在其應用中混合采用了多種數據庫解決方案。比如MongoDB和Redis獲得了相當比例的用戶。其實我覺得這個調查甚至沒有反映更明顯的趨勢,因為它是按照用戶數,而不是數據規模來的。相當比例的用戶在分析型數據庫領域采用了GreenPlum、Verica和Gbase8a等專業的MPP數據庫,而因為用戶群在調研范圍外,所以未體現在調查報告之中。
除了關系數據庫的兩種主要形式:OLAP、OLTP,非關系型數據庫的四種主要形式:文檔、健值對、圖和列式,以及科學數據庫中的矩陣式和生物數據庫之外,2015年在數據庫的類型上專業化的趨勢得到了大力的延展。比如時間序列數據庫異軍突起。OpenTSDB、Blueflood、kairosDB、influxDB均得到了長足的發展并嵌入到多個開源項目,其他一些數據庫也開始考慮增強對時序數據的存儲和訪問能力,比如RapidDB。又比如支持全球分布式事務的數據庫的發展。這得益于Google的論文提出了Spanner,一系列類似的數據庫陸續被提出來。最近最火的當屬TiDB,因為其創始人夠牛、開源模式夠帥。
毫無疑問,未來的發展趨勢是專業的數據庫支持專業的負載。這里負載既包括數據的存和取,也包括在數據庫內的查詢和處理邏輯。基因、地理信息、網絡、視頻、圖像,不同負載的數據庫(這里也許是廣義的“數據”)會變得越加專業。
專業化分工是推動人類社會發展的動力,但前提是這種專業化分工是可以達到規模效應的,這就引出了第二個看點。
數據庫的云化
反思一下為什么數據庫會出現專業化的潮流,或者說為什么在現在出現而不是十多年前。當年通用數據庫是一個多么響亮的招牌,數個863項目都與此相關。我認為主要的原因是隨著軟硬件和商業模式的發展,每一個專業化的數據庫方向都有了足夠規模,無論是“錢”上的規模還是“量”上的規模。
在CSDN2015軟件開發者白皮書中,有一個調查非常有趣:“2015年數據庫開發人員比去年大幅下降15%”。毫無疑問,數據庫的使用量一定是增加了。那么問題來了,這些人去哪兒了呢?如果有一份數據可以補充在這里,也許我們會發現,AWS和阿里的云數據庫的用量增加,與這些減少,不過現在數據庫本身在實現DBaaS方面還有很多的不足,原生考慮了DBaaS的數據庫系統目前只有Google系和阿里的OceanBase,其他無非是通過虛擬機或者容器的方式,實現一個數據庫實例的快速安裝和配置。真正要享受DBaaS帶來的專業化分工的好處,必須是在數據庫之上實現“虛擬化”,在數據庫內部實現良好的多租戶隔離、負載管理和計費等。在這方面現在大部分數據庫都需要進行重新設計。
如果數據庫的趨勢是以云服務的方式提供,那么應用開發者如果保證不被Lockin,存儲在云端數據庫的數據是否還是自己的呢?這個問題,就要靠下一個趨勢來解決。
數據庫的開源化
回過頭來看圖1,其中開源數據庫軟件的已經超過閉源數據庫軟件了。開源作為軟件業的一個趨勢,更加證明了賣軟件許可的商業模式是難以持續的,只有開源軟件+專業化服務的模式才是王道。

而這種專業化服務,如果以本地安裝服務的方式成本太高,難以為繼,最理想的方式就是云服務模式。無論是針對中小企業的公有云服務還是面向大型、超大型企業的私有云服務。
數據庫軟件本身的開源提供了信任,無論是國家之間的信任還是企業之間的信任。2015年,一款經典的、重型的MPP數據庫——GreenPlum已經開始了自己的開源之旅,從年初宣布此事,到第四季度正式將代碼放到GitHub上為止,業界一直保持了持續的關注。相關的Meetup和社區快速的成長起來,據我所了解,某大廠正在基于此緊密開發自己的MPPDBaaS服務的人正相關。
云服務給應用開發者帶來了極大的便利,優化、備份等事情不再需要專業的DBA來實現,即買即用非常方便。對于云服務商來說,原來分散的那么多“業余”DBA可以集合成一位專業的大牛DBA,專業化分工帶來了效率的提升。這就是云服務的商業模式給提供者和使用者帶來的價值。由此應用開發者得以使用一大堆專業的數據庫來解決問題,而不再受限于技能只能選擇自己熟悉的MySQL等。數據庫的云化和專業化兩個進程是同步的。
DBaaS,這個詞匯在2015年進入了更多人的眼中。不僅是公有云的大廠們紛紛推出更多的數據庫云服務。就連一些互聯網大廠內部,也在普及自己的數據庫云服務。比如小米近期的分享中提及已經實現了MySQL和Redis的數據庫云化服務,通過RESTful的API為內部開發者快速提供數據庫的實例。一些專業提供PaaS的公司,例如MoPaaS、Pivotal等,也將數據庫服務作為首要為用戶提供的服務之一。
2016的期待
2015年數據庫業界尚未受到新硬件的沖擊,無論是超融合架構、3DFlash還是可持久化的內存,似乎離數據庫軟件都還有一截距離。但我們需要牢記摩爾定律的魅力(或者威力),牢記我們現在的數據庫軟件大多是為了30年前的硬件架構所設計的,他們中的大部分代碼比用他們的人的年紀還要長。硬件架構的革命性變化已經在眼前,隨著數據庫的專業化分工,原本耦合在一起的CPU、內存和外存已經不再適應多變的環境;機械式硬盤已經被電子盤所超越。一場血腥的創新數據庫服務提供商對傳統數據庫提供商的正在上演,未來就在眼前,讓我們拭目以待2016。
作者簡介:
何鴻凌,北京亞信智慧數據大數據平臺部總經理;曾任中國移動集團公司業務支撐系統部信息處副經理,高級工程師。工信部和人社部認證的高級程序員、系統分析師、網絡分析師,TDWI會員。
分享到:
收藏
