Java程序員在用的大數(shù)據(jù)工具,MongoDB穩(wěn)居第一
2016-01-30 18:13:19 來源: mengyidan1988 評論:0 點(diǎn)擊:
據(jù)日前的一則大數(shù)據(jù)工具使用情況調(diào)查,我們知道了Java程序猿最喜歡用的大數(shù)據(jù)工具。 問題:他們最近一年最喜歡用什么工具或者是框架? 受訪者可以選擇列表中的選項或者列出自己的,本文主要關(guān)心的是大數(shù)據(jù)工具。上一篇Java調(diào)查包括下列內(nèi)容: 開發(fā)語言 Web框架 應(yīng)用服務(wù)器 數(shù)據(jù)庫工具 SQL數(shù)據(jù) 大數(shù)據(jù) 開發(fā)工具 云供應(yīng)商 現(xiàn)在,來看看維基百科上對
據(jù)日前的一則大數(shù)據(jù)工具使用情況調(diào)查,我們知道了Java程序猿最喜歡用的大數(shù)據(jù)工具。
問題:他們最近一年最喜歡用什么工具或者是框架?
受訪者可以選擇列表中的選項或者列出自己的,本文主要關(guān)心的是大數(shù)據(jù)工具。上一篇Java調(diào)查包括下列內(nèi)容:
現(xiàn)在,來看看維基百科上對大數(shù)據(jù)的定義:
對于一般情況來說傳統(tǒng)的SQL數(shù)據(jù)庫足夠用。再另外一些場景下,傳統(tǒng)的數(shù)據(jù)庫能夠承載的數(shù)據(jù)庫量級有限,并且現(xiàn)在有了越來越多的工具可供使用。關(guān)鍵取決于場景。
現(xiàn)在讓我們來討論不同的非SQL工具來存儲/處理數(shù)據(jù) - NoSQL數(shù)據(jù)庫、內(nèi)存緩存、全文搜索引擎、實(shí)時流媒體、圖形數(shù)據(jù)庫等。
大數(shù)據(jù)-調(diào)查結(jié)果

原文地址:What Big Data Tools Do Java Developers Use?(譯者/袁璞 審校/朱正貴 責(zé)編/仲浩)
譯者介紹:圣特爾?E店寶大數(shù)據(jù)架構(gòu)師,關(guān)注高性能或可用架構(gòu)、大數(shù)據(jù)技術(shù)、機(jī)器學(xué)習(xí)。
問題:他們最近一年最喜歡用什么工具或者是框架?
受訪者可以選擇列表中的選項或者列出自己的,本文主要關(guān)心的是大數(shù)據(jù)工具。上一篇Java調(diào)查包括下列內(nèi)容:
- 開發(fā)語言
- Web框架
- 應(yīng)用服務(wù)器
- 數(shù)據(jù)庫工具
- SQL數(shù)據(jù)
- 大數(shù)據(jù)
- 開發(fā)工具
- 云供應(yīng)商
現(xiàn)在,來看看維基百科上對大數(shù)據(jù)的定義:
引用
大數(shù)據(jù),廣義上來說是一組量很大很復(fù)雜的數(shù)據(jù)集合,在這種情況下傳統(tǒng)的數(shù)據(jù)處理方式將不再適用。
對于一般情況來說傳統(tǒng)的SQL數(shù)據(jù)庫足夠用。再另外一些場景下,傳統(tǒng)的數(shù)據(jù)庫能夠承載的數(shù)據(jù)庫量級有限,并且現(xiàn)在有了越來越多的工具可供使用。關(guān)鍵取決于場景。
現(xiàn)在讓我們來討論不同的非SQL工具來存儲/處理數(shù)據(jù) - NoSQL數(shù)據(jù)庫、內(nèi)存緩存、全文搜索引擎、實(shí)時流媒體、圖形數(shù)據(jù)庫等。
大數(shù)據(jù)-調(diào)查結(jié)果

- MongoDB-一種非常流行的、跨平臺、面向document的數(shù)據(jù)庫。
- Elasticsearch-專為云計算設(shè)計的分布式REST風(fēng)格的搜索引擎。
- Cassandra-一個開源的分布式數(shù)據(jù)庫管理系統(tǒng)。最初是Facebook設(shè)計和開發(fā)的,部署在大量商用服務(wù)器上來處理大量的數(shù)據(jù)。高可用,無單點(diǎn)故障。
- Redis-開源的(BSD)內(nèi)存數(shù)據(jù)結(jié)構(gòu)存儲、內(nèi)存庫、緩存、消息代理。
- Hazelcast-基于Java開發(fā)的內(nèi)存數(shù)據(jù)網(wǎng)格。
- EHCache-廣泛使用的開源Java分布式緩存、J2ee、輕量級容器。
- Hadoop-用java開發(fā)的開源分布式大數(shù)據(jù)框架,用來處理非常大規(guī)模數(shù)據(jù),hadoop是集群化部署。
- Solr-使用java開發(fā)的開源企業(yè)級搜索平臺。最初歸屬在Apache Lucene項目中。
- Spark-ASF中最活躍的項目,是一個開源的集群化計算框架。
- Memcached–通用分布式緩存系統(tǒng)。
- Apache Hive-在Hadoop支持類SQL封裝,將SQL語句變成mr程序來執(zhí)行。
- Apache Kafka–高吞吐量、分布式、消息發(fā)布-訂閱系統(tǒng),最早是Linkin開發(fā)的。
- Akka–Java開發(fā)的用來建造高并發(fā),基于jvm彈性消息驅(qū)動的應(yīng)用。
- Hbase-根據(jù)Google的BigTable論文開發(fā)的開源分布式非關(guān)系型數(shù)據(jù)庫。開發(fā)語言是Java,用HDFS作為底層存儲。
- Neo4j–用Java實(shí)現(xiàn)的開源圖形數(shù)據(jù)庫。
- CouchBase–面向Document的開源分布式NoSQL數(shù)據(jù)庫,并且針對交互應(yīng)用做過優(yōu)化。
- Apache Storm–開源分布式實(shí)時計算系統(tǒng)。
- CouchDB–使用json來存儲數(shù)據(jù)的開放源碼面向文檔的NoSQL數(shù)據(jù)庫。
- Oracle Coherence–內(nèi)存數(shù)據(jù)網(wǎng)格解決方案,使企業(yè)通過提供快速訪問熱數(shù)據(jù)來預(yù)測關(guān)鍵任務(wù)應(yīng)用的規(guī)模。
- Titan–可擴(kuò)展的圖形數(shù)據(jù)庫,針對集群存儲和查詢數(shù)千億的圖形數(shù)據(jù)做過優(yōu)化。
- 亞馬遜 DynamoDB – 一個快速、靈活NoSQL數(shù)據(jù)庫,能夠應(yīng)對所有規(guī)模應(yīng)用程序的需求,包括持久化、毫秒級延遲。
- Amazon Kinesis–AWS上的實(shí)時數(shù)據(jù)計算平臺。
- Datomic–提供完整事務(wù)支持,云計算,分布式的數(shù)據(jù)庫,開發(fā)語言用Clojure。
原文地址:What Big Data Tools Do Java Developers Use?(譯者/袁璞 審校/朱正貴 責(zé)編/仲浩)
譯者介紹:圣特爾?E店寶大數(shù)據(jù)架構(gòu)師,關(guān)注高性能或可用架構(gòu)、大數(shù)據(jù)技術(shù)、機(jī)器學(xué)習(xí)。
相關(guān)熱詞搜索:java mongodb nosql cassandra hadoop language 編程語言
上一篇:衡量企業(yè)應(yīng)用數(shù)據(jù)庫性能的6大指標(biāo)
下一篇:甲骨文計劃淘汰Java瀏覽器插件
分享到:
收藏

頻道總排行
- Cisco NetFlow v9為何無人問津?
- 技術(shù)專題:智能化運(yùn)維
- 開源代碼管理:如何安全地使用開源庫?
- Facebook架構(gòu)解讀
- IT運(yùn)維分析與海量日志搜索需要注意什么(1)
- 金山運(yùn)維肖力:如何將業(yè)務(wù)遷移到虛擬化環(huán)境并穩(wěn)定運(yùn)行(1)
- Apache Ignite(四):基于Ignite的分布式ID生成器
- CrazyEye,一款國人開源的堡壘機(jī)軟件(1)
- SDN時代的網(wǎng)絡(luò)管理系統(tǒng)會走向何方
- WOT2016吳兆松:Zabbix監(jiān)控自動化的未來如何發(fā)展
頻道本月排行
- 8你消費(fèi)我買單——"漏洞"天使OneRASP...
- 7有了Jenkins,為什么還需要一個獨(dú)立...
- 6IT運(yùn)維分析與海量日志搜索需要注意什么(1)
- 5新浪微博王傳鵬:微博推薦架構(gòu)的演進(jìn)(1)
- 4史上最大機(jī)器學(xué)習(xí)數(shù)據(jù)集,雅虎對外開...
- 4雅虎開源可以提升流操作速度的DataSketches
- 4大眾點(diǎn)評高可用性系統(tǒng)運(yùn)維經(jīng)驗分享
- 4云運(yùn)維如何選擇部署適合自身的IDC和...
- 4開源還是商用?十大云運(yùn)維監(jiān)控工具測...
- 4論開發(fā)與運(yùn)維沖突的根源、表現(xiàn)形式及...