領英宣布開源數據挖掘軟件WhereHows
2016-03-07 14:49:11 來源: mengyidan1988 評論:0 點擊:
領英稱即將開源他們內部的應用軟件WhereHows,一個企業級的數據挖掘軟件。 準確的說,領英稱它為“數據發現軟件”。從商業角度講,WhereHows的目標是從分布式的多種元數據中進行挖掘。 據領英發布的資料顯示,WhereHows已經挖掘了50,000條數據集,14,000條評論和35,000,000個工作機會,多達15PB的數據。 在一篇博客中,領英解釋了創造WhereHows的原因:建造一個數
領英稱即將開源他們內部的應用軟件WhereHows,一個企業級的數據挖掘軟件。
準確的說,領英稱它為“數據發現軟件”。從商業角度講,WhereHows的目標是從分布式的多種元數據中進行挖掘。
據領英發布的資料顯示,WhereHows已經挖掘了50,000條數據集,14,000條評論和35,000,000個工作機會,多達15PB的數據。
在一篇博客中,領英解釋了創造WhereHows的原因:建造一個數據生態,適配各種程序,專注一項工作。因為領英有各種各樣形式的數據,從Informatic到Spark,到Oracle,再到Hadoop、Teradate等。領英稱:
企業需要將數據聯系起來。領英也有專業的數據倉庫團隊,但問題是,隨著系統的家里,數據的空間激增。

很多企業有相同的問題,領英有Hadoop,多種數據庫,Teradata和各種應用程序。有了WhereHows,這些數據都可以移動到同一個地方。這個項目完成之后,將是很大一筆財產。
領英的想法是,希望開源社區能夠做些貢獻,比如解決bug,增加特性之類的。
準確的說,領英稱它為“數據發現軟件”。從商業角度講,WhereHows的目標是從分布式的多種元數據中進行挖掘。
據領英發布的資料顯示,WhereHows已經挖掘了50,000條數據集,14,000條評論和35,000,000個工作機會,多達15PB的數據。
在一篇博客中,領英解釋了創造WhereHows的原因:建造一個數據生態,適配各種程序,專注一項工作。因為領英有各種各樣形式的數據,從Informatic到Spark,到Oracle,再到Hadoop、Teradate等。領英稱:
引用
領英積累了大量的數據,形式多種多樣。對于不同的業務我們有不同的方案,而對于不同的方案我們有不同的驅動。這種專業化的解決方案很棒,因為它能讓我們在各方面都用上最好的工具,但是,這也帶來了問題。從這些不同的平臺、框架、系統中總覽所有數據非常困難。這將造成生產力方面的損失,我們的員工需要花多余的時間來尋找合適的數據集,同時也失去了對數據總體的理解。
企業需要將數據聯系起來。領英也有專業的數據倉庫團隊,但問題是,隨著系統的家里,數據的空間激增。

很多企業有相同的問題,領英有Hadoop,多種數據庫,Teradata和各種應用程序。有了WhereHows,這些數據都可以移動到同一個地方。這個項目完成之后,將是很大一筆財產。
領英的想法是,希望開源社區能夠做些貢獻,比如解決bug,增加特性之類的。
相關熱詞搜索:數據挖掘 WhereHows 人工智能 opensource 開源軟件
分享到:
收藏
