日前,Strata+HadoopWorld2016大會在紐約舉行。許多業(yè)界人士參加了這個活動。行業(yè)專家通過此次大會了解到Hadoop市場日趨成熟,大數(shù)據(jù)應(yīng)用日益增長。
行業(yè)專家的研究表明,大數(shù)據(jù)可以帶來巨大的商業(yè)利益。在大數(shù)據(jù)和分析基準研究中,超過四分之三(78%)的參與者表示,預(yù)測分析是其組織采用大數(shù)據(jù)分析最重要的領(lǐng)域。在這個預(yù)測分析研究中,幾乎三分之二(57%)的組織表示他們通過應(yīng)用高級分析獲得了競爭優(yōu)勢。
因此,人們正在超越技術(shù)采用生命周期的早期采用階段。越來越多的組織認識到大數(shù)據(jù)和高級分析可以提供競爭優(yōu)勢。因此,人們更多關(guān)注的是其商業(yè)價值,而不僅僅是追求這個優(yōu)勢所需的技術(shù)。
在Strata+Hadoop世界主題演講上,許多供應(yīng)商選擇將他們的客戶帶到會場上或分享他們的客戶如何利用大數(shù)據(jù)技術(shù)對組織產(chǎn)生積極影響的故事。還有大量的技術(shù)培訓(xùn)課程,而在主題演講之前還進行了為期兩天的培訓(xùn),但活動的主要階段集中在可以用大數(shù)據(jù)做什么,而不是如何做。與會者似乎也將重點放在活動上。
多家供應(yīng)商參加了今年早些時候在圣荷西舉辦的Strata+Hadoop活動。他們都表示相比以前的活動,更多的是與業(yè)務(wù)重點的客戶互動。人們開始尋找將大數(shù)據(jù)技術(shù)應(yīng)用于實際業(yè)務(wù)需求的方法。
這不是說在活動中沒有交流和溝通技術(shù)話題,其中包括數(shù)據(jù)科學(xué),流數(shù)據(jù)和數(shù)據(jù)準備和治理。還提供了有關(guān)各種數(shù)據(jù)科學(xué)主題的教程,包括如何在編程語言(如Python和Spark)中實現(xiàn)機器學(xué)習(xí)。而這個研究表明,Python是數(shù)據(jù)科學(xué)分析中最受歡迎的語言之一,超過三分之一(36%)的組織使用它。Spark作為提供大數(shù)據(jù),機器學(xué)習(xí)和實時功能的方式越來越受歡迎。至少有六家知名的供應(yīng)商參加了展會,宣傳他們的數(shù)據(jù)科學(xué)能力,許多其他供應(yīng)商的營銷材料描述了他們?nèi)绾沃С謹?shù)據(jù)科學(xué),例如使用支持數(shù)據(jù)科學(xué)過程的數(shù)據(jù)準備工具。
實時處理流數(shù)據(jù)也是一個常見的主題。大數(shù)據(jù)的大部分都是流數(shù)據(jù)不斷生成的。因此,用戶可能會在生成數(shù)據(jù)時實時分析數(shù)據(jù),從而獲得價值。在這個研究中,實時分析是預(yù)測分析后第二大數(shù)據(jù)分析領(lǐng)域(54%)。在其原始形式中,Hadoop被設(shè)計為一個批處理系統(tǒng),但隨著其流行度越來越高,已經(jīng)向Hadoop生態(tài)系統(tǒng)添加了實時功能。
數(shù)據(jù)準備和治理的主題并不令人驚訝。通過大數(shù)據(jù)集成基準研究表明,審查質(zhì)量和一致性問題(52%)和準備數(shù)據(jù)(46%)的數(shù)據(jù)被認為是大數(shù)據(jù)集成過程中最耗時的兩個方面。同樣,這個大數(shù)據(jù)分析研究表明,39%的組織認為數(shù)據(jù)質(zhì)量和信息管理是大數(shù)據(jù)分析的第二大障礙。供應(yīng)商和大數(shù)據(jù)的技術(shù)社區(qū)正在試圖解決這些問題。
如今,大數(shù)據(jù)社區(qū)不斷發(fā)展,Strata+Hadoop世界活動正在幫助廠商與用戶促進對話,教育和增長。這個最近的事件是大數(shù)據(jù)社區(qū) 成長 的表現(xiàn),意味著重點已經(jīng)轉(zhuǎn)移到提供業(yè)務(wù)價值。Strata+HadoopWorld不僅讓業(yè)界人士可以了解大數(shù)據(jù)技術(shù),還可以了解如何解決業(yè)務(wù)問題。
編輯:Harris