最近,你不能談生意就談?wù)?ldquo;數(shù)據(jù)”,順便說一句,是最新的焦點從革命。革命分析,商業(yè)化開源R統(tǒng)計的語言, 強調(diào)擴大使用R超越其學(xué)術(shù)根業(yè)務(wù)。
周二,革命預(yù)計發(fā)布新增加big data analysis大的數(shù)據(jù)分析其革命R企業(yè)軟件。這是一個插件包稱為RevoScaleR,提供了一個框架,用于快速、高效的多核加工大型數(shù)據(jù)集。
據(jù)該公司介紹,新計劃將允許用戶進程、形象、模型terabyte-class數(shù)據(jù)集在幾秒鐘內(nèi),它利用許多流行的數(shù)據(jù)處理機和存儲機制,包括流行鞍韉.框架和無數(shù)的NoSQL數(shù)據(jù)庫,為復(fù)雜的統(tǒng)計分析。
介紹了包了許多新的特點,包括:
一個新二元'大數(shù)據(jù)的文件格式——XDF——一個界面,R語言提供高速接入任意行街,字段的數(shù)據(jù)
收藏的最常見的統(tǒng)計算法優(yōu)化大型數(shù)據(jù),包括高性能實現(xiàn)的總結(jié)統(tǒng)計、線性回歸、二項式邏輯回歸模型,并數(shù)據(jù)的讀取和轉(zhuǎn)化工具來準(zhǔn)備大數(shù)據(jù)集進行分析
在談話中,革命與CNET引用使用案例涉及處理超過13的數(shù)據(jù),詳細(xì)的聯(lián)邦航空局(GB),每個商業(yè)航班在1987和2008年到來。在過去,分析這么大的數(shù)據(jù)集會輕而易舉,可以向上的12個小時;相同的數(shù)據(jù),分析了不到1秒。