西西軟件園多重安全檢測(cè)下載網(wǎng)站、值得信賴的軟件下載站!
西西首頁(yè) 電腦軟件 安卓軟件 電腦游戲 安卓游戲 排行榜 專(zhuān)題合集

Weka漢化版

v3.7.12 官方最新版
  • Weka漢化版v3.7.12 官方最新版
  • 軟件大小:60.4M
  • 更新時(shí)間:2016-03-17 11:17
  • 軟件語(yǔ)言:中文
  • 軟件廠商:
  • 軟件類(lèi)別:國(guó)產(chǎn)軟件 / 免費(fèi)軟件 / 數(shù)據(jù)庫(kù)類(lèi)
  • 軟件等級(jí):4級(jí)
  • 應(yīng)用平臺(tái):WinAll
  • 官方網(wǎng)站:http://elephantinaurance.com
  • 應(yīng)用備案:
好評(píng):50%
壞評(píng):50%

軟件介紹

Weka漢化版全名為懷卡托智能分析環(huán)境,這款軟件的一款集數(shù)據(jù)預(yù)處理、學(xué)習(xí)算法(分類(lèi)、回歸、聚類(lèi)、關(guān)聯(lián)分析)和評(píng)估方法等為一體的綜合性數(shù)據(jù)挖掘工具。具有交互式可視化界面,提供算法學(xué)習(xí)比較環(huán)境 通過(guò)其接口,可實(shí)現(xiàn)自己的數(shù)據(jù)挖掘算法。

漢化版說(shuō)明:

在第2版weka中文版的 基礎(chǔ)上制作了第3版,暫定版本v0.3。將guichooser漢化完成?紤]到大家還是習(xí)慣使用guichooser作為默認(rèn)啟動(dòng)界面,將RunWeka.ini中的設(shè)置恢復(fù)默認(rèn)。但是為了支持中文,其中的編碼選項(xiàng)從cp1252改為utf-8,各位同學(xué)制作數(shù)據(jù)文件的時(shí)候可以保存為utf-8編碼。也可以自行去修改根目錄下的RunWeka.ini。

如果對(duì)翻譯不滿意,請(qǐng)告知于我,我們共同努力。

本次只發(fā)布了64位的版本,包含64位jre,在根目錄下的jre目錄,需要的可以自行安裝。解壓縮到任意目錄后,運(yùn)行RunWeka.bat就可以了。當(dāng)然也有快捷方式可以用,但圖標(biāo)因?yàn)槁窂絾?wèn)題需要你自己重新設(shè)定一下。理論上將根目錄下的weka.jar提取出來(lái)覆蓋你之前安裝好的weka目錄中的weka.jar,即可實(shí)現(xiàn)weka漢化,32位和64位都可以用,但前提是你安裝的weka版本要是3.7.12。最好事先備份好你的weka.jar文件,出現(xiàn)問(wèn)題可以恢復(fù)。

軟件教程:

WEKA文件相關(guān)術(shù)語(yǔ)

表格里的一個(gè)橫行稱(chēng)作一個(gè)實(shí)例(Instance),相當(dāng)于統(tǒng)計(jì)學(xué)中的一個(gè)樣本,或者數(shù)據(jù)庫(kù)中的一條記錄。豎行稱(chēng)作一個(gè)屬性(Attribute),相當(dāng)于統(tǒng)計(jì)學(xué)中的一個(gè)變量,或者數(shù)據(jù)庫(kù)中的一個(gè)字段。這樣一個(gè)表格,或者叫數(shù)據(jù)集,在WEKA看來(lái),呈現(xiàn)了屬性之間的一種關(guān)系(Relation)。上圖中一共有14個(gè)實(shí)例,5個(gè)屬性,關(guān)系名稱(chēng)為“weather”。

WEKA存儲(chǔ)數(shù)據(jù)的格式是ARFF(Attribute-Relation File Format)文件,這是一種ASCII文本文件。上圖所示的二維表格存儲(chǔ)在如下的ARFF文件中。這也就是WEKA自帶的“weather.arff”文件,在WEKA安裝目錄的“data”子目錄下可以找到。

文件內(nèi)容說(shuō)明

識(shí)別ARFF文件的重要依據(jù)是分行,因此不能在這種文件里隨意的斷行?招校ɑ蛉强崭竦男校⿲⒈缓雎。以“%”開(kāi)始的行是注釋?zhuān)琖EKA將忽略這些行。如果你看到的“weather.arff”文件多了或少了些“%”開(kāi)始的行,是沒(méi)有影響的。

除去注釋后,整個(gè)ARFF文件可以分為兩個(gè)部分。

第一部分給出了頭信息(Head information),包括了對(duì)關(guān)系的聲明和對(duì)屬性的聲明。

第二部分給出了數(shù)據(jù)信息(Data information),即數(shù)據(jù)集中給出的數(shù)據(jù)。從“@data”標(biāo)記開(kāi)始,后面的就是數(shù)據(jù)信息了。

關(guān)系聲明

關(guān)系名稱(chēng)在ARFF文件的第一個(gè)有效行來(lái)定義,格式為@relation <relation-name> 

<relation-name>是一個(gè)字符串。如果這個(gè)字符串包含空格,它必須加上引號(hào)(指英文標(biāo)點(diǎn)的單引號(hào)或雙引號(hào))。

屬性聲明

屬性聲明用一列以“@attribute”開(kāi)頭的語(yǔ)句表示。數(shù)據(jù)集中的每一個(gè)屬性都有它對(duì)應(yīng)的“@attribute”語(yǔ)句,來(lái)定義它的屬性名稱(chēng)和數(shù)據(jù)類(lèi)型。

這些聲明語(yǔ)句的順序很重要。首先它表明了該項(xiàng)屬性在數(shù)據(jù)部分的位置。例如,“humidity”是第三個(gè)被聲明的屬性,這說(shuō)明數(shù)據(jù)部分那些被逗號(hào)分開(kāi)的列中,第三列數(shù)據(jù)85 90 86 96 ... 是相應(yīng)的“humidity”值。其次,最后一個(gè)聲明的屬性被稱(chēng)作class屬性,在分類(lèi)或回歸任務(wù)中,它是默認(rèn)的目標(biāo)變量。屬性聲明的格式為

@attribute <attribute-name> <datatype> 

其中<attribute-name>是必須以字母開(kāi)頭的字符串。和關(guān)系名稱(chēng)一樣,如果這個(gè)字符串包含空格,它必須加上引號(hào)。

數(shù)值屬性

數(shù)值型屬性可以是整數(shù)或者實(shí)數(shù),但WEKA把它們都當(dāng)作實(shí)數(shù)看待。

標(biāo)稱(chēng)屬性

標(biāo)稱(chēng)屬性由<nominal-specification>列出一系列可能的類(lèi)別名稱(chēng)并放在花括號(hào)中:{<nominal-name1>, <nominal-name2>, 

<nominal-name3>, ...} 。數(shù)據(jù)集中該屬性的值只能是其中一種類(lèi)別。

例如如下的屬性聲明說(shuō)明“outlook”屬性有三種類(lèi)別:“sunny”,“overcast”和“rainy”。而數(shù)據(jù)集中每個(gè)實(shí)例對(duì)應(yīng)的“outlook”值必是這三者之一。

@attribute outlook {sunny, overcast, rainy} 

如果類(lèi)別名稱(chēng)帶有空格,仍需要將之放入引號(hào)中。

其他版本下載

發(fā)表評(píng)論

昵稱(chēng):
表情: 高興 可 汗 我不要 害羞 好 下下下 送花 屎 親親
查看所有(0)條評(píng)論 > 字?jǐn)?shù): 0/500

TOP
軟件下載