風(fēng)越大量文本提取收羅器功能特色說(shuō)明:
大量提取HTML/DOC/RTF/TXT等文檔中的文本資訊。支撐從別的網(wǎng)站直接提取文本內(nèi)容,生成所需數(shù)據(jù)庫(kù)文檔支撐GB2312/UTF-8多種編碼可將提取資訊生成文本文檔、HTM網(wǎng)頁(yè)文檔、MDB數(shù)據(jù)庫(kù)文檔。提供多種查詢(xún)、獵取資訊的方法:提取文檔中全部email郵件地點(diǎn)提取文檔中全部互聯(lián)網(wǎng)址(無(wú)參數(shù))提取文檔中全部互聯(lián)網(wǎng)址(帶參數(shù))提取HTML文檔中body的文本內(nèi)容提取HTML文檔中title與body的文本內(nèi)容提取HTML文檔中textarea的文本內(nèi)容提取HTML網(wǎng)頁(yè)的顯示文本內(nèi)容提取DOC/RTF等文...