爬山虎采集器是一款優(yōu)秀的網(wǎng)頁采集工具。軟件最大優(yōu)勢就是智能分析,可視化界面,無需學(xué)習(xí)編程,點(diǎn)擊式界面,自動生成采集腳本,可以采集互聯(lián)網(wǎng)99%的網(wǎng)站。有需要的小伙伴歡迎來西西下載體驗(yàn)。
軟件特色:
適用各種網(wǎng)站
能夠采集互聯(lián)網(wǎng)99%的網(wǎng)站,包括單頁應(yīng)用Ajax加載等等動態(tài)類型網(wǎng)站
一鍵提取數(shù)據(jù)
簡單易學(xué),通過可視化界面,鼠標(biāo)點(diǎn)擊即可抓取數(shù)據(jù)
快速高效
內(nèi)置一套高速瀏覽器內(nèi)核,加上HTTP引擎模式,實(shí)現(xiàn)快速采集數(shù)據(jù)
軟件功能:
獨(dú)創(chuàng)高速內(nèi)核
自研的瀏覽器內(nèi)核,速度飛快,遠(yuǎn)超對手
智能識別
對于網(wǎng)頁中的列表、表單結(jié)構(gòu)(多選框下拉列表等)能夠智能識別
向?qū)J?/p>
簡單易用,輕松通過鼠標(biāo)點(diǎn)擊自動生成
腳本定時運(yùn)行
可按照計(jì)劃定時運(yùn)行,無需人工
廣告屏蔽
定制的廣告屏蔽模塊,兼容AdblockPlus語法,可添加自定義規(guī)則
多種數(shù)據(jù)導(dǎo)出
支持Txt 、Excel、MySQL、SQLServer、SQlite、Access、網(wǎng)站等
使用方法:
第一步:輸入采集網(wǎng)址
打開軟件,新建任務(wù),輸入需要采集的網(wǎng)站地址。
第二步:智能分析,全程自動化提取數(shù)據(jù)
進(jìn)入到第二步后,爬山虎采集器全自動智能分析網(wǎng)頁,并且從中提取出列表數(shù)據(jù)。
第三步:導(dǎo)出數(shù)據(jù)到表格、數(shù)據(jù)庫、網(wǎng)站等
運(yùn)行任務(wù),將采集到的數(shù)據(jù)導(dǎo)出為Csv、Excel以及各種數(shù)據(jù)庫,支持api導(dǎo)出。
安裝說明:
打開爬山虎采集器下載頁http://elephantinaurance.com
點(diǎn)擊下載安裝程序。
下載完成后,直接運(yùn)行安裝程序 PashanhuV2Setup.exe。
然后一直點(diǎn)擊下一步,直到完成。
安裝完成后,可以看到爬山虎采集器V2的主界面
更新日志:
優(yōu)化網(wǎng)頁表格數(shù)據(jù)的識別,可按照表格列名自動命名字段
優(yōu)化時間提取
修復(fù)當(dāng)有自定義字段,沒有匹配到不保存數(shù)據(jù)的問題
添加時間戳變量
計(jì)劃任務(wù),每間隔分鐘增加開始秒