八爪魚網(wǎng)頁(yè)數(shù)據(jù)采集器,是一款使用簡(jiǎn)單、功能強(qiáng)大的網(wǎng)絡(luò)爬蟲工具,完全可視化操作,無(wú)需編寫代碼,內(nèi)置海量模板,支持任意網(wǎng)絡(luò)數(shù)據(jù)抓取,連續(xù)四年大數(shù)據(jù)行業(yè)數(shù)據(jù)采集領(lǐng)域排名第一。有需要的小伙伴歡迎來(lái)西西下載體驗(yàn)。
關(guān)于公司:
深圳視界信息技術(shù)有限公司,是一家以打造大數(shù)據(jù)平臺(tái)為目標(biāo),致力于提供大數(shù)據(jù)軟件與行業(yè)解決方案的國(guó)家高新企業(yè)。公司旗下有2個(gè)品牌:八爪魚大數(shù)據(jù)采集平臺(tái)、云聽CEM客戶管理體驗(yàn)平臺(tái)。 八爪魚大數(shù)據(jù)采集平臺(tái)是深圳視界信息技術(shù)有限公司自主研發(fā),整合了網(wǎng)頁(yè)數(shù)據(jù)采集、移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù)及API接口服務(wù)(包括數(shù)據(jù)爬蟲、數(shù)據(jù)優(yōu)化、數(shù)據(jù)挖掘、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)備份)等服務(wù)為一體的數(shù)據(jù)服務(wù)平臺(tái),連續(xù)4年蟬聯(lián)互聯(lián)網(wǎng)數(shù)據(jù)采集軟件榜單第一名。自2016年,八爪魚積極開拓海外市場(chǎng),分別在美國(guó)、日本推出了數(shù)據(jù)爬蟲平臺(tái)Octopus和Octopus.JP。截止2018年,八爪魚全球用戶突破110萬(wàn)。 云聽CEM客戶管理體驗(yàn)平臺(tái)是深圳視界信息技術(shù)有限公司經(jīng)過(guò)多年不斷夯實(shí)自身數(shù)據(jù)處理能力以及在豐厚數(shù)據(jù)資產(chǎn)積累的基礎(chǔ)上,推出的AI數(shù)據(jù)服務(wù)新產(chǎn)品。云聽CEM通過(guò)AI自然語(yǔ)言分析技術(shù)幫助國(guó)內(nèi)知名消費(fèi)品牌打造客戶體驗(yàn)管理全流程,覆蓋各大電商平臺(tái)、微博、知乎等主流發(fā)聲平臺(tái),獲取用戶一手?jǐn)?shù)據(jù)與反饋,提高了品牌企業(yè)運(yùn)營(yíng)效率,有效拉近了品牌與用戶的距離。
公司創(chuàng)始人兼CEO劉寶強(qiáng)先生,畢業(yè)于國(guó)防科技大學(xué),曾任職于morningstar(晨星資訊),負(fù)責(zé)morningstar(晨星資訊)國(guó)際金融大數(shù)據(jù)的收集和分析平臺(tái)。
軟件特色:
操作簡(jiǎn)單,完全可視化圖形操作,無(wú)需專業(yè)IT人員,任何會(huì)使用電腦上網(wǎng)的人都可以輕松掌握。
云采集
采集任務(wù)自動(dòng)分配到云端多臺(tái)服務(wù)器同時(shí)執(zhí)行,提高采集效率,可以很短的時(shí)間內(nèi) 獲取成千上萬(wàn)條信息。
拖拽式采集流程
模擬人的操作思維模式,可以登陸,輸入數(shù)據(jù),點(diǎn)擊鏈接,按鈕等,還能對(duì)不同情況采取不同的采集流程。
圖文識(shí)別
內(nèi)置可擴(kuò)展的OCR接口,支持解析圖片中的文字,可將圖片上的文字提取出來(lái)。
定時(shí)自動(dòng)采集
采集任務(wù)自動(dòng)運(yùn)行,可以按照指定的周期自動(dòng)采集,并且還支持最快一分鐘一次的實(shí)時(shí)采集。
2分鐘快速入門
內(nèi)置從入門到精通所需要的視頻教程,2分鐘就能上手使用,另外還有文檔,論壇,qq群等。
免費(fèi)使用
它是免費(fèi)的,并且免費(fèi)版本沒有任何功能限制,你現(xiàn)在就可以試一試,立即下載安裝。
軟件功能:
簡(jiǎn)單來(lái)講,使用八爪魚可以非常容易的從任何網(wǎng)頁(yè)精確采集你需要的數(shù)據(jù),生成自定義的、規(guī)整的數(shù)據(jù)格式。八爪魚數(shù)據(jù)采集系統(tǒng)能做的包括但并不局限于以下內(nèi)容:
1. 金融數(shù)據(jù),如季報(bào),年報(bào),財(cái)務(wù)報(bào)告, 包括每日最新凈值自動(dòng)采集;
2. 各大新聞門戶網(wǎng)站實(shí)時(shí)監(jiān)控,自動(dòng)更新及上傳最新發(fā)布的新聞;
3. 監(jiān)控競(jìng)爭(zhēng)對(duì)手最新信息,包括商品價(jià)格及庫(kù)存;
4. 監(jiān)控各大社交網(wǎng)站,博客,自動(dòng)抓取企業(yè)產(chǎn)品的相關(guān)評(píng)論;
5. 收集最新最全的職場(chǎng)招聘信息;
6. 監(jiān)控各大地產(chǎn)相關(guān)網(wǎng)站,采集新房二手房最新行情;
7. 采集各大汽車網(wǎng)站具體的新車二手車信息;
8. 發(fā)現(xiàn)和收集潛在客戶信息;
9. 采集行業(yè)網(wǎng)站的產(chǎn)品目錄及產(chǎn)品信息;
10. 在各大電商平臺(tái)之間同步商品信息,做到在一個(gè)平臺(tái)發(fā)布,其他平臺(tái)自動(dòng)更新。
使用方法:
先我們新建一個(gè)任務(wù)-->進(jìn)入流程設(shè)計(jì)頁(yè)面-->添加一個(gè)循環(huán)步驟到流程中-->選中循環(huán)步驟-->勾選上軟件右方的URL 列表勾選框-->打開URL列表文本框-->將準(zhǔn)備好的URL列表填寫到文本框中
接下來(lái)往循環(huán)中拖入一個(gè)打開網(wǎng)頁(yè)的步驟-->選中打開網(wǎng)頁(yè)步驟-->勾選上使用當(dāng)前循環(huán)里的URL作為導(dǎo)航地址-->點(diǎn)擊保存。系統(tǒng)會(huì)在界面下方的瀏覽器中打開循環(huán)中選中的URL對(duì)應(yīng)的網(wǎng)頁(yè)
到這里,循環(huán)打開網(wǎng)頁(yè)的流程就配置完成了,運(yùn)行流程的時(shí)候,系統(tǒng)會(huì)逐個(gè)的打開循環(huán)中設(shè)置的URL。最后我們不需要配置一個(gè)采集數(shù)據(jù)的步驟,這里就不在多講,大家可以參考從入門到精通系列1:采集單個(gè)網(wǎng)頁(yè) 這篇文章。下圖就是最終和流程
下面是流程最終的運(yùn)行結(jié)果
更新日志:
V8.0.4(正式) 2019-10-24
主要體驗(yàn)改進(jìn) 全新的8.0有哪些改進(jìn)?
更好的操作體驗(yàn):全新軟件設(shè)計(jì)架構(gòu),更穩(wěn)定,更流暢,解決卡慢問(wèn)題
更高的網(wǎng)站兼容性:?內(nèi)置瀏覽器內(nèi)核更新為Chrome,網(wǎng)頁(yè)兼容性更強(qiáng)
更快的采集速度:「本地采集」速度明顯提升
更簡(jiǎn)潔的UI交互:界面更簡(jiǎn)潔、邏輯更清晰