八爪魚網(wǎng)頁數(shù)據(jù)采集器,是一款使用簡單、功能強(qiáng)大的網(wǎng)絡(luò)爬蟲工具,完全可視化操作,無需編寫代碼,內(nèi)置海量模板,支持任意網(wǎng)絡(luò)數(shù)據(jù)抓取,連續(xù)四年大數(shù)據(jù)行業(yè)數(shù)據(jù)采集領(lǐng)域排名第一。有需要的小伙伴歡迎來西西下載體驗(yàn)。
關(guān)于公司:
深圳視界信息技術(shù)有限公司,是一家以打造大數(shù)據(jù)平臺為目標(biāo),致力于提供大數(shù)據(jù)軟件與行業(yè)解決方案的國家高新企業(yè)。公司旗下有2個品牌:八爪魚大數(shù)據(jù)采集平臺、云聽CEM客戶管理體驗(yàn)平臺。 八爪魚大數(shù)據(jù)采集平臺是深圳視界信息技術(shù)有限公司自主研發(fā),整合了網(wǎng)頁數(shù)據(jù)采集、移動互聯(lián)網(wǎng)數(shù)據(jù)及API接口服務(wù)(包括數(shù)據(jù)爬蟲、數(shù)據(jù)優(yōu)化、數(shù)據(jù)挖掘、數(shù)據(jù)存儲、數(shù)據(jù)備份)等服務(wù)為一體的數(shù)據(jù)服務(wù)平臺,連續(xù)4年蟬聯(lián)互聯(lián)網(wǎng)數(shù)據(jù)采集軟件榜單第一名。自2016年,八爪魚積極開拓海外市場,分別在美國、日本推出了數(shù)據(jù)爬蟲平臺Octopus和Octopus.JP。截止2018年,八爪魚全球用戶突破110萬。 云聽CEM客戶管理體驗(yàn)平臺是深圳視界信息技術(shù)有限公司經(jīng)過多年不斷夯實(shí)自身數(shù)據(jù)處理能力以及在豐厚數(shù)據(jù)資產(chǎn)積累的基礎(chǔ)上,推出的AI數(shù)據(jù)服務(wù)新產(chǎn)品。云聽CEM通過AI自然語言分析技術(shù)幫助國內(nèi)知名消費(fèi)品牌打造客戶體驗(yàn)管理全流程,覆蓋各大電商平臺、微博、知乎等主流發(fā)聲平臺,獲取用戶一手?jǐn)?shù)據(jù)與反饋,提高了品牌企業(yè)運(yùn)營效率,有效拉近了品牌與用戶的距離。
公司創(chuàng)始人兼CEO劉寶強(qiáng)先生,畢業(yè)于國防科技大學(xué),曾任職于morningstar(晨星資訊),負(fù)責(zé)morningstar(晨星資訊)國際金融大數(shù)據(jù)的收集和分析平臺。
軟件特色:
操作簡單,完全可視化圖形操作,無需專業(yè)IT人員,任何會使用電腦上網(wǎng)的人都可以輕松掌握。
云采集
采集任務(wù)自動分配到云端多臺服務(wù)器同時執(zhí)行,提高采集效率,可以很短的時間內(nèi) 獲取成千上萬條信息。
拖拽式采集流程
模擬人的操作思維模式,可以登陸,輸入數(shù)據(jù),點(diǎn)擊鏈接,按鈕等,還能對不同情況采取不同的采集流程。
圖文識別
內(nèi)置可擴(kuò)展的OCR接口,支持解析圖片中的文字,可將圖片上的文字提取出來。
定時自動采集
采集任務(wù)自動運(yùn)行,可以按照指定的周期自動采集,并且還支持最快一分鐘一次的實(shí)時采集。
2分鐘快速入門
內(nèi)置從入門到精通所需要的視頻教程,2分鐘就能上手使用,另外還有文檔,論壇,qq群等。
免費(fèi)使用
它是免費(fèi)的,并且免費(fèi)版本沒有任何功能限制,你現(xiàn)在就可以試一試,立即下載安裝。
軟件功能:
簡單來講,使用八爪魚可以非常容易的從任何網(wǎng)頁精確采集你需要的數(shù)據(jù),生成自定義的、規(guī)整的數(shù)據(jù)格式。八爪魚數(shù)據(jù)采集系統(tǒng)能做的包括但并不局限于以下內(nèi)容:
1. 金融數(shù)據(jù),如季報,年報,財(cái)務(wù)報告, 包括每日最新凈值自動采集;
2. 各大新聞門戶網(wǎng)站實(shí)時監(jiān)控,自動更新及上傳最新發(fā)布的新聞;
3. 監(jiān)控競爭對手最新信息,包括商品價格及庫存;
4. 監(jiān)控各大社交網(wǎng)站,博客,自動抓取企業(yè)產(chǎn)品的相關(guān)評論;
5. 收集最新最全的職場招聘信息;
6. 監(jiān)控各大地產(chǎn)相關(guān)網(wǎng)站,采集新房二手房最新行情;
7. 采集各大汽車網(wǎng)站具體的新車二手車信息;
8. 發(fā)現(xiàn)和收集潛在客戶信息;
9. 采集行業(yè)網(wǎng)站的產(chǎn)品目錄及產(chǎn)品信息;
10. 在各大電商平臺之間同步商品信息,做到在一個平臺發(fā)布,其他平臺自動更新。
使用方法:
先我們新建一個任務(wù)-->進(jìn)入流程設(shè)計(jì)頁面-->添加一個循環(huán)步驟到流程中-->選中循環(huán)步驟-->勾選上軟件右方的URL 列表勾選框-->打開URL列表文本框-->將準(zhǔn)備好的URL列表填寫到文本框中
接下來往循環(huán)中拖入一個打開網(wǎng)頁的步驟-->選中打開網(wǎng)頁步驟-->勾選上使用當(dāng)前循環(huán)里的URL作為導(dǎo)航地址-->點(diǎn)擊保存。系統(tǒng)會在界面下方的瀏覽器中打開循環(huán)中選中的URL對應(yīng)的網(wǎng)頁
到這里,循環(huán)打開網(wǎng)頁的流程就配置完成了,運(yùn)行流程的時候,系統(tǒng)會逐個的打開循環(huán)中設(shè)置的URL。最后我們不需要配置一個采集數(shù)據(jù)的步驟,這里就不在多講,大家可以參考從入門到精通系列1:采集單個網(wǎng)頁 這篇文章。下圖就是最終和流程
下面是流程最終的運(yùn)行結(jié)果
更新日志:
V8.0.4(正式) 2019-10-24
主要體驗(yàn)改進(jìn) 全新的8.0有哪些改進(jìn)?
更好的操作體驗(yàn):全新軟件設(shè)計(jì)架構(gòu),更穩(wěn)定,更流暢,解決卡慢問題
更高的網(wǎng)站兼容性:?內(nèi)置瀏覽器內(nèi)核更新為Chrome,網(wǎng)頁兼容性更強(qiáng)
更快的采集速度:「本地采集」速度明顯提升
更簡潔的UI交互:界面更簡潔、邏輯更清晰