PDFlux智能識別PDF(各類金融文檔,包括年報、審計報告、IPO招股說明書、債券募集說明書、評級報告等)中的表格,包括有線框和無線框等各類表格,一鍵拷貝到Word、Excel、PPT中。有需要的小伙伴歡迎來西西下載體驗(yàn)。
關(guān)于公司:
北京庖丁科技有限公司(“庖丁科技”)是全球領(lǐng)先的專注于金融語義理解的人工智能公司,致力于將國際最前沿的深度學(xué)習(xí)(Deep Learning)、自然語言處理(Natural Language Processing)、富格式文檔(Richly Formatted Documents)解析等技術(shù)與金融各垂直領(lǐng)域?qū)I(yè)知識進(jìn)行深度融合,幫助傳統(tǒng)金融行業(yè)打造新一代核心競爭力。
庖丁科技團(tuán)隊逾100人,公司聯(lián)合創(chuàng)始人在機(jī)器學(xué)習(xí)、自然語言處理、數(shù)據(jù)挖掘、金融監(jiān)管、投資銀行及跨境投資領(lǐng)域擁有超過十年的行業(yè)經(jīng)驗(yàn),團(tuán)隊核心骨干來自于中科院、清華、騰訊、惠普實(shí)驗(yàn)室、阿里、華為、加拿大鮑爾集團(tuán)、中信證券、香港聯(lián)交所、安永等國內(nèi)外大型高科技和金融企業(yè)。公司成立兩年時間,已申請多項國內(nèi)外人工智能及金融科技領(lǐng)域領(lǐng)先的專利技術(shù),得到了包括中港兩地金融監(jiān)管機(jī)構(gòu)在內(nèi)的金融行業(yè)戰(zhàn)略客戶的信賴與認(rèn)可。
軟件功能:
表格識別
精準(zhǔn)識別無線框表格
精準(zhǔn)識別復(fù)雜排版頁面的表格
精準(zhǔn)識別表格內(nèi)部單元格合并
跨頁表格自動合并
支持掃描件的表格識別:去除印章、角度矯正
格式轉(zhuǎn)換
將PDF轉(zhuǎn)化為Word、Excel、HTML等格式
將PDF轉(zhuǎn)化為EPUB、MOBI等電子書格式,可以在手機(jī)或Kindle等電紙書上閱讀
精準(zhǔn)保留文本段落、表格等內(nèi)容塊信息
精準(zhǔn)識別文檔的章節(jié)目錄結(jié)構(gòu)
支持復(fù)雜排版的PDF文檔的轉(zhuǎn)換
SaaS服務(wù)
提供一套完整易用的REST API,供計算機(jī)調(diào)用,讓您把PDF復(fù)雜格式拋諸腦后
將PDF文檔解析為文本段落、表格、圖片等內(nèi)容塊的序列,保留原文檔的閱讀順序
支持中英文多欄復(fù)雜排版的PDF文檔解析,跨欄和跨頁內(nèi)容塊智能自動合并
智能識別表格的內(nèi)部結(jié)構(gòu):單元格合并,單元格文字的對齊方式、縮進(jìn)、顏色、加粗、斜體等樣式信息,跨頁和跨欄表格智能合并單元格文字
智能識別文檔的目錄結(jié)構(gòu),支持多達(dá)10個層級,長文檔信息抽取必不可少
支撐后續(xù)各類文檔智能的應(yīng)用:PDF文檔全文檢索、文檔級別信息抽取等
更新日志:
Version 3.12.10
2020-06-23
優(yōu)化元素塊和Toolbar加載方式,減少內(nèi)存占用,使客戶端更流暢
優(yōu)化文檔內(nèi)容收藏功能,使功能更完善美觀
修復(fù)多個已知崩潰問題