本報訊 (記者向炎濤)近日,云知聲智能科技股份有限公司(以下簡稱“云知聲”)正式推出Unisound U1-OCR文檔智能基礎(chǔ)大模型。作為首個工業(yè)級文檔智能基座,該模型憑借“性能領(lǐng)先、可信可驗、開箱即用、高效部署、強適配”五大核心優(yōu)勢,打破傳統(tǒng)文檔處理邊界,樹立起行業(yè)新標(biāo)桿。
據(jù)介紹,文檔智能是指利用人工智能技術(shù)自動閱讀和理解文檔影像,并進行內(nèi)容的讀取、理解、分類及關(guān)鍵信息提取。傳統(tǒng)視覺方案(OCR 1.0)僅能識別文字,新一代多模態(tài)方案(OCR 2.0)具備端到端版面理解能力和文字識別能力。而Unisound U1-OCR則正式開啟OCR 3.0時代——在理解版面的基礎(chǔ)上,進一步洞察文檔深層語義,實現(xiàn)自動分類與業(yè)務(wù)級信息抽取,完成了從“字符感知”到“文檔認知”的質(zhì)的飛躍。
Unisound U1-OCR核心優(yōu)勢在于突破了傳統(tǒng)模型“只讀文字、不懂排版”的瓶頸,能夠像人類專家一樣“看懂”復(fù)雜文檔。為適應(yīng)OCR 3.0時代對于文檔業(yè)務(wù)級結(jié)構(gòu)化抽取的新要求,Unisound U1-OCR采用ViT+LLM架構(gòu),其中視覺編碼器部分采用NaViT架構(gòu),實現(xiàn)文檔分辨率動態(tài)處理,模型參數(shù)規(guī)模3B量級,兼顧模型計算效率與文檔深層語義信息理解的能力要求。
云知聲方面表示,Unisound U1-OCR開啟OCR 3.0時代,標(biāo)志著AI從單純“識字”躍遷至“理解業(yè)務(wù)邏輯”。公司將以多模態(tài)文檔為知識入口,賦予機器自主推理與證據(jù)溯源能力,推動AI從感知走向認知。未來,云知聲期待構(gòu)建能像人類一樣閱讀、思考并解決復(fù)雜問題的通用智能體,讓每一份文檔都成為通往AGI的智慧階梯。
(編輯 張昕)
| 09:20 | 康芝藥業(yè):關(guān)于全資子公司參加國家... |
| 09:20 | 晶澳科技:截至2026年2月28日,公... |
| 09:20 | 東華能源:聘任汪家寶為副總經(jīng)理 |
| 09:20 | 泰山石油:累計回購1081400股 |
| 09:20 | 仕佳光子:公司深耕光通信領(lǐng)域,圍... |
| 09:20 | 山西焦煤:截至2026年2月27日公司... |
| 09:20 | 富維股份:一汽旗翼公司聚焦于紅旗... |
| 09:20 | 心脈醫(yī)療:海外銷售收入超過2.5億... |
| 09:19 | 翱捷科技:公司可以為ASIC客戶提供... |
| 09:19 | 三環(huán)集團:累計回購5133800股 |
| 09:19 | 麗人麗妝:公司將持續(xù)努力保持與現(xiàn)... |
| 09:19 | 麗尚國潮:控股股東元明控股增持67... |
版權(quán)所有《證券日報》社有限責(zé)任公司
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營許可證 京B2-20250455
京公網(wǎng)安備 11010602201377號京ICP備19002521號
證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細閱讀法律申明,風(fēng)險自負。
證券日報社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注