證券日報微信

證券日報微博

您所在的位置: 網(wǎng)站首頁 > TMT頻道 > TMT行業(yè) > 正文

云知聲發(fā)布首個工業(yè)級文檔智能基礎(chǔ)大模型

2026-02-26 16:57  來源:證券日報網(wǎng) 

    本報訊 (記者向炎濤)近日,云知聲智能科技股份有限公司(以下簡稱“云知聲”)正式推出Unisound U1-OCR文檔智能基礎(chǔ)大模型。作為首個工業(yè)級文檔智能基座,該模型憑借“性能領(lǐng)先、可信可驗、開箱即用、高效部署、強適配”五大核心優(yōu)勢,打破傳統(tǒng)文檔處理邊界,樹立起行業(yè)新標(biāo)桿。

    據(jù)介紹,文檔智能是指利用人工智能技術(shù)自動閱讀和理解文檔影像,并進行內(nèi)容的讀取、理解、分類及關(guān)鍵信息提取。傳統(tǒng)視覺方案(OCR 1.0)僅能識別文字,新一代多模態(tài)方案(OCR 2.0)具備端到端版面理解能力和文字識別能力。而Unisound U1-OCR則正式開啟OCR 3.0時代——在理解版面的基礎(chǔ)上,進一步洞察文檔深層語義,實現(xiàn)自動分類與業(yè)務(wù)級信息抽取,完成了從“字符感知”到“文檔認知”的質(zhì)的飛躍。

    Unisound U1-OCR核心優(yōu)勢在于突破了傳統(tǒng)模型“只讀文字、不懂排版”的瓶頸,能夠像人類專家一樣“看懂”復(fù)雜文檔。為適應(yīng)OCR 3.0時代對于文檔業(yè)務(wù)級結(jié)構(gòu)化抽取的新要求,Unisound U1-OCR采用ViT+LLM架構(gòu),其中視覺編碼器部分采用NaViT架構(gòu),實現(xiàn)文檔分辨率動態(tài)處理,模型參數(shù)規(guī)模3B量級,兼顧模型計算效率與文檔深層語義信息理解的能力要求。

    云知聲方面表示,Unisound U1-OCR開啟OCR 3.0時代,標(biāo)志著AI從單純“識字”躍遷至“理解業(yè)務(wù)邏輯”。公司將以多模態(tài)文檔為知識入口,賦予機器自主推理與證據(jù)溯源能力,推動AI從感知走向認知。未來,云知聲期待構(gòu)建能像人類一樣閱讀、思考并解決復(fù)雜問題的通用智能體,讓每一份文檔都成為通往AGI的智慧階梯。

(編輯 張昕)

-證券日報網(wǎng)
  • 24小時排行 一周排行

版權(quán)所有《證券日報》社有限責(zé)任公司

互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營許可證 京B2-20250455

京公網(wǎng)安備 11010602201377號京ICP備19002521號

證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細閱讀法律申明,風(fēng)險自負。

證券日報社電話:010-83251700網(wǎng)站電話:010-83251800

網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net

官方客戶端

安卓

IOS

官方微信

掃一掃,加關(guān)注

官方微博

掃一掃,加關(guān)注