合合信息大模型“加速器”亮相2024世界人工智能大會(huì)
中證網(wǎng)訊(記者 黃一靈)7月4日至7月7日,2024世界人工智能大會(huì)在上海舉辦。本屆大會(huì)上,大模型仍是關(guān)注焦點(diǎn)之一,“百模大戰(zhàn)”仍在繼續(xù)。
大模型技術(shù)的發(fā)展和應(yīng)用,預(yù)示著更加智能化、個(gè)性化未來(lái)的到來(lái)。如果將大模型比喻為正在疾馳的科技列車(chē),語(yǔ)料便是珍貴的“燃料”。對(duì)于中國(guó)的大模型企業(yè)而言,語(yǔ)料短缺問(wèn)題更為嚴(yán)峻。當(dāng)前大模型數(shù)據(jù)集主要為英文,中文語(yǔ)料占比較低;無(wú)線(xiàn)表、跨頁(yè)表格、復(fù)雜公式等元素的處理仍是大模型語(yǔ)料處理中的另一個(gè)“攔路虎”。在此背景下,如何幫助大模型在信息的海洋中快速找準(zhǔn)航向,在數(shù)據(jù)的荒漠中找到高質(zhì)量的“水源”?大會(huì)上,合合信息展示了大模型“加速器”解決方案。
據(jù)了解,在大模型訓(xùn)練的上游階段,“加速器”中的文檔解析引擎將助力大模型突破在書(shū)籍、論文、研報(bào)等文檔中的版面解析障礙,從源頭為模型訓(xùn)練與應(yīng)用輸送純凈的“燃料”,助力大模型跑得更快;“加速器”還加載了acge文本向量化模型,助力大模型解決“已讀亂回”的“幻覺(jué)”問(wèn)題,讓大模型在正確的航線(xiàn)上行駛得更遠(yuǎn)。
合合信息智能創(chuàng)新事業(yè)部總經(jīng)理唐琪表示,目前,大模型“加速器”已被多家大模型廠商應(yīng)用于金融、醫(yī)學(xué)、財(cái)經(jīng)、媒體等多領(lǐng)域的文檔的解析中,助力大模型更順利地接軌“專(zhuān)業(yè)課”,它不僅僅是一套技術(shù)工具,更是推動(dòng)行業(yè)專(zhuān)業(yè)知識(shí)管理革新、提升業(yè)務(wù)效率的重要基石。未來(lái),大模型加速器將陪伴更多行業(yè)級(jí)知識(shí)庫(kù)的建立,讓大模型的服務(wù)潤(rùn)澤社會(huì)各個(gè)角落,實(shí)現(xiàn)“智能觸手可及”。