“大模型在金融行業(yè)的應(yīng)用與展望”研討會(huì)舉行
中證網(wǎng)訊(記者 王可)近日,恒生聚源主辦的“大模型在金融行業(yè)的應(yīng)用與展望”研討會(huì)在上海舉行。會(huì)上,恒生電子高級(jí)副總裁、恒生聚源董事長(zhǎng)王鋒表示,“當(dāng)技術(shù)、模型、數(shù)據(jù)、應(yīng)用快速形成閉環(huán),將產(chǎn)生真正的業(yè)務(wù)價(jià)值,AI進(jìn)入了從能力涌現(xiàn)走向價(jià)值涌現(xiàn)的新階段。”
2022年11月以來(lái),隨著OpenAI發(fā)布ChatGPT,全球迎來(lái)AI大模型熱潮。到今年3月BloombergGPT的推出,引起對(duì)金融垂直領(lǐng)域大模型應(yīng)用的關(guān)注。
恒生研究院院長(zhǎng)、首席科學(xué)家白碩介紹稱(chēng),基于Transformer架構(gòu),大模型目前分為兩條技術(shù)路線(xiàn),其中GPT的單向預(yù)測(cè)模型可以理解為“接龍”,而另一條路線(xiàn)類(lèi)似于“填空”,前者通過(guò)一條示意可以容納包括知識(shí)、推理、引導(dǎo)、詳細(xì)說(shuō)明,甚至代碼的預(yù)測(cè),后者需要兩邊文本的信息指示。
“GPT對(duì)AI行業(yè)的沖擊非常大!卑状T告訴記者,在此之前機(jī)構(gòu)部署的AI系統(tǒng)都是“煙囪式”的單個(gè)系統(tǒng),“諸多小模型的訓(xùn)練使分析師淪為數(shù)據(jù)標(biāo)注員,而模型的可用性也難以得到保障!
富國(guó)基金信息技術(shù)部總經(jīng)理李強(qiáng)提到,在基金行業(yè)的AI應(yīng)用中,自然語(yǔ)言處理、文檔解析、智能客服、發(fā)票識(shí)別、表單提取等小模型應(yīng)用都已相對(duì)成熟,但“煙囪式”發(fā)展問(wèn)題非常嚴(yán)重。
“小模型和大模型也存在經(jīng)濟(jì)學(xué)中的‘不可能三角’!鄙耆f(wàn)宏源證券研究所所長(zhǎng)助理劉洋提到,小模型強(qiáng)調(diào)了精準(zhǔn)度、利潤(rùn)率,但弱化了智能化程度,大模型恰恰相反,通過(guò)成本的堆疊,實(shí)現(xiàn)了模型的智能化與高效能。
“當(dāng)高質(zhì)量語(yǔ)料庫(kù)訓(xùn)練到百億級(jí)參數(shù)時(shí),大模型的語(yǔ)言能力就會(huì)涌現(xiàn),在意圖理解、文本語(yǔ)言生成等方面的能力將隨著參數(shù)的增加達(dá)到頂峰!卑状T指出,盡管大模型的語(yǔ)言能力已經(jīng)很強(qiáng),但是在垂直專(zhuān)業(yè)能力方面還有所欠缺,當(dāng)前普遍適用的解法是,以大模型中控為核心,結(jié)合應(yīng)用、插件等共同構(gòu)建成AI能力中心,將大模型中控成為鏈接大模型與應(yīng)用的“橋梁”。
“大模型的涌現(xiàn)能力,讓基于大量計(jì)算的‘暴力求解’成為現(xiàn)實(shí)。”劉洋表示,在算力、算法、數(shù)據(jù)“三駕馬車(chē)”的推動(dòng)下,工程化能力變得尤為重要,特別是在券商、基金這樣的垂類(lèi)大模型應(yīng)用場(chǎng)景下,率先為客戶(hù)提供服務(wù)的廠(chǎng)商將搶占先機(jī)。從應(yīng)用端,李強(qiáng)同樣提到,目前各類(lèi)大模型“百花齊放”,但應(yīng)用落地還需要真正的工程化能力。
“我們要解決的一個(gè)核心問(wèn)題是,讓大模型有效應(yīng)用于投資業(yè)務(wù)服務(wù)之中,對(duì)于機(jī)構(gòu)客戶(hù)能帶來(lái)投資收益,對(duì)于我們內(nèi)部的中臺(tái)與后臺(tái),可以帶來(lái)有效工作效率提升!敝行抛C券首席數(shù)據(jù)科技分析師張若海指出,在投研領(lǐng)域,大模型可以助力人均價(jià)值的提升,例如在量化領(lǐng)域,對(duì)政策文本數(shù)據(jù)的情緒提煉、中觀景氣研究的指標(biāo)投資有效性識(shí)別,在投資覆蓋寬度與數(shù)據(jù)處理精度大幅提升同時(shí),人力規(guī)模并沒(méi)有顯著等比例增加。在高頻場(chǎng)景下,可以實(shí)現(xiàn)大規(guī)模的定量數(shù)據(jù)跟蹤與觀點(diǎn)提煉,解構(gòu)成交易信號(hào),從而幫助到機(jī)構(gòu)投資者更加便利地獲得大模型的賦能。
李強(qiáng)認(rèn)為,未來(lái)三年內(nèi)代碼生成的效率提升將在30%-50%之間。白碩則提到,從技術(shù)發(fā)展的角度,三年內(nèi)大模型的語(yǔ)言能力將全部上一個(gè)臺(tái)階,而在金融領(lǐng)域的提質(zhì)增效目前主要集中于IT研發(fā)與數(shù)據(jù)分析方面。通過(guò)AI可以實(shí)現(xiàn)低代碼甚至“零代碼”,工作效率可以提升2-3倍,滿(mǎn)足七成以上的數(shù)據(jù)偶發(fā)性即時(shí)需求,提升8-10倍的建模效率。
“在ChatGPT3.5橫空出世時(shí),很多金融從業(yè)者不對(duì)其進(jìn)行訓(xùn)練與微調(diào),可以達(dá)到很好的效果,但是隨著在業(yè)務(wù)場(chǎng)景的落地,會(huì)發(fā)現(xiàn)這一模型難以滿(mǎn)足各業(yè)務(wù)的精度要求。”恒生聚源副總經(jīng)理白雪表示,為了實(shí)現(xiàn)“語(yǔ)控萬(wàn)數(shù)”,恒生電子與恒生聚源共同推出的智能投研平臺(tái)WarrenQ-Chat利用大模型疊加搜索和聚源金融數(shù)據(jù)庫(kù),通過(guò)對(duì)話(huà)指令,輕松獲得金融行情、資訊和數(shù)據(jù),且每一句生成的對(duì)話(huà)均支持原文溯源,確保消息出處可追溯。