GPT-4o多模態(tài)能力再提升 多家上市公司加速推進AI應用落地
近日,OpenAI發(fā)布了新一代旗艦生成模型GPT-4o(“o”代表omni,即全能的意思)。據(jù)悉,GPT-4o為面向未來人機交互范式的全新大模型,具有文本、語音、圖像三種模態(tài)的理解力,反應極快還帶有感情,也“很通人性”。
開源證券研究報告介紹,GPT-4o有四大特點:一是多模態(tài)能力大幅提升,可以跨文本、音頻和視頻進行實時推理;二是更加“像人”;三是毫秒級響應,API(應用程序接口)成本更低;四是擁有3D視覺內(nèi)容生產(chǎn)能力。
全球大模型競爭加劇
據(jù)悉,GPT-4o將免費提供給所有用戶,OpenAI還將推出桌面版ChatGPT,輕量化的使用體驗可以融入任何工作流程中。
“GPT-4o作為一個具有多模態(tài)能力的生成型模型,將在客戶服務、醫(yī)療保健、教育、娛樂、無障礙技術等諸多領域發(fā)揮重要作用,助力相關領域的AI應用‘更加好用,性價比更高’,更好地打開應用商業(yè)化空間,也會加劇全球各大模型廠商的競爭?!敝袊娮由虅諏<曳罩行母敝魅喂鶟诮邮堋蹲C券日報》記者采訪時表示。
近段時間,不少海內(nèi)外行業(yè)巨頭頻頻發(fā)布大模型最新成果。例如谷歌發(fā)布升級版的最強大AI模型Gemini迎戰(zhàn)GPT-4o,谷歌CEO桑達爾·皮查伊表示:“谷歌所有的工作都圍繞生成式AI模型Gemini來做,希望每個人都能從Gemini所做的事中受益?!?/p>
國內(nèi)的知名私募巨頭幻方量化旗下的AI公司DeepSeek(深度求索)發(fā)布全新第二代MoE(混合專家)大模型DeepSeek-V2,該模型擁有2360億個參數(shù),其中有210億個活躍參數(shù)。
昆侖萬維正式將天工大模型迭代至3.0版本,據(jù)悉“天工3.0”采用4000億參數(shù)MoE架構,是目前全球模型參數(shù)最大、性能最強的開源MoE模型之一?!疤旃?.0”在語義理解、邏輯推理等方面能力實現(xiàn)質的飛躍,其技術知識能力較上一代模型提升20%,數(shù)學、代碼等能力提升超30%。此外,百度、商湯科技等也發(fā)布了最新多模態(tài)模型成果。
“OpenAI推出GPT-4o及近期海內(nèi)外廠商頻頻發(fā)布大模型迭代升級成果,競爭焦點或集中在多模態(tài)能力、Agent(指能自主活動的軟件或者硬件的智能體)能力和API調用成本優(yōu)化等,均為大模型應用落地并商業(yè)化的關鍵因素?!遍_源證券分析師方光照認為。
多家公司跟進AI應用布局
多模態(tài)模型可以應用于各種終端設備,如智能手機、平板電腦、車載多媒體端口、智能音箱、機器人等。此外,還可以應用于企業(yè)級產(chǎn)品,如影視、教育、營銷、搜索、辦公等各個領域。
在此背景下,不少上市公司通過大模型加速推動在AI領域的業(yè)務布局與應用。5月15日,金蝶集團發(fā)布基于企業(yè)管理、AI、大模型三者疊加結合的金蝶Cosmic,這款應用具備感知、記憶、思考、行動能力,助力管理者及員工輕松應對多項管理工作。
主營為營銷傳播智慧服務的因賽集團日前對外表示,公司自研的營銷行業(yè)AIGC應用級模型InsightGPT,不斷取得技術突破,“圖生視頻”“文生視頻”等各項功能和產(chǎn)品發(fā)布始終走在行業(yè)前列。同時,公司會密切關注世界前沿的最新技術,持續(xù)對InsightGPT各項產(chǎn)品和功能進行優(yōu)化與迭代,適時拓展新的產(chǎn)品方向,目前論證可行的產(chǎn)品方向包括但不限于3D視頻與數(shù)字人。
奧飛娛樂在互動易平臺上表示,目前其持有光年無限5%股權,光年無限有自己的AI對話機器人產(chǎn)品——圖靈機器人開放平臺,并上線AI對話小程序“喜羊羊與灰太狼+”,定位兒童用戶,提供親子陪伴體驗。
字節(jié)跳動也最新發(fā)布了豆包大模型,據(jù)字節(jié)跳動旗下云服務平臺火山引擎總裁譚待介紹:“經(jīng)過一年時間的迭代和市場驗證,豆包大模型正成為國內(nèi)使用量最大、應用場景最豐富的大模型之一,目前日均處理1200億Tokens文本,生成3000萬張圖片。大模型從以分計價到以厘計價,將助力企業(yè)以更低成本加速業(yè)務創(chuàng)新。”
“擁有多模態(tài)能力的大模型將為上市公司在客服服務、教育培訓和終端應用等領域提供了廣闊的應用前景。這種全新的交互模式將為企業(yè)帶來更高的效率和更低的成本,同時為用戶帶來更便捷與愉悅的體驗。”中國信息協(xié)會常務理事朱克力向記者表示。