通用人工智能“奇點”來臨 大模型從新品競技躍向產(chǎn)業(yè)賦能
繼工業(yè)時代、電氣時代、信息時代之后,真正意義上的智能時代正在呼嘯而來。在大模型的牽引下,這次變革改變了此前的“造工具”模式,且不斷涌現(xiàn)出“新物種”“新伙伴”。
“2024年一定是大模型應用爆發(fā)的一年。”在接受證券時報記者專訪時,騰訊云工業(yè)AI解決方案總經(jīng)理鄭海清如是判斷。云天勵飛董事長陳寧也預判,“未來三年將是AI(人工智能)關(guān)鍵階段,全球可能80%的企業(yè)會運行在大模型之上;可能五年,機器人和數(shù)字人的數(shù)量會超過人類的數(shù)量!
以行業(yè)應用為支點,大模型從“上新品”向“強應用”階段嬗變,加速了大模型走進百業(yè)千家的節(jié)奏。隨著國產(chǎn)大模型的開發(fā)應用步入深水區(qū),始于技術(shù)、強于應用、惠于生態(tài)的發(fā)展路徑已經(jīng)成形。
大模型 “向下”扎根
國內(nèi)某頭部航空航天企業(yè),此前結(jié)構(gòu)仿真都是利用軟件和算子去做一些數(shù)學或者是物理的模型,要想算出結(jié)果需要極大算力。如今,這個計算過程已經(jīng)可以省略,只需用大模型,就能把結(jié)果預測出來,測試結(jié)果至少實現(xiàn)一到兩個量級的提升。
這是騰訊大模型“扎根”行業(yè)的一次落地。鄭海清介紹,除了高端制造業(yè)之外,在工業(yè)質(zhì)檢、傳統(tǒng)行業(yè)等不少領(lǐng)域,騰訊云從去年下半年開始都陸續(xù)落地。
無獨有偶?拼笥嶏w的星火大模型也持續(xù)在行業(yè)應用領(lǐng)域落地生根。
科大訊飛AI工程院院長潘青華介紹,最初啟動大模型攻關(guān)的時候,公司就明確了“1+N”的路線,“1”為基礎(chǔ)模型,“N”指的便是行業(yè)應用,即讓大模型在教育、醫(yī)療、汽車、辦公、工業(yè)、智能硬件等多個領(lǐng)域落地。截至目前,“訊飛星火”已陸續(xù)在教育、辦公、汽車、金融、工業(yè)、醫(yī)療等行業(yè)推進真實可見的應用落地案例。
大模型向下扎向產(chǎn)業(yè)的根須越發(fā)茂密。
阿里云日前在發(fā)布通義千問大模型新版本的同時,推出八大行業(yè)大模型;華為云發(fā)布了盤古醫(yī)學大模型;百度去年也發(fā)布國內(nèi)首個“產(chǎn)業(yè)級”醫(yī)療AI大模型——靈醫(yī)大模型。繼“AI For Science”之后,大模型已然開始步入“AI For Industries”新階段。
“扎根”產(chǎn)業(yè)的大模型,有望給不少產(chǎn)業(yè)帶來顛覆式影響。以創(chuàng)新藥為例,傳統(tǒng)藥物研發(fā)存在耗時十年以上、耗費十億美元的“雙十定律”,但是大模型落地后,隨著對蛋白質(zhì)結(jié)構(gòu)等越來越準確的預測,藥物研發(fā)的周期或大大縮短。
大模型向下扎根,演繹出不同以往的新趨勢。2023年上半年大模型趕潮推出之際,市場關(guān)注點主要集中在大模型的參數(shù)數(shù)量和效果優(yōu)化上。從下半年開始,已經(jīng)將關(guān)注重點轉(zhuǎn)向如何實際進行應用,以及企業(yè)怎樣利用其帶來革命性提效。
這加速了大模型向通用與垂直兩大路徑的分野。通用大模型和垂直大模型針對或解決問題的目標不盡相同,通用大模型需要具備更強的泛化性,憑借語言理解、邏輯推理、知識問答、文本生成等通用能力,這些大語言模型產(chǎn)品一經(jīng)推出,用戶規(guī)模不斷擴大,并向圖片、視頻等多模態(tài)形式深化演繹;而垂直大模型則必須要在垂直行業(yè)內(nèi)的應用中保持高準確度,實體經(jīng)濟是大模型應用的“大賽道”。
與通用大模型相比,B端客戶在數(shù)據(jù)安全、精準性、成本等方面更為關(guān)注。這給大模型廠家提出了更高的要求。
比如,針對大模型在面對某些輸入時,會生成不準確、不完整或誤導性的輸出,出現(xiàn)“幻覺”問題,騰訊優(yōu)化了預訓練算法及策略,通過自研的“探真”技術(shù),讓混元大模型的“幻覺”相比主流開源大模型降低了30%—50%。同時,還通過強化學習的方法,讓模型學會識別陷阱問題,通過位置編碼的優(yōu)化,提高了模型處理超長文的效果和性能。在邏輯方面,騰訊提出了思維鏈的新策略,讓大模型能夠像人一樣結(jié)合實際的應用場景進行推理和決策。
潘青華預測,最終能夠走出來的通用大模型可能只有幾家,“未來國內(nèi)可能就是幾個底座,大家各自選擇合適的底座去做自己上層的應用”。
終端部署多元化
大模型不僅被“引入”產(chǎn)業(yè),還被“帶入”終端,并呈現(xiàn)多元化布局特點。
PC(個人電腦)被視為通用人工智能普惠到每個人的首選終端。業(yè)內(nèi)普遍將2024年視為AI PC爆發(fā)元年。1月17日,包括聯(lián)想拯救者、聯(lián)想小新在內(nèi)的多款AI PC新品發(fā)布,同時明確,個人AI Agent也將于3個月后正式與用戶見面;在今年CES期間,戴爾、惠普、宏碁等PC企業(yè)也發(fā)布了多款基于人工智能的全新設(shè)備和解決方案。
按照聯(lián)想集團構(gòu)想,每個個體都可以擁有一個專屬于自己的AI PC,運行屬于自己的“個人大模型”。個人大模型能夠繼承公共大模型強大的能力,又能夠為個人所有、提供個性化專屬服務。機構(gòu)預計,2024年起,將陸續(xù)有多款AI PC產(chǎn)品問世,2027年出貨量有望超1.75億臺,將占整體PC市場份額的60%,成為PC市場的主流產(chǎn)品。
作為重要個人終端,大模型新變局也開始席卷手機行業(yè)。韓國三星公司1月17日發(fā)布了首款AI手機系統(tǒng)集成了AI大模型Galaxy AI,可實現(xiàn)通話實時翻譯、AI組織優(yōu)化筆記、照片、視頻等功能。在此之前,國產(chǎn)主要手機品牌已經(jīng)紛紛布局大模型,無論是小米自研大模型MiLM,還是vivo的藍心大模型以及華為的盤古大模型,手機端AI大模型儼然成為新一輪的競技重點,吸引主流玩家悉數(shù)到場。
有接近小米的產(chǎn)業(yè)人士認為,目前大模型手機還在起步探索階段,未來哪家廠商能夠決勝千里,還要取決于模型、應用和產(chǎn)品的迭代創(chuàng)新。同時,蘋果iPhone如何讓大模型發(fā)揮所能,答案依然懸而未決。
產(chǎn)業(yè)化終端之外,一些尚未完全步入商業(yè)化之旅的“未來終端”也借助大模型,向通用人工智能最理想的載體晉級;基于大模型的大腦,具備感知、記憶、規(guī)劃和使用工具的能力的AI Agent(人工智能助理)的演進也備受關(guān)注。
CES期間上,初創(chuàng)公司Rabbit發(fā)布了其手持式AI硬件產(chǎn)品——R1,定位為用戶個人助理,能夠幫助用戶完成打車、訂餐、放歌等日常任務,目前第一批設(shè)備已售罄,第二批預訂預計交貨日期排到2024年4月至5月。
“類比移動互聯(lián)網(wǎng)的智能手機類產(chǎn)品,人工智能時代的產(chǎn)品就是AI Agent,預計未來五到十年的時間,我們每個人都會有三臺機器人。”云天勵飛董事長陳寧預測,未來三年將是人工智能關(guān)鍵階段,全球可能80%的企業(yè)會運行在大模型之上;可能五年的時間機器人和數(shù)字人的數(shù)量會超過人類的數(shù)量。
機器人成為AI Agent的典型代表之一。
日前,科大訊飛發(fā)布業(yè)內(nèi)首個集成全自主國產(chǎn)星火認知大模型的具身智能人形機器人?拼笥嶏w硬件中心機器人產(chǎn)品總監(jiān)季超表示,短期內(nèi),人形機器人將以實際應用場景為牽引,各行業(yè)也會為不同的任務推出不同型號的機器人產(chǎn)品;長期看,未來人形機器人將會在各行各業(yè)充分打磨,本體上下游產(chǎn)業(yè)鏈和任務數(shù)據(jù)積累會日益完善。伴隨著通用AI的“奇點”降臨和機器人硬件成本不斷降低,人形機器人有望走進千家萬戶。
夯實底層技術(shù)架構(gòu)
大模型從“上新品”向“強應用”的嬗變,影響萬千產(chǎn)業(yè),也會關(guān)乎“百模大戰(zhàn)”競逐的終局。
底層技術(shù)底座自主可控愈發(fā)重要。其中,算力視為大模型發(fā)展的重要推手。以英偉達為代表的人工智能訓練芯片當前壟斷著全球AI算力市場供應,但在業(yè)內(nèi)人士看來,算力是一整套生態(tài)體系,相關(guān)芯片布局充滿機遇和挑戰(zhàn)。
“算力是一整套生態(tài)體系!痹漆顿Y本合伙人兼首席技術(shù)官趙占祥介紹,從AI芯片分類來看,目前中國在訓練芯片方面與國際領(lǐng)先水平還有差距,但發(fā)展迅速,預計到2024年年底,許多場景將開始使用國產(chǎn)訓練芯片;推理芯片方面,劃分為云端推理和邊緣端推理(如智能手機上的AI功能),尤其是在低功耗環(huán)境下實現(xiàn)高效能邊緣側(cè)AI,對模型輕量化的需求提升。中國正積極利用新型架構(gòu)如存算一體來提高整體算力,并通過光電互聯(lián)等新技術(shù)手段增強算力表現(xiàn)。
2023年10月,科大訊飛發(fā)布了基于華為昇騰生態(tài)的自主可控算力平臺“飛星一號”,并在此技術(shù)上開展更大規(guī)模的模型訓練。在推理人工智能芯片領(lǐng)域,2023年11月的深圳高交會上,云天勵飛發(fā)布了基于國產(chǎn)的14納米工藝Chiplet技術(shù)的大模型邊緣推理芯片,可拓展支持千億級大模型部署。
“AI訓練不是目的,大模型在千行百業(yè)的推理應用才是產(chǎn)業(yè)化落地的最終目標。我們預計未來5到10年的人工智能推理芯片需求量會到萬億顆!标悓幗榻B,尤其是Chiplet D2D工藝可以實現(xiàn)一次設(shè)計流片、多次封裝,生產(chǎn)多顆不同計算規(guī)格的芯片,能降低成本,滿足市場在各個領(lǐng)域?qū)Σ煌?guī)格的大模型推理芯片的需求。
潘青華也指出,未來大模型的普及程度一方面取決于算法的創(chuàng)新,另一方面取決于硬件的進步,即如何在單位芯片功耗相同的情況下,實現(xiàn)更強的計算能力。以語音識別為例,初始使用成本非常高,現(xiàn)在語音識別算法集成到本地硬件上,不需要構(gòu)建云端的算力,已經(jīng)可以支持每天幾十億次的語音識別的訪問。
目前主流的云端大模型,參數(shù)量都在千億級別,對于內(nèi)存、算力、功耗的需求龐大。相比較,手機廠商自研的端側(cè)大模型體量都比較小,將參數(shù)壓縮到了數(shù)十億到百億左右,以便在手機端運行。為了實現(xiàn)大模型體驗和手機性能的平衡,廠商們目前普遍采取了“端云協(xié)同”的策略,同時部署端側(cè)和云端兩種模型,根據(jù)不同的應用場景和需求來進行選擇。
除了算力系統(tǒng)升級,算法的創(chuàng)新要求也將“水漲船高”!盎诂F(xiàn)有算法框架,仍然看到模型(參數(shù))越大,越能帶來能力提升,但無限堆算力可能不是最優(yōu)路徑,預計很快就會進入算法層面的創(chuàng)新比拼階段!迸饲嗳A表示。
這意味著隨著大模型等通用人工智能應用的進一步發(fā)展,對底層產(chǎn)業(yè)鏈的自主可控程度要求進一步提升。
陳寧介紹,結(jié)合當前國際環(huán)境和中國市場需求以及產(chǎn)業(yè)鏈成熟情況,公司致力于打造中國的算法芯片化技術(shù)平臺,即面向算法計算加速定制處理器設(shè)計。同時,推動多模態(tài)大模型技術(shù)的逐步突破、成熟,以及國產(chǎn)工藝的人工智能芯片的進步。
應對通用人工智能時代發(fā)展,數(shù)據(jù)也亟需治理和升級。
陳寧表示,過去物聯(lián)網(wǎng)沉淀的海量數(shù)據(jù),并不能直接反哺到人工智能,還需要消耗大量的成本來做數(shù)據(jù)治理,才可以真正去訓練人工智能的算法,推動AI應用的落地。
對于大模型的產(chǎn)業(yè)模式,百度集團副總裁吳甜認為可以類比芯片代工廠,“大模型平臺是價格昂貴的大算力系統(tǒng),可以把大數(shù)據(jù)、大算力、大算法都封裝,并且可以建設(shè)自動化、數(shù)字化、標準化的的生產(chǎn)模式。應用方只需定義好問題,把對AI模型的能力要求交給大模型平臺,由大模型平臺進行生產(chǎn),這樣才有可能實現(xiàn)產(chǎn)業(yè)應用遍地開花”。
不過,大模型在快速發(fā)展過程中,也引發(fā)了各界對于數(shù)據(jù)保護、合規(guī)風險及隱私泄露等問題的擔憂。潘青華表示,從算法原理來看,大模型距離形成自主意識還為時尚早。而從大模型本身的安全性來看,如何防止生產(chǎn)有害的、錯誤的信息,這是必須引起重視的,可以從數(shù)據(jù)源頭、訓練方法、算法等技術(shù)層面建立配套的鑒偽等機制;與此同時,還需要從政策法規(guī)層面進行引導,在不影響技術(shù)迭代的前提下,避免技術(shù)濫用。
“還是需要鼓勵實事求是的精神,對人工智能技術(shù)不要過度包裝,讓市場能夠客觀理性認識技術(shù)。”潘青華說,希望更多的人能夠參與到人工智能生態(tài),以更積極的心態(tài)擁抱技術(shù),促進生態(tài)繁榮,推動社會進步。(記者 王小偉 阮潤生 葉玲珍)