阿里云AI繪畫創(chuàng)作大模型通義萬相亮相 已開啟定向邀測
中證網(wǎng)訊(記者 王可)繼通義千問之后,阿里云通義大模型家族迎來新成員。7月7日,在2023世界人工智能大會上,阿里云宣布AI繪畫創(chuàng)作大模型通義萬相開啟定向邀測,該模型可輔助人類進行圖片創(chuàng)作,未來可應用于藝術(shù)設計、電商、游戲和文創(chuàng)等應用場景。阿里云智能集團CTO周靖人表示,這是阿里云大模型全面掌握多模態(tài)能力的關鍵一步,該能力將逐步向行業(yè)客戶開放。
據(jù)介紹,通義萬相在語義理解和圖片生成上均表現(xiàn)優(yōu)秀,首批上線3大能力:在基礎文生圖功能中,可根據(jù)文字內(nèi)容生成水彩、扁平插畫、二次元、油畫、中國畫、3D卡通和素描等風格圖像;在相似圖片生成功能中,用戶上傳任意圖片后,即可進行創(chuàng)意發(fā)散,生成內(nèi)容、風格相似的AI畫作;該模型還在業(yè)內(nèi)率先支持圖像風格遷移,用戶上傳原圖和風格圖,可自動把原圖處理為指定的風格圖。
通義萬相基于阿里研發(fā)的組合式生成模型Composer,其可通過對配色、布局、風格等圖像設計元素進行拆解和組合,提供高度可控性和極大自由度的圖像生成效果,僅需一個模型即可支持多類圖像生成類任務能力,該研究成果已在國際AI頂會ICML 2023上發(fā)表。
阿里云在現(xiàn)場展示了該模型生成圖片的效果,當輸入“沉浸在全頁灰度涂色的迷人世界中,有一只老虎在曼陀羅寧靜的森林中,畫面采用線條、筆畫”后,系統(tǒng)能迅速生成線條細節(jié)豐富的老虎圖片,如果繼續(xù)使用風格遷移功能,還可隨意切換圖片風格。
在去年的世界人工智能大會上,阿里云“通義”大模型系列首次亮相,在此之后,通義千問、通義聽悟等模型和產(chǎn)品相繼推出,通義萬相的問世意味著阿里云在大模型領域已經(jīng)具備處理或生成文本、語音和圖片等模態(tài)的能力。目前,阿里云大模型正逐步走向千行百業(yè),已有超過30萬企業(yè)申請測試通義千問,通義聽悟累計用戶數(shù)達到36萬。“多模態(tài)是大模型演進的必然路徑,我們希望用不同模態(tài)的能力服務千行百業(yè),幫助企業(yè)全面擁抱智能化時代!敝芫溉吮硎尽