不用畫筆、顏料只需一段指令 人工智能如何妙筆“生”畫?
接受指令后輸出圖像,數(shù)秒鐘可生成一幅畫
人工智能,如何妙筆“生”畫
核心閱讀
輸入一段話,“繪”出一幅畫——人工智能的繪畫本領(lǐng),吸引眾多職業(yè)畫師和零基礎(chǔ)用戶嘗鮮。人工智能繪畫的本質(zhì)是計(jì)算,接受“語言描述”指令后根據(jù)自身的理解還原出圖像。未來,人工智能技術(shù)應(yīng)用于藝術(shù)創(chuàng)作等領(lǐng)域,還要注意防范潛在風(fēng)險(xiǎn),讓技術(shù)進(jìn)步更好地造福社會(huì)。
不用畫筆、顏料,輸入一段描述性文字,計(jì)算機(jī)就能自動(dòng)解析,生成相應(yīng)的畫作。2022世界人工智能大會(huì)上,人工智能繪畫的展示令觀眾驚嘆。
一些過去專屬于人類創(chuàng)作的領(lǐng)域,比如繪畫、書法、寫作、作曲,如今人工智能也已開始涉足。人工智能是如何繪畫的?當(dāng)前沿技術(shù)與藝術(shù)相遇,將碰撞出怎樣的火花?在內(nèi)容、版權(quán)等方面又是否存在問題?
從文本到圖像,人工智能繪畫本質(zhì)是計(jì)算
人工智能繪畫是一個(gè)從文本到圖像的生成過程,輸入一段話,生成一幅畫,本質(zhì)是計(jì)算。簡(jiǎn)要地說,計(jì)算機(jī)通過大量學(xué)習(xí),能識(shí)別特定圖片元素和文本之間的關(guān)聯(lián)。同理,人工智能程序在收到“語言描述”指令后,可以根據(jù)自身的算法還原出圖像。
設(shè)定計(jì)算機(jī)程序作畫的想法由來已久。早在20世紀(jì)70年代,就有藝術(shù)家開發(fā)了操作機(jī)械臂的電腦程序,讓機(jī)械臂按照指令在畫紙上作畫。近些年,人工智能技術(shù)日新月異,科研人員嘗試設(shè)計(jì)自動(dòng)作圖的計(jì)算機(jī)程序。但過去很長(zhǎng)一段時(shí)間,人工智能“畫”出的作品普遍不夠好,往往只是一些模糊的圖像元素的組合,還稱不上是完整的畫。
今年以來,人工智能畫技迅速“進(jìn)化”。談及技術(shù)突破原因,百度文心一格總架構(gòu)師肖欣延認(rèn)為,這是預(yù)訓(xùn)練大模型的興起、大數(shù)據(jù)的訓(xùn)練和擴(kuò)散模型的出現(xiàn)3方面共同作用的結(jié)果。
具體來說,預(yù)訓(xùn)練大模型增強(qiáng)了人工智能的通用性,成為人工智能技術(shù)及應(yīng)用的新基座;大數(shù)據(jù)的訓(xùn)練中,通過在眾多高性能GPU(圖形處理器)算力資源中進(jìn)行并行學(xué)習(xí),計(jì)算機(jī)能夠在短時(shí)間內(nèi)完成大量的數(shù)據(jù)學(xué)習(xí)。近年來,幾乎所有人工智能的技術(shù)發(fā)展都受益于這兩方面的進(jìn)展。而對(duì)人工智能繪畫來說,擴(kuò)散模型的出現(xiàn)至關(guān)重要。
擴(kuò)散模型的原理是,通過人為逐步添加噪聲,讓圖像逐漸變“模糊”,再不斷學(xué)習(xí)去噪過程,如此人工智能就能從完全是噪聲的圖片中逐漸還原出清晰的圖片,即“畫”出圖像。
“這一過程與人類學(xué)習(xí)相似。通常,人們學(xué)畫從臨摹開始,機(jī)器也是如此。它最初生成的圖像可能很模糊,但計(jì)算機(jī)會(huì)不斷修正,從而輸出越來越清楚、層次越來越豐富的圖像。”肖欣延說。
擴(kuò)散模型讓人工智能繪畫技術(shù)實(shí)現(xiàn)跨越,不僅作畫質(zhì)量快速提升,生成時(shí)間也縮短到幾秒鐘。
眾多用戶嘗鮮,大量應(yīng)用加速“畫技”進(jìn)化
湯林杰是某互聯(lián)網(wǎng)公司的運(yùn)營(yíng)人員。工作中,他需要借助一些圖片來豐富文案,而網(wǎng)絡(luò)上找到合適的配圖并不容易。今年10月,了解人工智能繪畫程序后,他嘗試自己“畫”圖?,F(xiàn)在,人工智能繪畫工具已經(jīng)是他工作的重要輔助。
隨著算法模型對(duì)公眾開放以及訓(xùn)練數(shù)據(jù)成本的下降,人工智能繪畫門檻越來越低,一些簡(jiǎn)易化操作平臺(tái)在國(guó)內(nèi)外興起。如今,不僅一些職業(yè)插畫師嘗試用人工智能繪畫程序輔助作畫、激發(fā)靈感,許多沒有繪畫基礎(chǔ)的用戶也開始嘗鮮,并“曬”在社交平臺(tái)上。
大量需求的涌現(xiàn)也加速了技術(shù)的更新迭代?!坝萌斯ぶ悄芾L畫的人越多,算法就越能理解輸入的描述文本,畫作質(zhì)量就越高。”肖欣延表示,當(dāng)前人工智能繪畫水平與今年初相比,已經(jīng)有很大進(jìn)步。
不過,目前的人工智能繪畫技術(shù)并不完美。首先,可控性仍然不高,即計(jì)算機(jī)不能很好理解人類指令的含義,即便是輸入“畫兩個(gè)蘋果,左邊紅色,右邊綠色”這樣的簡(jiǎn)單描述,生成的圖像也可能有很大偏差;其次,細(xì)節(jié)呈現(xiàn)能力還不夠。比如,對(duì)空間、透視和光影的刻畫就很不如意。不少人工智能渲染出的畫作,初看上去驚艷,認(rèn)真觀察問題卻不少。
但肖欣延認(rèn)為,人工智能繪畫在技法上的缺陷未來有望得到彌補(bǔ)。比如,基于跨模態(tài)大模型和強(qiáng)大的深度學(xué)習(xí)框架,百度開發(fā)的技術(shù)一定程度上已經(jīng)緩解這些問題。此外,未來人工智能不僅能作畫,還能根據(jù)文本描述生成視頻,并直接配上解說文字,“可以把視頻生成看作是維度更高的繪畫,從技術(shù)層面看,這是可以實(shí)現(xiàn)的?!?/p>
防范潛在風(fēng)險(xiǎn),守住法律和倫理底線
人工智能進(jìn)入繪畫領(lǐng)域,計(jì)算機(jī)會(huì)取代人類畫師嗎?
在肖欣延看來,好的繪畫與構(gòu)圖、設(shè)計(jì)語言、視覺情緒息息相關(guān),即使人人都可以用人工智能技術(shù)作畫,但通常只有高水平的畫師才能制作出優(yōu)秀的人工智能繪畫作品,“人工智能只是作畫的輔助工具”。此外,雖然有的人工智能繪畫語言嫻熟,也包含細(xì)膩的情感,但并不意味著機(jī)器有意識(shí)、情感,它不過是學(xué)過類似的作品,又恰好呈現(xiàn)出來了?!皟?yōu)秀的藝術(shù)作品往往是人的思想的投射,目前機(jī)器并沒有真正具備思考能力。”肖欣延說。
不少業(yè)內(nèi)人士認(rèn)為,不妨以開放的心態(tài)擁抱人工智能繪畫,接受新事物??梢灶A(yù)想,將來繪畫中一些繁瑣、重復(fù)性的工作可能由計(jì)算機(jī)完成,創(chuàng)作者能騰出更多時(shí)間去構(gòu)思想法與創(chuàng)意,調(diào)整構(gòu)圖、色彩、光影氛圍等。
“人工智能可能會(huì)激發(fā)繪畫創(chuàng)造的活力。”肖欣延表示,20世紀(jì)前后,照相技術(shù)讓傳統(tǒng)肖像畫失去市場(chǎng),促使一些畫家向非寫實(shí)方向創(chuàng)新。與人工智能技術(shù)融合,或許能激發(fā)畫家創(chuàng)作出別開生面的作品。
不過,由于人工智能繪畫發(fā)展剛剛起步,技術(shù)發(fā)展也引發(fā)關(guān)于版權(quán)、內(nèi)容把控等問題的爭(zhēng)議。比如,有人認(rèn)為,未經(jīng)授權(quán)人工智能畫作模仿原畫的內(nèi)容、構(gòu)圖和風(fēng)格等,侵犯了原作者的版權(quán),有違法嫌疑。也有人認(rèn)為,“機(jī)器學(xué)習(xí)”過程是一種類人化的創(chuàng)作行為,同樣體現(xiàn)了創(chuàng)造者的思想和勞動(dòng),應(yīng)當(dāng)獲得版權(quán)保護(hù)。此外,還有人擔(dān)憂,人工智能繪畫技術(shù)若被濫用,可能滋生暴力等令人不適的圖像。面對(duì)新技術(shù)發(fā)展,有必要前瞻潛在的風(fēng)險(xiǎn),只有守住法律和倫理底線,技術(shù)進(jìn)步才能更好地造福社會(huì)。
不只是繪畫,寫作、作曲、生成短片,人工智能日益強(qiáng)大的深度學(xué)習(xí)能力,讓它與不同藝術(shù)門類發(fā)生著奇妙的碰撞。展望未來,業(yè)界專家認(rèn)為,人工智能與藝術(shù)融合,一方面會(huì)降低一些藝術(shù)門類的創(chuàng)造門檻,讓更多人參與到當(dāng)代的審美創(chuàng)造中來;另一方面新技術(shù)會(huì)帶來新的審美風(fēng)格,人們或許能從中擴(kuò)展對(duì)自身和世界的認(rèn)識(shí)。(記者 喻思南)
版權(quán)聲明:凡注明“來源:中國(guó)西藏網(wǎng)”或“中國(guó)西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國(guó)西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。