首頁>資訊 >
每日視點(diǎn)!AI作畫的人機(jī)戰(zhàn)爭走向何方? 2022-10-10 08:49:12  來源:36氪

AI對于人類職業(yè)的影響及其引發(fā)的輿論波瀾,迅猛到讓人難以想象。還記得2017年,AI還是個(gè)標(biāo)準(zhǔn)的新生事物,我們的核心工作之一就是向讀者們解釋,同聲傳譯、漫畫作家、主持人等人類工作短期內(nèi)仍是無法被AI取代的。而到了今年,一場因AI作畫而引發(fā)的人類畫家危機(jī)大討論卻在國內(nèi)外社交媒體上演。

DALL-E 2, Stable Diffusion, Midjourney, DreamBooth AI, Wombo Dream, Make-A-Video, Novel AI……這些從文本生成圖像的AI作畫工具大量出現(xiàn),越來越受歡迎,市面上由AI生成的畫作越來越多,不斷刷新著大眾對AI能力邊界的認(rèn)知,大量圍繞AI作畫的爭議、AI取代人類畫手的憂慮,噴涌而出。

在AIGC的激變時(shí)刻,關(guān)于AI作畫的法律、倫理等問題也變得愈發(fā)重要,這場人機(jī)戰(zhàn)爭究竟走向何方?我們嘗試用一文說清整個(gè)事件的起承轉(zhuǎn)合。


(資料圖)

起:引發(fā)眾怒的科技與狠活

AI生成的藝術(shù)畫作已經(jīng)存在了很長時(shí)間,2017年,AI繪畫就成為佳士得、蘇富比等高端拍賣場所的座上賓,拍出過數(shù)百萬美元的高價(jià),除了引發(fā)行業(yè)內(nèi)人士的一些分析和唏噓之外,大眾輿論場并沒有掀起什么波瀾。

然而,對AI作畫的聲討,卻在近幾個(gè)月來,在社交媒體中發(fā)展到了一個(gè)高峰。

其一,大量畫師宣布抵制AI。今年8月29日,一個(gè)名叫mimic的AI繪畫網(wǎng)站上線了測試版,允許用戶上傳15至100張圖像讓AI進(jìn)行學(xué)習(xí),然后輸出相同畫風(fēng)的AI畫作。然而一些未經(jīng)授權(quán)的畫作也被上傳學(xué)習(xí),把AI生成的畫作當(dāng)做自己的創(chuàng)作進(jìn)行售賣。隨后又出現(xiàn)了有人將剛剛?cè)ナ赖漠嫾疑性诎鏅?quán)保護(hù)期間的作品上傳給AI學(xué)習(xí),這些動(dòng)作相繼引發(fā)了大批原創(chuàng)作者的不滿,從而抵制“AI學(xué)習(xí)”。

其二,輿論危機(jī)波及幾乎所有主流AI繪圖工具。mimic事件直接激發(fā)了大量畫師和讀者對AI的不滿情緒,有人刪除了自己的公開畫作,有人開始訴諸法律條文,一時(shí)間針對數(shù)據(jù)版權(quán)、技術(shù)倫理等的爭議,也開始波及DALL-E 2、Midjourney和Stable Diffusion等知名AI生成工具。人們發(fā)現(xiàn),一些很火的工具如NovelAI,訓(xùn)練學(xué)習(xí)所使用的數(shù)據(jù)來源網(wǎng)站也存在上傳無授權(quán)圖片的情況。

網(wǎng)站Danbooru發(fā)布的聲明顯示,像NovelAI這樣的生成器是在數(shù)千個(gè)網(wǎng)站的數(shù)十億張圖片上進(jìn)行訓(xùn)練的,包括Pixiv、Twitter、DeviantArt和Tumblr等藝術(shù)家網(wǎng)站,以及Reddit、Pinterest等網(wǎng)站,所以從Danbooru平臺上刪除作品并不會(huì)阻止AI繼續(xù)使用畫家在其他網(wǎng)站的作品。也就是說,只要是網(wǎng)絡(luò)上開放的,就有可能成為學(xué)習(xí)數(shù)據(jù),除了詢問模型的開發(fā)者之外,沒有其他方法可以阻止自己的作品被AI學(xué)習(xí),除非畫家把自己的畫全網(wǎng)都刪完,否則也很難一一查清楚是否被用來學(xué)習(xí)了。

其三,個(gè)人使用AI作畫出現(xiàn)了大量爭議現(xiàn)象。隨著開發(fā)門檻的降低,大量個(gè)人AI開發(fā)者使用開源工具也出現(xiàn)了大量意料之外的情況,比如有人使用AI生成yhsq等違規(guī)內(nèi)容。9月6日,用AI繪圖工具M(jìn)idjourney生成的《太空歌劇院》在美國科羅拉多州舉辦的博覽會(huì)藝術(shù)比賽上獲得數(shù)字類別中的頭獎(jiǎng),也引發(fā)了不小的爭議,因?yàn)樽髡咚冻龅膭趧?dòng)就是輸入描述文字,AI就會(huì)將畫作按需求創(chuàng)作出來,被網(wǎng)友認(rèn)為是“見證了藝術(shù)的死亡”“沒有意義,沒有靈魂”,藝術(shù)家Genel Jumalon更直言,“用一幅AI畫作在藝術(shù)領(lǐng)域獲得一等獎(jiǎng),真是該死的事”。

(《太空歌劇院》)

擔(dān)心AI取代人類畫師,將AI作畫視為對人類能力的貶低,成為一種正在傳染的情緒。

如前所說,AI生成繪畫并不是什么新鮮事物,為什么偏偏近期突然在大眾群體中掀起了水花,引發(fā)眾怒?人當(dāng)然不是只靠最后一根稻草壓垮的。

承接:AI作畫的內(nèi)卷之路

有必要先來簡單了解一下,AI作畫是如何在幾年間從拍賣行、收藏家們關(guān)注的小眾藝術(shù),成長為大眾創(chuàng)作的主流標(biāo)配。

計(jì)算機(jī)視覺一直是深度學(xué)習(xí)的主要任務(wù)方向之一,包括目標(biāo)識別、目標(biāo)跟蹤、圖像分割、圖形處理等,有著大量成熟且廣泛的應(yīng)用。具體到圖像生成領(lǐng)域,2015年左右,AI藝術(shù)創(chuàng)作主要是通過基于卷積神經(jīng)網(wǎng)絡(luò)的遷移學(xué)習(xí),來進(jìn)行圖像風(fēng)格轉(zhuǎn)換,先對圖像內(nèi)容進(jìn)行語義分割,再將內(nèi)容和場景通過線條彎曲、風(fēng)格遷移等手法,轉(zhuǎn)換成指定藝術(shù)風(fēng)格,類似美顏軟件的“濾鏡”功能。顯然,這種生成方法的藝術(shù)價(jià)值并不高,能一鍵p圖的人也并不因此就自認(rèn)是大藝術(shù)家,而且經(jīng)常出現(xiàn)很鬼畜的作品,谷歌深度學(xué)習(xí)繪畫系統(tǒng)DeepDream加工過的圖片就十分詭異。

AI生成真正開始展現(xiàn)出藝術(shù)價(jià)值和媲美人類的水平,是從2016年生成對抗網(wǎng)絡(luò)GAN(Generative Adversarial Nets)的走紅開始的,GAN模型的原理就是讓生成器網(wǎng)絡(luò)和判別器網(wǎng)絡(luò)相互對抗,從而創(chuàng)作出真實(shí)度和準(zhǔn)確度都更高的全新圖像。這一時(shí)期,各種XXGAN的圖像生成器出現(xiàn),誕生了大量“以假亂真”的藝術(shù)作品。2018年10月佳士得以43.25 萬美元的價(jià)格拍賣了由AI創(chuàng)作的《愛德蒙·貝拉米肖像》,成為人類歷史上首次AI藝術(shù)品拍賣。

但是,GAN也不能擺脫傳統(tǒng)AI深度模型的問題:無法理解“邏輯”和“常識”,比如AI能夠根據(jù)文本關(guān)鍵詞把元素堆疊在一起,但因?yàn)闊o法理解隱藏在自然語言背后的邏輯關(guān)系,所以經(jīng)常會(huì)畫出非常“克蘇魯”的反常識作品。而改變,來自預(yù)訓(xùn)練大模型的興起。

通過大規(guī)模數(shù)據(jù)和暴力計(jì)算而訓(xùn)練出來的大模型,展現(xiàn)出了強(qiáng)大的魯棒性,不僅在機(jī)器視覺領(lǐng)域表現(xiàn)優(yōu)異,而且還不斷迭代出了跨模態(tài)生成的能力,推動(dòng)AI生成從語言走向視覺。這一波 “文本轉(zhuǎn)圖像”繪畫工具能夠產(chǎn)生以假亂真的畫作,背后的“腦力”普遍來自大模型基礎(chǔ)技術(shù)的支撐。在AI繪畫工具上展開技術(shù)競賽的谷歌、OpenAI、百度等都是大模型技術(shù)的佼佼者和AIGC的推動(dòng)者。

(KREA一鍵生成的安迪·沃霍爾風(fēng)格的“賽博朋克腦極體”)

讀懂了AI作畫的技術(shù)傳承之路,也就不難理解,為什么AI創(chuàng)作的爭議會(huì)在此時(shí)此刻被發(fā)酵。

首先,巨頭云集,技術(shù)進(jìn)展超乎想象。AI作畫匯聚了大量科技巨頭“亮肌肉”,包括谷歌、OpenAI、Meta、微軟、百度、騰訊等AI能力者,使得技術(shù)突飛猛進(jìn),工具數(shù)量以前所未有的速度爆發(fā)性增長,AI作畫(圖像生成)能力也因內(nèi)卷而達(dá)到令人震驚的水平。2021年1月,OpenAI推出了DALL-E一年后,又推出了最新的DALL·E 2,分辨率提高4倍,可以從自然語言的描述中創(chuàng)建逼真的圖像。谷歌內(nèi)部就卷出了多個(gè)AI繪圖工具,包括Imagen、Parti等,微軟推出的AI繪圖平臺則起名為NUWA女媧,足見野心不小。

大模型優(yōu)秀的生成效果,使得AI作畫具備了一定的實(shí)用性和商用潛力,包括結(jié)合文本生成插畫、創(chuàng)意工作的初樣展示、自動(dòng)完成勾線等重復(fù)機(jī)械勞動(dòng)等,AIGC在走向產(chǎn)業(yè)的同時(shí)自然面臨傳統(tǒng)從業(yè)者的懷疑。

(DALL-E以“騎馬、宇航員”為關(guān)鍵詞創(chuàng)作的繪畫)

其次,大模型的積極開源,讓AI作畫門檻一降再降。

這一輪主流的AI繪圖工具都選擇了開源,繁榮大模型的開發(fā)生態(tài),降低技術(shù)的使用門檻,任何人都可以使用這些工具進(jìn)行創(chuàng)作,有的甚至是免費(fèi)的。比如英國初創(chuàng)公司Stability AI打造的StableDIffusion就完全開放,OpenAI在9月28日開放了Dall-E 2 并提供免費(fèi)試用,NovelAI在10月3號開放,都吸引了大量用戶前去使用。

相比此前AIGC只作為小眾藝術(shù)品和收藏投資對象,基于大模型的AIGC讓更多人參與到訓(xùn)練、開發(fā)和使用中來。盡管各個(gè)開源社區(qū)都明確公布了知識產(chǎn)權(quán)相關(guān)規(guī)定,包括不得用于成人內(nèi)容、仇恨或暴力圖像,避免使用受版權(quán)保護(hù)的材料。但隨著用戶的增多和門檻的下降,一旦有人不了解并遵守開源社區(qū)的知識產(chǎn)權(quán)規(guī)范和協(xié)議,違規(guī)情況就難免發(fā)生。

(DALL·E 2的內(nèi)容政策)

另外,法律空白與滯后,令原創(chuàng)者對維權(quán)感到無能為力。

依靠開源社區(qū)的約束是很難避免AI濫用,那么能不能依靠數(shù)字作品的專項(xiàng)法規(guī)來保護(hù)原創(chuàng)者的知識產(chǎn)權(quán)呢?現(xiàn)狀顯然是令人失望的,立法作為一件非常嚴(yán)肅的事情,往往具有一定的滯后性。與飛速發(fā)展的AI技術(shù)相比,對于AI生成的作品是否具有知識產(chǎn)權(quán)/著作權(quán),利用AI生成違規(guī)圖像如何處理,相關(guān)法律法規(guī)在全球范圍內(nèi)都還在空白和討論階段,目前只有個(gè)案作為參考。2019年斯蒂芬·泰勒(Stephen Thaler)希望將他發(fā)明的DABUS人工智能系統(tǒng)命名為“發(fā)明者”,并獲得相關(guān)發(fā)明專利,但在美國、英國、歐洲、澳大利亞、德國等地的法院都遭到了拒絕。目前看來,在全球范圍內(nèi),知識產(chǎn)權(quán)制度更注重人類創(chuàng)造,使用AI并點(diǎn)擊“go”并不被認(rèn)為是創(chuàng)造性行為。比如深圳市南山法院就曾判定在一起案件中,AI輔助協(xié)作系統(tǒng)生成的文章,受到著作權(quán)法保護(hù),擅自復(fù)制傳播需要承擔(dān)相應(yīng)的民事責(zé)任。

知識產(chǎn)權(quán)本身就存在的判定難、維權(quán)難的特點(diǎn),而AI生成內(nèi)容法律保護(hù)的“缺位”,更加劇了維權(quán)的難度,很難約束違規(guī)使用,這也使得人類原創(chuàng)畫師面對AI繪畫工具,其知識產(chǎn)權(quán)也處于“真空”地帶。

技術(shù)、文化、倫理與法律等各種因素交織在一起,構(gòu)成了開篇中AI作畫的種種爭議和風(fēng)波的緣起,這是一個(gè)環(huán)環(huán)相扣的故事。

轉(zhuǎn)與合:創(chuàng)作者的激變與新機(jī)

那么,有爭議是不是意味著AI作畫就此停滯了呢?還真不是!

事實(shí)上,經(jīng)過頻繁的討論,大量原創(chuàng)畫師對于AI繪畫工具都有了一定的嘗試和了解,從一些知名畫師的反饋來看,對于AI作畫這樣的AIGC應(yīng)用,普遍表現(xiàn)出了三種態(tài)度。

1.AI想取代人類畫師,還早。

某博主測試過后發(fā)現(xiàn),“搞出來的能看的圖多少有一些,但符合描述意圖的圖基本可以說沒有”;“AI畫畫其實(shí)在我這個(gè)修圖師眼里其實(shí)跟ps里那個(gè)填充功能差不多”。原因在于,AIGC的內(nèi)容質(zhì)量還有提升的空間。一方面,AI大模型的自然語言理解能力與人類還有很大的差距,GPT-3所生成的文本也就相當(dāng)于小學(xué)生水平,這種情況下要讓AI繪圖工具理解復(fù)雜的文本,并準(zhǔn)確用圖像表達(dá)出內(nèi)容思想,還是有點(diǎn)困難的。另一方面,在商業(yè)上,藝術(shù)品市場推崇的都是極富獨(dú)特性的作品,稀缺性一直是藝術(shù)品重要的定價(jià)標(biāo)準(zhǔn),工業(yè)化、批量產(chǎn)出的東西對收藏家來說沒有價(jià)值,隨著AI繪畫工具的開源,手工制作的獨(dú)特產(chǎn)品或許才會(huì)成為人們追求的藝術(shù)。這種趨勢其實(shí)已經(jīng)出現(xiàn)了,有網(wǎng)友就認(rèn)為未來約稿很可能“純手工”“零AI”反而會(huì)成為賣點(diǎn)。

一位創(chuàng)作博主直言:標(biāo)榜自己的圖是手工繪圖的畫師,今后想要過得富足,或許需要盡量為自己的作品附加額外的價(jià)值——這種生活方式早已有人在運(yùn)營,那就是藝術(shù)家們。

所以至少目前為止,AI繪畫工具能提供很多幫助,但還是無法取代人類畫師的。

2.AI作畫,確實(shí)有點(diǎn)用。

需要注意的是,藝術(shù)創(chuàng)作、藝術(shù)品收藏是一種相對小眾的活動(dòng),能夠成為藝術(shù)家的是極少數(shù)極小眾的一批人。不過,日常生產(chǎn)生活中存在大量視覺和設(shè)計(jì)工作。在這些領(lǐng)域中,AI已經(jīng)能夠扮演非常有用的“作圖助理”角色,成為大勢所趨。

一種是減少重復(fù)性/風(fēng)險(xiǎn)性工作。比如視覺創(chuàng)意中,與客戶溝通耗費(fèi)大量時(shí)間和精力,存在大量不確定性,經(jīng)常畫完即使版后客戶說“還是第一版好”,遇到這種讓美工自閉的情況,AI就可以扮演起一個(gè)任勞任怨的乙方,快速生成多樣化的AI創(chuàng)意圖片,避免了過重的前期投入乃至返工。另外,每逢節(jié)日大促活動(dòng),美工難免就會(huì)遇到大量重復(fù)枯燥的工作,比如制作高度同質(zhì)化的海報(bào),也可以由高水準(zhǔn)的AI能力來完成。因此有設(shè)計(jì)師將DALL·E命名為“傻逼甲方終結(jié)者”。

另一種是AI作為輔助工具,提高設(shè)計(jì)師的工作效率。許多基于AI繪圖工具都已經(jīng)被開發(fā)為Figma、Photoshop、Blender等工具的插件,幫助創(chuàng)作者渲染細(xì)節(jié)、一鍵填色、提供靈感……而對于沒有受過系統(tǒng)性繪畫訓(xùn)練的普通人來說,藝術(shù)創(chuàng)作的門檻也大大降低了,有網(wǎng)友用Midjourney合成了去世祖母在花叢里的照片,有網(wǎng)友用它為自己寫的同人小說制作插畫,這些在大模型和AIGC出現(xiàn)之前,都只能委托給專業(yè)畫家,歷經(jīng)漫長的等待來完成,而現(xiàn)在用AI繪圖只需一鍵即可完成。

普通人也能低成本甚至零成本地實(shí)現(xiàn)腦洞,AI大模型支撐下的創(chuàng)作自由才剛剛開始,因此也有創(chuàng)作者直言,“AI繪畫是在造福人類”。

3.AI知識產(chǎn)權(quán)保護(hù),需要加速。

對于創(chuàng)作者來說,AI繪畫工具無疑是絕佳輔助,與此同時(shí),避免AIGC的野蠻生長,因一些違規(guī)作畫的操作而陷入爭議和負(fù)面,也成為藝術(shù)界、AI界、法律界在一起共同討論、加速立法的當(dāng)務(wù)之急。

目前來看,AI作畫的知識產(chǎn)權(quán)爭論焦點(diǎn)主要集中在三個(gè)方面:1.數(shù)據(jù)版權(quán)。AI模型訓(xùn)練對于樣本數(shù)據(jù)的數(shù)量和覆蓋廣度有要求,如何確保數(shù)據(jù)版權(quán)的來源并予以保護(hù);2.創(chuàng)作版權(quán)。數(shù)據(jù)只是侵權(quán)的第一步,“畫風(fēng)抄襲”是畫師們非常苦惱的一種侵權(quán),AI生成畫作的元素、風(fēng)格相似度要判定是否抄襲,比判定人類抄襲作品的難度更大;3.利益保護(hù)。目前大量AI繪畫工具都提供付費(fèi)服務(wù),而一旦AI生成技術(shù)商用以后,作為數(shù)據(jù)源頭或創(chuàng)作者的人如何獲得合理回報(bào)和收益,目前也沒有有效的解決方案和保護(hù)手段。所以DALL-E 2直接規(guī)定,其使用者無法出售用它創(chuàng)作的任何藝術(shù)品。但如果能有一種措施,準(zhǔn)確判斷貢獻(xiàn)度并將收益分配給貢獻(xiàn)者,比如聯(lián)邦學(xué)習(xí)技術(shù)、區(qū)塊鏈技術(shù)等的支持下,相信許多原創(chuàng)者也樂于參與到AIGC的產(chǎn)業(yè)化進(jìn)程中。

有了法律與技術(shù)的保障,AI作畫才能在邊界內(nèi)加速人機(jī)合作,而非割裂與沖突。

總而言之,現(xiàn)代文明的演進(jìn),是一個(gè)世界的祛魅過程。工業(yè)化的過程,就是用蒸汽機(jī)、電氣化等科學(xué)技術(shù)的系統(tǒng)運(yùn)用,去取代那些能工巧匠們的奧秘,而這個(gè)祛魅過程,也帶來了生產(chǎn)的大批量、高效率和低成本,普羅大眾的生活比傳統(tǒng)時(shí)代的任何時(shí)候都要便利和富足。

從這個(gè)意義來看,AIGC何嘗不是一個(gè)藝術(shù)祛魅的過程。就像Midjourney主創(chuàng)所說:美麗的石頭來自河流,但河流不是創(chuàng)作者。這套AI系統(tǒng)并無創(chuàng)造的能力,但美可以來自其中。(Every beautiful stone comes from the river, but is the river creative? No, I don’t think so. Is the system creative? No. Can beauty come out from it? Yes. )

沒有什么能瓦解人的靈魂和創(chuàng)造力,就像攝影術(shù)不會(huì)瓦解梵高和莫奈。智能時(shí)代,擁抱AI已成定局,這個(gè)進(jìn)程中,人如何尋找到人的價(jià)值與意義,將是我們每個(gè)人所共同面臨的一個(gè)課題。

關(guān)鍵詞: 繪畫工具 知識產(chǎn)權(quán) 藝術(shù)創(chuàng)作

相關(guān)閱讀:
熱點(diǎn)
圖片 圖片