首頁>資訊 >
別管它們叫“AI 畫手”了,AI 連手都畫不好 2023-03-14 20:48:07  來源:36氪

前段時間,人類藝術家們在 Instagram 上發(fā)起#artbyhumans運動,抵制 AI 作畫,“影響藝術家收入”、“AI 在藝術作品里抓取再拼貼”……不知當他們看完 AI 畫出來的手后,會不會稍微松口氣?

AI 畫“手”|Medium


(相關資料圖)

因為想象力和創(chuàng)造力,AI 被吹捧上天,但不可忽視的是,它們畫出來的手如此笨拙、怪異,像驚悚電影里的道具。

網(wǎng)上流傳著這樣的梗圖,調(diào)侃 AI 的繪畫功底。

“怎么辨別這是 AI 畫的?看手就行了?!保黅witter

那么,為什么 AI 畫不好手?

有一說一,手是真的很難畫?。?/h2>

別說 AI,人類自己都不一定能把手畫明白。

荷蘭藝術家埃舍爾(M.C. Escher)在 1948 年創(chuàng)作過一幅石版畫,名字就叫 Drawing Hands(畫手)。畫面中,兩只手通過畫筆彼此相連,“一只手創(chuàng)造了另一只,而另一只又創(chuàng)造了第一只”,這種矛盾恰恰表達出了:人們想要描繪出兩只動態(tài)的手有多難。

Drawing Hands|Wikipedia

如果再搜一搜,你會發(fā)現(xiàn)“畫不好手”是一個困擾全球畫師的難題。插畫家 Anna Daviscourt 寫道:“畫手是最有表現(xiàn)力,最復雜,解剖學程度精細的工程。”

還有人把問題拋給了 AI 的“自家人”——ChatGPT。

ChatGPT 答道:“手是由許多小骨頭、肌肉和肌腱組成的,所有這些都必須被準確描繪出來才行。此外,手的位置也很難表達,因為它們不斷在運動狀態(tài)中。因為這些困難,許多藝術家發(fā)現(xiàn),手部繪畫是他們技藝中最令人沮喪和最具挑戰(zhàn)性的方面之一?!?/p>

ChatGPT 的解答

手的復雜性不僅僅在于它本身就有很多個關節(jié)、折痕等微小卻關鍵的細節(jié),還在于手每動一下,原有的關節(jié)都會變得不同。

有人還真數(shù)過,從手指的長寬度,到掌骨與腕關節(jié),一只手大概就有 30 個幾何變化點,這還不包括手掌的陰影與褶皺的變化。

圖源:GIPHY

如果你仔細觀察的話,會發(fā)現(xiàn)大多數(shù)卡通人物的手都只有 4 個指頭(三個手指和一個大拇指),因為在動畫流程制作繁復的早期,少畫一根手指省時省力,還省錢!迪士尼曾透露過,少畫 1 根手指為公司節(jié)省過上百萬美金。

比起面部,手并沒有那么多可供 AI 學習的樣本

AI 在“創(chuàng)造”藝術時并沒有邏輯思維,它并不知道這里或者那里“應該”有什么,只能先接收人類的指令,再與系統(tǒng)內(nèi)的訓練庫進行比照,用生成的圖像盡可能回答“what is this”(這是什么),而非“why is this”(為什么是這個)。

所以,你要想生成更加精準的圖像,比如一頭栩栩如生的小豬,就要給 AI 足夠具體的指令。

指定提示詞前后,AI 畫出的小豬對比|itpedia

但這還遠遠不夠,人們要想 AI 畫得精準,還要提供足夠豐富的真實圖像標注,讓 AI 學習。

手這個復雜幾何形狀,意味著沒有通用的線條或形狀集合,可供 AI 識別手。所以,AI 必須結合許多不同的形狀、組合來畫出令人信服的手。

為什么 AI 總是把手畫殘,恰恰是因為沒有充足的參照物。

知乎上有網(wǎng)友這樣解答:“一張圖片上,手往往占的面積很小,經(jīng)常被遮擋和半遮擋,導致手部所占像素較少細節(jié)不夠。而且,手部的標注是要準確標注手掌、拇指、食指、中指、無名指和小拇指才可以,這部分的工作算法很難自動化,需要人類來完成,這就大大增加了成本?!?/p>

一只手,應該被正確標注出的部分(右上)|知乎

這可不是極個別情況,如果把人類的臉變成像手一樣復雜的動態(tài)結構,AI 也同樣畫不明白。

在我們的臉上,唯一能活動的關節(jié)是顳頜關節(jié),在一些二次元作品中,還常常弱化這個關節(jié)的存在。但如果我們的面部變得足夠“靈活”,比如,鼻子可伸縮,舌頭能打結,那 AI 肯定也會犯難。

還有一個讓“AI 畫不好手”傳播開來的原因,那就是:手一旦畫錯,真的是很明顯啊!

如果 AI 創(chuàng)造了一個比例不太對的肩膀,我們一般不會注意到畫面中這個人的肩膀窄了百分之五。但如果他們的拇指、食指、中指、無名指和小指都比平均水平小一點,那就容易顯得奇怪了。

這是受到人的固有感知影響。心理學有一個理論叫做“撒切爾效應”,1980 年由約克大學心理學教授彼得·湯普提出,當時他以撒切爾夫人的畫像作例。

撒切爾效應|Wikipedia

我們第一眼能看出什么?右圖的眼睛與嘴巴被上下顛倒了。你需要更仔細才能看出,左圖的五官實際上也是錯位的。

也就是說,錯位發(fā)生在正立的臉上很容易露餡,但發(fā)生在倒立的臉上就能騙過人。因為我們平日里很難見到倒立的臉,難以形成固有認知,所以在你把屏幕旋轉過來之前,很難看出不同。

而我們對手部太熟悉了,感知格外敏感。

AI 創(chuàng)作的“手”|Gagadget

教會 AI 畫手,有啥方法嗎?

不得不說,人類在提升 AI 畫技方面,也是“卷”得孜孜不倦。

今年初,一個叫“ControlNet”的新 AI 插件在 GitHub 上爆火,如今已收獲超過 10k 星。

簡單來說,這個插件通過給 Stable Diffusion 這樣的 AI 作畫模型增加一個額外輸入,來優(yōu)化生成的細節(jié),相當于給 AI 創(chuàng)作加了一層 buff。

效果的確比之前過于抽象的手部創(chuàng)作靠譜了些,但如果仔細看的話,你還是會發(fā)現(xiàn)……咦,怎么一共有 6 個手指?

點開放大,數(shù)數(shù)一共幾個手指|Github

也有一些比較取巧的方法。比如,有人傳授經(jīng)驗:要想讓 AI 畫出一只正常的手,你只需要告訴它“mittens”(手套)這一個詞,往往在有手套的圖片中,五個手指根根分明,且沒有什么特殊的手勢。

一雙手套|Gagadget

或者告訴它“結婚戒指”、“指甲油”這兩個詞。AI 往往就能搜索到很多高清的手部照片,降低畫殘概率。

戒指或指甲油|Gagadget

說到底,這些都屬于一些幫助 AI 偷懶的小技巧,要論畫手的真實力,AI 還是咱們?nèi)祟?,都得好好學習?。?/p>

參考文獻

[1] https://www.thepaper.cn/newsDetail_forward_21992745

[2]https://www.pingwest.com/a/191335#:~:text=%E5%85%B3%E4%BA%8E%E8%BF%99%E4%B8%80%E7%82%B9%EF%BC%8C%E8%91%97%E5%90%8D%E7%9A%84,%E4%BA%BA%E4%BB%AC%E7%9C%8B%E5%BE%97%E6%9B%B4%E6%B8%85%E6%A5%9A%E3%80%82

[3]https://www.sciencefocus.com/future-technology/why-ai-generated-hands-are-the-stuff-of-nightmares-explained-by-a-scientist/

[4]https://bootcamp.uxdesign.cc/how-to-draw-hands-with-an-ai-image-generator-776ce3a814fe

一個AI

關鍵詞:

相關閱讀:
熱點
圖片 圖片