我們擅長(zhǎng)商業(yè)策略與用戶體驗(yàn)的完美結(jié)合。
歡迎瀏覽我們的案例。
機(jī)器學(xué)習(xí)模型已經(jīng)變得非常擅長(zhǎng)生成逼真的人臉,逼真到我可能永遠(yuǎn)不會(huì)再相信一個(gè)機(jī)器或人類是真實(shí)的。這種由英偉達(dá)(Nvidia)研究人員開(kāi)發(fā)的新方法可以分離面部的細(xì)節(jié)層次,并對(duì)它們進(jìn)行單獨(dú)調(diào)整,以此實(shí)現(xiàn)超越其他方法的效果。最終生成的圖像非常非常逼真。
研究人員的 論文發(fā)表在預(yù)印本網(wǎng)站 Arxiv 上,其中描述了一種生成和混合圖像(特別是人臉)的新架構(gòu),可以“帶來(lái)更好的插值特性,而且也能更好地解析變化的潛在因素”。
這基本上意味著該系統(tǒng)能夠更好地意識(shí)到圖像之間有意義的變化,并且在各種尺度上都能進(jìn)行引導(dǎo)。舉例來(lái)說(shuō),研究人員的 舊系統(tǒng) 可能生成兩張“不同”的面孔,但除了一個(gè)人的耳朵被擦除以及襯衫顏色不同之外,它們基本上是一樣的。那不是真正的不同,但系統(tǒng)并不知道無(wú)需重點(diǎn)關(guān)注圖像的這些組成部分。
新系統(tǒng)的靈感源自所謂的風(fēng)格轉(zhuǎn)移,也就是對(duì)圖像(比如說(shuō)一張畫(huà))的重要風(fēng)格特征進(jìn)行提取,并應(yīng)用到另一張圖像的創(chuàng)作當(dāng)中,如果一切順利的話,最終得到的圖像應(yīng)該跟原來(lái)的擁有類似外觀。就生成面孔而言,這里的“風(fēng)格”并不是指筆觸或顏色分布,而是圖像的構(gòu)成(居中,靠左或靠右,諸如此類)以及臉部的生理特點(diǎn)(膚色、雀斑以及毛發(fā))。
這些風(fēng)格特征或大或小,尺度各異——在非常小的時(shí)候,它可能是面部的單個(gè)特征;在中間的時(shí)候,它可能是鏡頭的構(gòu)成;在最大尺度上,它就是圖像整體色調(diào)之類的東西。讓系統(tǒng)對(duì)所有這些特征進(jìn)行調(diào)整,整張圖像就會(huì)發(fā)生變化;與此同時(shí),僅僅調(diào)整一部分可能只會(huì)改變一個(gè)人的發(fā)色,或者是雀斑或面部毛發(fā)的分布。
在最上面的圖像中,我們可以看到面孔是如何發(fā)生徹底變化的,但“來(lái)源”和“風(fēng)格”的明顯標(biāo)記仍然被保留下來(lái),比如最底下一行的藍(lán)色襯衫。在其他情形中,衣服是用整塊布料生成的,就比如中心位置那個(gè)小孩貌似穿著和服一樣。它是從哪兒來(lái)的呢?請(qǐng)注意,所有這些都是完全可變的,并不是 A+B=C,而是取決于設(shè)置選項(xiàng)的調(diào)整方式,A 和 B 的所有因素都存在或都不存在。
這些人臉都不是來(lái)自真實(shí)的人類,但如果你說(shuō)它們是某個(gè)人設(shè)置的個(gè)人頭像,我絲毫不會(huì)起疑。面部生成器現(xiàn)在已經(jīng)能夠不斷地生成外觀完全正常的人類圖像,想想還是有點(diǎn)可怕。下面是更多的例子:
它的效果還不完美,但的確有效。而且,能夠生成的不僅僅是人類,汽車、貓和風(fēng)景,這些事物或多或少都符合相同的范式,即擁有可以分離并進(jìn)行單獨(dú)再現(xiàn)的小、中、大風(fēng)格特征。對(duì)我個(gè)人而言,一個(gè)能夠生成無(wú)限數(shù)量喵星人的系統(tǒng)似乎更加有趣。
此外,這些研究人員還發(fā)布了一個(gè)新的面部數(shù)據(jù)集:70,000 張(經(jīng)過(guò)許可)從 Flickr 采集的面部圖像,全都經(jīng)過(guò)對(duì)齊和剪裁。他們使用亞馬遜的眾包服務(wù) Mechanical Turk 清除掉了雕像、繪畫(huà)和其他異常值。鑒于此類項(xiàng)目使用的標(biāo)準(zhǔn)數(shù)據(jù)集主要是明星走紅毯的照片,這應(yīng)該能夠提供擁有更多變化的面部數(shù)據(jù)集來(lái)開(kāi)展研究。
(邯鄲網(wǎng)絡(luò)公司)
小米應(yīng)用商店發(fā)布消息稱 持續(xù)開(kāi)展“APP 侵害用戶權(quán)益治理”系列行動(dòng) 11:37:04
騰訊云與CSIG成立政企業(yè)務(wù)線 加速數(shù)字技術(shù)在實(shí)體經(jīng)濟(jì)中的落地和應(yīng)用 11:34:49
樂(lè)視回應(yīng)還有400多人 期待新的朋友加入 11:29:25
亞馬遜表示 公司正在將其智能購(gòu)物車擴(kuò)展到馬薩諸塞州的一家全食店 10:18:04
三星在元宇宙平臺(tái)推出游戲 玩家可收集原材料制作三星產(chǎn)品 09:57:29
特斯拉加州San Mateo裁減229名員工 永久關(guān)閉該地區(qū)分公司 09:53:13