導(dǎo)讀:動態(tài),意味著自運行?聽上去倒是有點像修仙小說里的“小千世界”了!
【釘科技編譯】在今年的GPU技術(shù)大會上,F(xiàn)acebook 的人工智能團(tuán)隊展示了可以讓用戶生成基于文本描述的獨特影像(釘:這句簡直是玄之又玄)的神經(jīng)網(wǎng)絡(luò)。團(tuán)隊成員首先鍵入了“海灘”一詞,之后就出現(xiàn)了一片油畫般的沙灘。因為影像中有一大片云,他們鍵入了“海灘—云”,一片新的萬里無云藍(lán)天下的沙灘就出現(xiàn)了。(釘:沒搞懂,這里的意思是說技術(shù)有問題嗎)最后,他們鍵入“夕陽下的海灘-云”,橙色日落下的海灘就出現(xiàn)了。
作為一種嘗試模仿人腦運行方式的算法,神經(jīng)網(wǎng)絡(luò)已經(jīng)成了人工智能領(lǐng)域的寵兒。
Facebook 所做的就是用圖片訓(xùn)練他們的神經(jīng)網(wǎng)絡(luò),把某些特定的單詞和特定的圖像類型聯(lián)系起來,圖片的數(shù)量達(dá)到數(shù)百萬。(釘:好像也不是很多)
技術(shù)的關(guān)鍵在于提高系統(tǒng)結(jié)合圖文的能力,要通過各種要素進(jìn)行識別,這樣才能做到面熟之后,立即成像。
首先進(jìn)行的是2D圖像的訓(xùn)練,比如油畫,同時,如果應(yīng)用到3D領(lǐng)域,這項技術(shù)應(yīng)該會大有可為。構(gòu)建一個虛擬現(xiàn)實空間需要大量的3D素材,如果能夠憑借描述生成,將會大大縮短制作周期,現(xiàn)在看來,這個目標(biāo)應(yīng)該并不遙遠(yuǎn)。
谷歌的DeepMind神經(jīng)網(wǎng)絡(luò),從2D到3D的發(fā)展過程不到一年。
當(dāng)然,說是一回事,實際操作中總會遇到很多困難的。首先要調(diào)整識別算法,從2D升級到3D,當(dāng)然視覺計算和三維運算都會推動這一進(jìn)程;其次,因特網(wǎng)上并沒有足夠的3D素材來供給訓(xùn)練,開發(fā)者需要找到結(jié)合2D與3D圖像識別的方式,一個令人比較振奮的消息是虛擬現(xiàn)實(VR)和增強(qiáng)現(xiàn)實(AR)技術(shù)的普及會帶來更多的素材。(釘:高興地太早了,先普及了再說吧,把希望寄托在外力智商總是很不靠譜的做法。)
筆者認(rèn)為,十年內(nèi)能夠生成3D影像的神經(jīng)網(wǎng)絡(luò)將問世。這項技術(shù)會讓虛擬世界的建構(gòu)變得簡單,像標(biāo)題中說的一樣。(釘:一樣你大爺,全文也沒發(fā)現(xiàn)“動態(tài)”這個概念,這作者一定是猴子請來的……)
(編譯:釘科技小灰 From:uploadvr by:SKY NITE)
- QQ:61149512