AR屬不屬于人工智能?看完本文你就懂了
AR/VR常作為孿生兄弟被相提并論,被普遍認(rèn)為為應(yīng)用層新技術(shù)或者說是“智能可穿戴設(shè)備”,相比人工智能相對的“算法”標(biāo)簽,顯得不夠有深度有內(nèi)涵高大上,那AR和人工智能之間到底是什么關(guān)系?AR屬不屬于當(dāng)下我們認(rèn)知中的人工智能?2018年3月,上海市經(jīng)濟(jì)和信息化委員會(huì)公示了2018年第一批本市人工智能創(chuàng)新發(fā)展專項(xiàng)擬支持項(xiàng)目?!耙还灿?9家創(chuàng)新企業(yè)入圍,亮風(fēng)臺(tái)作為AR公司也入圍此次支持項(xiàng)目”亮風(fēng)臺(tái)工作人員
2018-05-30 08:30:04
來源:中國AR網(wǎng)??

AR/VR常作為孿生兄弟被相提并論,被普遍認(rèn)為為應(yīng)用層新技術(shù)或者說是“智能可穿戴設(shè)備”,相比人工智能相對的“算法”標(biāo)簽,顯得不夠有深度有內(nèi)涵高大上,那AR和人工智能之間到底是什么關(guān)系?AR屬不屬于當(dāng)下我們認(rèn)知中的人工智能?

AR屬不屬于人工智能?看完本文你就懂了 AR資訊

2018年3月,上海市經(jīng)濟(jì)和信息化委員會(huì)公示了2018年第一批本市人工智能創(chuàng)新發(fā)展專項(xiàng)擬支持項(xiàng)目?!耙还灿?9家創(chuàng)新企業(yè)入圍,亮風(fēng)臺(tái)作為AR公司也入圍此次支持項(xiàng)目”亮風(fēng)臺(tái)工作人員告訴青亭網(wǎng),這不是AR企業(yè)第一次被劃歸到人工智能,但這種歸類方式也并不常見。據(jù)了解此專項(xiàng)由經(jīng)信委與市財(cái)政局聯(lián)合開展,擬支持金額超過1億。

簡單梳理下AR的核心技術(shù)

AR(Augmented Reality),是在現(xiàn)實(shí)世界中疊加虛擬信息,也即給現(xiàn)實(shí)做“增強(qiáng)”,這種增強(qiáng)可以是來自視覺、聽覺乃至觸覺,主要的目的均是在感官上讓現(xiàn)實(shí)的世界和虛擬的世界融合在一起。

其中,對現(xiàn)實(shí)世界的認(rèn)知主要體現(xiàn)在視覺上,這需要通過攝像機(jī)來幫助獲取信息,以圖像和視頻的形式反饋。通過視頻分析,實(shí)現(xiàn)對三維世界環(huán)境的感知理解,比如場景的3D結(jié)構(gòu),里面有什么物體,在空間中的什么地方。而3D交互理解的目的是告知系統(tǒng)要“增強(qiáng)”的內(nèi)容。

這其中有幾個(gè)關(guān)鍵點(diǎn):

首先是3D環(huán)境理解。要理解看到的東西,主要依靠物體/場景的識(shí)別和定位技術(shù)。識(shí)別主要是用來觸發(fā)AR響應(yīng),而定位則是知道在什么地方疊加AR內(nèi)容。定位根據(jù)精度的不同也可以分為粗定位和細(xì)定位,粗定位就是給出一個(gè)大致的方位,比如區(qū)域和趨勢。而細(xì)定位可能需要精確到點(diǎn),比如3D坐標(biāo)系下的XYZ坐標(biāo)、物體的角度。根據(jù)應(yīng)用環(huán)境的不同,兩種維度的定位在AR中都有應(yīng)用需求。在AR領(lǐng)域,常見的檢測和識(shí)別任務(wù)有人臉檢測、行人檢測、車輛檢測、手勢識(shí)別、生物識(shí)別、情感識(shí)別、自然場景識(shí)別等。

在感知現(xiàn)實(shí)3D世界并和虛擬內(nèi)容融合后,需要以一定方式將這種虛實(shí)融合信息呈現(xiàn)出來,這里面需要的就是AR中的第二個(gè)關(guān)鍵技術(shù):顯示技術(shù), 目前大多數(shù)的AR系統(tǒng)采用透視式頭盔顯示器,這其中又分為視頻透視和光學(xué)透視,其他的代表有光場技術(shù)(主要因Magic Leap而顯名)、全息投影(在科幻影視劇作品中常出現(xiàn))等。

AR中的第三個(gè)關(guān)鍵技術(shù)在于人機(jī)交互,用以讓人和疊加后的虛擬信息互動(dòng),AR追求在觸摸按鍵之外自然的人機(jī)交互方式,比如語音、手勢、姿態(tài)、人臉等,用的比較多的語音跟手勢。

人工智能和AR的技術(shù)關(guān)聯(lián)

在人工智能領(lǐng)域有幾個(gè)概念常被提及,如深度學(xué)習(xí)(DL)、機(jī)器學(xué)習(xí)(ML),在學(xué)術(shù)領(lǐng)域包括人工智能(AI)在內(nèi)幾大領(lǐng)域均有自己的研究界限,而在普遍意義上,我們常說的是泛意的人工智能,涵括所有“讓機(jī)器像人一樣”的技術(shù)的應(yīng)用方向。

從這張圖也可以簡單一窺三者的關(guān)系,深度學(xué)習(xí)是實(shí)現(xiàn)機(jī)器學(xué)習(xí)的一種技術(shù)方式,而機(jī)器學(xué)習(xí)是為了讓機(jī)器變得智能,去達(dá)到人工智能??梢哉f人工智能是最終目標(biāo),而機(jī)器學(xué)習(xí)是為了實(shí)現(xiàn)這個(gè)目標(biāo)延伸出的一個(gè)技術(shù)方向。在這其中,還有另一個(gè)重要概念為計(jì)算機(jī)視覺(CV),主要來研究如何讓機(jī)器像人去“看”,是目前人工智能概念中的一個(gè)重要分支,這也是因?yàn)槿祟惈@取信息最主要的方式之一就是視覺,目前計(jì)算機(jī)視覺已經(jīng)在商業(yè)市場發(fā)揮價(jià)值,比如人臉識(shí)別;自動(dòng)駕駛中讀取交通信號(hào)和注意行人以導(dǎo)航;工業(yè)機(jī)器人用來檢測問題控制過程;三維環(huán)境的重建圖像的處理等等。這些概念既有區(qū)分也有一定范圍的重疊。

其中,2006年開始,Hinton引發(fā)的深度學(xué)習(xí)熱潮開始蔓延,在一定程度上帶動(dòng)了AI的又一次崛起,十年中,在包括語音識(shí)別、計(jì)算機(jī)視覺、自然語言處理在內(nèi)的多個(gè)領(lǐng)域取得重大突破,并向應(yīng)用領(lǐng)域延伸,正發(fā)展的如火如荼。

在AR的核心技術(shù)中,3D環(huán)境理解、3D交互理解和計(jì)算機(jī)視覺、深度學(xué)習(xí)都有著緊密的聯(lián)系。3D環(huán)境理解在學(xué)術(shù)界里主要對應(yīng)的是計(jì)算機(jī)視覺領(lǐng)域,而近年來深度學(xué)習(xí)在計(jì)算機(jī)視覺中得到廣泛應(yīng)用。交互方面,更趨自然的交互方式如手勢和語音在硬件終端的使用,得益于近幾年深度學(xué)習(xí)在相關(guān)領(lǐng)域的突破。也可以說,深度學(xué)習(xí)在AR中應(yīng)用主要在視覺關(guān)鍵技術(shù)。

目前,AR最常見的形式是2D圖片掃描識(shí)別,如騰訊QQ-AR火炬活動(dòng)、支付寶五福等多數(shù)AR營銷中所見,用手機(jī)掃描識(shí)別圖出現(xiàn)疊加的內(nèi)容,但主要的研發(fā)方向還在3D物體識(shí)別和3D場景建模。

現(xiàn)實(shí)的物體是以3D形態(tài)存在的,有不同的角度和空間方位。所以一個(gè)自然的擴(kuò)展就是從2D圖片識(shí)別到3D物體識(shí)別,識(shí)別物體的類別和姿態(tài),深度學(xué)習(xí)可以用在這里。以水果識(shí)別為例,識(shí)別不同類別的水果,并且給出定位區(qū)域,即集成了物體識(shí)別與檢測的功能。

3D場景建模,從識(shí)別3D物體擴(kuò)大到更大更復(fù)雜的3D區(qū)域。比如識(shí)別場景里面有哪些東西、它們的空間位置和相互關(guān)系等等,這就是3D場景建模,是AR比較核心的技術(shù)。這其中涉及目前熱門的SLAM(實(shí)時(shí)定位與地圖構(gòu)建)。通過掃描某個(gè)場景,然后在上面疊加虛擬戰(zhàn)場等三維虛擬內(nèi)容。如果只是基于普通2D圖像識(shí)別就需要有特定的圖片,而在圖片不可見時(shí)會(huì)識(shí)別失敗。而在SLAM技術(shù)里面,即使特定平面不存在,但是空間定位依然非常精確,就是因?yàn)橛兄車?D環(huán)境的幫助。

這里想探討下深度學(xué)習(xí)和SLAM技術(shù)的融合,計(jì)算機(jī)視覺大體上可以分兩個(gè)流派,一種基于學(xué)習(xí)的思路,例如特征提取-特征分析-分類,目前深度學(xué)習(xí)技術(shù)在這一路線上取得了主導(dǎo)性的地位。另外一種路線是基于幾何的視覺,從線條、邊緣、3D形狀推出物體的空間結(jié)構(gòu)信息,代表性的技術(shù)就是SFM/SLAM?;趯W(xué)習(xí)的方向上深度學(xué)習(xí)基本上一統(tǒng)天下,但是在基于幾何視覺的領(lǐng)域,目前相關(guān)的進(jìn)展還很少。從學(xué)術(shù)界而言,深度學(xué)習(xí)技術(shù)的研究進(jìn)展可以說日新月異,而SLAM技術(shù)最新十年的進(jìn)展相對較少。在國際視覺頂級(jí)會(huì)議ICCV 2015年度組織的SLAM技術(shù)專題討論會(huì)上,基于近年深度學(xué)習(xí)在視覺其它領(lǐng)域的快速發(fā)展,有與會(huì)專家曾提出SLAM中采用深度學(xué)習(xí)的可能性,但是目前還沒有成熟的思路??傮w而言,短期內(nèi)將深度學(xué)習(xí)和SLAM融合是一個(gè)值得研究的方向,長遠(yuǎn)來看聯(lián)合語義和幾何信息是一個(gè)非常有價(jià)值的趨勢。因此,SLAM+DL值得期待。

在交互方式方面,主要的包括語音識(shí)別和手勢識(shí)別,語音識(shí)別在目前已經(jīng)取得了較大進(jìn)展,國內(nèi)如百度、科大訊飛、云知聲等都是其中的佼佼者,AR公司更想突破的是手勢識(shí)別的成熟商業(yè)化。

“亮風(fēng)臺(tái)展示過的一款基于深度學(xué)習(xí)的手勢識(shí)別系統(tǒng),主要定義了上下左右、順時(shí)針、逆時(shí)針六種手勢”亮風(fēng)臺(tái)工作人員告訴青亭網(wǎng),先實(shí)現(xiàn)人手的檢測和定位,然后通過識(shí)別相應(yīng)的手勢軌跡來實(shí)現(xiàn)對人手勢的識(shí)別。雖然人臉識(shí)別等其他人工智能熱門領(lǐng)域在AR中也有使用,但不是AR公司重要的研發(fā)方向。

以上不難看出,AR的底層技術(shù)或者說基礎(chǔ)部分是計(jì)算機(jī)視覺以及關(guān)聯(lián)領(lǐng)域的融合,而當(dāng)下熱門的深度學(xué)習(xí)和AR的結(jié)合,也是算法工程師們的努力方向。這也是AR為計(jì)算機(jī)視覺與人機(jī)交互的交叉學(xué)科,AR的基礎(chǔ)是人工智能和計(jì)算機(jī)視覺等說法的依據(jù)。

在去年今日頭條發(fā)布的《人工智能影響力報(bào)告》中也簡單統(tǒng)計(jì)了人工智能科學(xué)家的分布情況,這其中包括人臉識(shí)別、語音識(shí)別、機(jī)器人、AR、芯片等領(lǐng)域的公司與大型研發(fā)機(jī)構(gòu),高端研發(fā)人員的分布也說明了AI領(lǐng)域的細(xì)分方向。

那AR究竟是不是人工智能?

對AR從業(yè)者來說,理想的狀態(tài)是用更智能的AR終端去取代智能手機(jī),所以對于用戶來說接觸使用AR首先受影響的是內(nèi)容,其次是終端,AR產(chǎn)業(yè)鏈可以粗略劃分為技術(shù)提供商、智能終端研發(fā)公司,以及AR內(nèi)容提供商。在這其中,AR設(shè)備提供商不可避免關(guān)注硬件技術(shù),如底層的芯片、電池、光學(xué)鏡片等,以及硬件本身的性能優(yōu)化,而內(nèi)容提供商更傾向于在現(xiàn)有技術(shù)基礎(chǔ)上優(yōu)化內(nèi)容及表現(xiàn)。所以我們可以說AR技術(shù)提供商,或者說在底層算法研發(fā)上有一定成績的AR公司是人工智能公司。

對公司來說,特別是創(chuàng)企會(huì)把底層技術(shù)轉(zhuǎn)化為成熟的產(chǎn)品或服務(wù),這可能是如無人機(jī)、AR智能終端、機(jī)器人等,也可能是行業(yè)解決方案,以達(dá)到商業(yè)目的,并且這已經(jīng)成為在沸騰聲音之后,媒體、企業(yè)以及大眾對AI企業(yè)的期待和要求。近期,人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟(AIIA)出版的圖書《人工智能浪潮:科技改變生活的100個(gè)前沿AI應(yīng)用》將對外發(fā)布,以及涵括了目前巨頭公司以及創(chuàng)企在商業(yè)化上的前沿成果,也直接反映了AI目前的主要商業(yè)化方向。

作為技術(shù)驅(qū)動(dòng)的商業(yè)領(lǐng)域,無論是AR還是人工智能的其他多數(shù)方向,技術(shù)距離完全成熟還有很長的路程要走,在整個(gè)產(chǎn)業(yè)鏈逐漸繁榮,關(guān)注商業(yè)化實(shí)現(xiàn)的同時(shí),也需要有更多公司機(jī)構(gòu)去不斷拓展技術(shù)邊界,建立核心競爭力,讓行業(yè)爆發(fā)更大的價(jià)值與潛力,如此,AI時(shí)代中國彎道超車當(dāng)可期。

最新文章
1
相繼推新,三星和索尼為啥都在加碼激光顯示?
2
《黑神話:悟空》帶火PC硬件!中國電競顯示器8月銷量飆升56.7%
3
家電應(yīng)用場景延伸,“移動(dòng)的家”打開增長新空間
4
量價(jià)齊升 排產(chǎn)高增 空調(diào)市場好起來了?
5
海光在通用CPU上內(nèi)置安全功能模塊,可更好替代外置加密卡
6
以舊換新助力家電行業(yè)逆勢回暖,預(yù)計(jì)十一家電將迎熱銷高峰
7
天璣9400性能爆表,GPU引領(lǐng)安卓陣營超越蘋果A18 Pro!
8
華為nova Flip新增Call-emoji樣式,后續(xù)支持用戶自定義
9
激光電視技術(shù)革新:從細(xì)節(jié)出發(fā),重構(gòu)顯示世界
10
性能真旗艦 續(xù)航超旗艦 iQOO Z9 Turbo+ 2199元起正式發(fā)布
11
科技點(diǎn)亮未來,創(chuàng)新賦能下一代:索尼探夢科普萬里行再進(jìn)湖北
12
索尼研究公司與新加坡全國人工智能核心簽署備忘錄,合作研究東南亞大語言模型
13
索尼宣布與Cellares聯(lián)合開發(fā)基于流式分選和在線分析技術(shù)的自動(dòng)化、高通量 細(xì)胞治療生產(chǎn)平臺(tái)
14
以技術(shù)為基,索尼與墨爾本大學(xué)共同開發(fā)領(lǐng)先的外科培訓(xùn)項(xiàng)目
15
“快舟·inne號(hào)”火箭發(fā)射升空,探索育兒與科技創(chuàng)新的無限可能
16
掃地機(jī)市場競爭烈度加劇,科沃斯石頭追覓云鯨小米表現(xiàn)如何?
17
消費(fèi)電子行業(yè)的即時(shí)零售,“人貨場”是如何進(jìn)化的?
18
又明年有望?全新Siri加持Apple Intelligence,明年1月或?qū)⒌菆?/a>
19
2024年凈化器雙十一預(yù)測:雙十一仍將保持20%高增長
20
10月排產(chǎn)增長23%,空調(diào)市場又好起來了?
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512