鳳凰科技訊(作者/二維馬)12月14日消息,搜狗今日推出了一種人機(jī)交互新技術(shù)唇語(yǔ)識(shí)別,通過(guò)機(jī)器視覺(jué)識(shí)別說(shuō)話(huà)人唇部動(dòng)作,來(lái)解讀說(shuō)話(huà)者所說(shuō)的內(nèi)容。
搜狗官方表示,通過(guò)復(fù)雜端到端深度神經(jīng)網(wǎng)絡(luò)技術(shù)進(jìn)行中文唇語(yǔ)序列建模,經(jīng)過(guò)數(shù)千小時(shí)的真實(shí)唇語(yǔ)數(shù)據(jù)訓(xùn)練,終于取得了唇語(yǔ)識(shí)別效果。在非特定人開(kāi)放口語(yǔ)測(cè)試集上,該系統(tǒng)達(dá)到60%以上的準(zhǔn)確率,超過(guò)google發(fā)布的英文唇語(yǔ)系統(tǒng)50%以上的準(zhǔn)確率,在垂直場(chǎng)景如車(chē)載、智能家居等場(chǎng)景下甚至已經(jīng)達(dá)到90%的準(zhǔn)確率。
作為人機(jī)交互的形式之一,未來(lái)唇語(yǔ)識(shí)別技術(shù)可以輔助語(yǔ)音交互及圖像識(shí)別,在日常生活、安防、公益等各個(gè)領(lǐng)域?qū)崿F(xiàn)廣泛應(yīng)用。比如在車(chē)載場(chǎng)景下,周?chē)胍暨^(guò)大時(shí)會(huì)對(duì)語(yǔ)音指令產(chǎn)生干擾,通過(guò)唇語(yǔ)識(shí)別技術(shù)則可以規(guī)避干擾,保證人車(chē)交互的準(zhǔn)確性和穩(wěn)定性,日常不便發(fā)聲的公共場(chǎng)所也可以保證說(shuō)話(huà)內(nèi)容的私密性;在安防領(lǐng)域,由于目前多數(shù)監(jiān)控只有攝像頭沒(méi)有麥克風(fēng),往往只能看清嘴型卻不知道在說(shuō)什么,給案情分析帶來(lái)很多難題,而唇語(yǔ)識(shí)別技術(shù)可以幫助公安人員獲取重要的講話(huà)信息,為公共安全提供有效支持。除此之外,唇語(yǔ)識(shí)別技術(shù)還能發(fā)揮巨大的公益價(jià)值,幫助先天性聽(tīng)障人群或老年人,讓他們更好地理解和表達(dá)自己。
- QQ:61149512