自然語音交互背后的京東智能音箱場景革命
2014年,基于對語音交互應用未來的高度認可,京東與訊飛一起出資成立靈隆科技,旨在推出更好用的以語音為交互入口的智能產(chǎn)品,首選切入點是音箱產(chǎn)品,這就是叮咚(DingDong)音箱。 目前叮咚(DingDong)音箱和亞馬遜Echo使用的技術和應用水平旗鼓相當,最大的區(qū)別在語音上,叮咚(DingDong)支持中文和簡單的英文,而Echo只支持英文。除此之外最重要的一點是叮咚(DingDong)采用了科大訊飛最新的語音人工智能技術AIUI,將語音交互提升到一個新的層次。
2016-11-01 15:46:49
來源:智東西??
作者:漠影

2014年,基于對語音交互應用未來的高度認可,京東與訊飛一起出資成立靈隆科技,旨在推出更好用的以語音為交互入口的智能產(chǎn)品,首選切入點是音箱產(chǎn)品,這就是叮咚(DingDong)音箱。

目前叮咚(DingDong)音箱和亞馬遜Echo使用的技術和應用水平旗鼓相當,最大的區(qū)別在語音上,叮咚(DingDong)支持中文和簡單的英文,而Echo只支持英文。除此之外最重要的一點是叮咚(DingDong)采用了科大訊飛最新的語音人工智能技術AIUI,將語音交互提升到一個新的層次。

通過技術拆解、解讀,我們試圖找出叮咚(DingDong)音箱所使用的AIUI語音技術的核心創(chuàng)新之處,如何讓語音人機交互帶來新的革命,繼而賦予叮咚(DingDong)音箱這樣的產(chǎn)品新的玩法和生命力,進而帶來一場語音交互的場景革命。

一、從智能交互到智能家居場景革命

首先我們需要了解的是,京東旗下叮咚(DingDong)音箱在搭載AIUI語音交互技術后,帶來了哪些全新的體驗和實現(xiàn)方式,以及可見的智能家居場景革命,至少帶來三方面的改變: 

1、讓叮咚(DingDong)音箱成為體驗最好的WiFi智能音箱產(chǎn)品。 

從2015年啟動的叮咚(DingDong)音箱項目,已經(jīng)發(fā)展成為國內體驗最好的WiFi智能音箱產(chǎn)品之一,目前銷量在京東平臺第一,超過所有前十品牌之和;在技術上的最佳體現(xiàn)就是遠場識別、隨時打斷,以及在AIUI升級后實現(xiàn)的連續(xù)對話功能,在國內處于領先地位。

2、讓叮咚(DingDong)音箱的使用場景更為豐富。 

叮咚(DingDong)音箱可以讓用戶用語音操控微聯(lián)平臺上的上千款智能硬件設備,從而形成場景化的交互方式。 

比如,你只需發(fā)出“我回家了”的指令,屋內的燈光、空調、加濕器、電視等一系列用戶自定義的設備將會按照事先設置的程序自動開啟。徹底解放用戶的雙手,帶來前所未有的用戶體驗。 

3、為京東智能云語音服務平臺提供堅實技術基礎。 

基于叮咚(DingDong)音箱+AIUI語音交互的組合,京東智能推出了開放平臺計劃,讓語音技術的未來想象空間進一步擴大,成為京東布局智能家居的一步大棋。 

平臺入口將接入第三方服務平臺,首批接入的合作伙伴包括:中通快遞、e袋洗、百度地圖、京東到家、JIMI機器人等。眾多合作伙伴的加入,為叮咚(DingDong)的入口布局帶來了更加豐富的應用場景,不管是家政服務還是出行打車,用戶都可以通過語音來完成。 

未來通過叮咚(DingDong)與京東JIMI客服機器人的接通,用戶更可以語音查詢商品配送等信息。這種服務的升級,使得語音入口不僅僅局限于智能家居,而是支撐整個家庭數(shù)據(jù)生態(tài)的建立。 

二、AIUI的五大核心功能亮點 

接著我們再來拆解解讀背后的技術因素,AIUI是在2015年12月份訊飛的年度大會上首次推出,剛剛過去的10月份雙創(chuàng)周上AIUI第一次正式面市,叮咚(DingDong)音箱成為首批搭載的產(chǎn)品。目前國內80%以上的機器人廠商使用了訊飛的語音技術,前沿的玩家都在用AIUI,特別是像京東將叮咚(DingDong)音箱這樣的巨頭推動案例的加入。 

AIUI最核心強調的是“自然語音交互”,具體來說重要的是這幾方面的體現(xiàn): 

第一、遠場降噪,用語音同產(chǎn)品交互時,不用離它那么近,以叮咚(DingDong)音箱為例,距離五米內都能輕松把它喚醒。 

實現(xiàn)這一點,主要是運用了回音消除技術,消除量可以達到50dB。無論是穩(wěn)態(tài)的噪音抑制還是動態(tài)噪音抑制。還有音源定位技術,比如5麥克風的方案,定位鎖定角度只有正負10度偏差。據(jù)悉,5米距離的語音聽寫識別率已經(jīng)突破90%。 

第二、實現(xiàn)方言的識別,科大訊飛深耕語音十六年,已經(jīng)支持二十種方言的識別。 

第三,全雙工。以前人與機器進行語音交互時,有時候并沒聽你說,要么在做識別的動作,要么就是在說給你聽。AIUI可以實現(xiàn)聽的同時也在說,你可以隨時打斷它。 

第四,糾錯。糾錯的功能,比如在報十幾個數(shù)字的電話號碼時,可以讓機器用兩個數(shù)字換掉另外兩個,訊飛花了很多時間來做類似這樣的細節(jié)體驗。 

第五,多輪對話,就是像人和人之間的自然語音溝通,比如在講天氣這件事情,你提了杭州的天氣怎么樣,后面再問深圳的、北京的,機器會知道你是在說什么,想問什么。 

在交互體驗進行大幅度的提升后,AIUI還針對不同的場景對其能力作了區(qū)分。首先具有統(tǒng)一的接口和交互,接口上面會有麥克風陣列、語音喚醒、對話識別、對話閑聊等方面,這幾方面可以做靈活的搭配,從而呈現(xiàn)出不同的人機交互解決方案。AIUI的應用領域可延伸到車機、機器人、錄音轉寫這樣的專業(yè)市場。

三、如何做到和具備智能交互 

叮咚(DingDong)音箱使用過程中的幾個典型場景可以體現(xiàn)AIUI帶來的智能交互體驗,比如在溝通過程中,用戶的語言有方言口音并不用擔心,如果音箱正在播放音樂或講故事,只要呼出“叮咚(DingDong)、叮咚(DingDong)”就能直接打斷喚醒,再比如,即使相隔4~5米的范圍,叮咚(DingDong)音箱也能靈敏地感知到。 

上面幾點是如何做到的呢?傳統(tǒng)人機交互的鏈路比較簡單,中間如果有斷點,交互過程就會中斷,從語音識別到語義理解到合成語音,任何一點的打斷都會讓語音交互的體驗大打折扣,AIUI則是對這個溝通鏈條,進行了豐富和加強,特別是在人工智能方面。 

AIUI的語音交互鏈條上,通過硬件、軟件的技術進行一次大的提升。比如語音識別的部分,可以做定向識音;在硬件方面,四麥或多麥是一個平面就會把各個角度做劃分,如果用戶站在一個方向,麥克風會指向這個方向做定向語音識音。 

有了定向語音識音以后,后面幾個鏈路就會工作起來,可以實現(xiàn)遠場降噪,環(huán)境內回音消除也可通過麥克風。在語義理解也是這樣,在技術優(yōu)化方面完整的向前邁進了一步。 

四、結語 

總的來看,AIUI是面向智能硬件交互方案的一個平臺級的解決方案,無論是穿戴式設備還是家用設備,到機器人、到智能家居的解決方案,AIUI都可以提供最自然的人機交互的交互方案。 

很多特點已經(jīng)在叮咚(DingDong)音箱產(chǎn)品上得以體現(xiàn),在最近叮咚(DingDong)音箱公布語音交互開放平臺時,就特別提到叮咚(DingDong)音箱升級最新系統(tǒng)后,可以做到一次喚醒連續(xù)對話,正是AIUI的典型功能特色之一。 

基于出色的語音交互技術,在京東智能的平臺上,通過叮咚(DingDong)智能音箱,讓場景化的革命得以放大,不僅成為出色的語音交互助手、場景化的語音交互入口,更成為互聯(lián)網(wǎng)服務的分發(fā)平臺。

最新文章
1
長虹派發(fā)超10億元消費大禮包,助力家電“以舊換新”
2
AI風潮洶涌而來 海信AI電視重塑音畫交互新體驗
3
FPGA可堪大算力?
4
全球液晶電視面板最新出貨量:國屏一哥京東方第一
5
iPhone 16全球價格對比:中國最便宜!比均價低1200元
6
一加13性能跑分:多核過萬分超蘋果A18,目前最強!
7
補貼力度大、范圍廣,家電以舊換新活動效果拉滿
8
海信發(fā)布全新一代AI電視,引領AI畫質新標桿
9
海信AI電視E7N正式發(fā)布,引領AI畫質新標桿
10
十一黃金周的百吋風潮,海信電視率先刮起來了
11
快手游戲廠牌彈指宇宙 亮相2024東京電玩展
12
快手電商以舊換新政府補貼活動上線 冰箱、洗衣機等8大品類享8折優(yōu)惠
13
聯(lián)想ThinkPad與英特爾攜手亮相2024抖音創(chuàng)作者大會,加速生成式AI創(chuàng)作
14
英特爾發(fā)布至強6性能核處理器
15
蘋果iPhone 16首周銷量出爐,究竟是大漲還是不如預期?
16
5G標準必要專利小米中國第三!僅次于華為中興 雷軍:繼續(xù)死磕核心技術
17
奔馳、寶馬、大眾接連發(fā)聲:愿與中國加強新能源汽車合作
18
萬元機皇就差蘋果了!三星S25 Ultra國行版支持衛(wèi)星通信
19
ColorOS九月更新消息:Car+車聯(lián)功能、小布升級等功能
20
邊看電視邊度假 長虹電視如何挖掘客廳場景新潛能
關于我們

微信掃一掃,加關注

商務合作
  • QQ:61149512