讓語音識(shí)別分清“張”“章”,搜狗要開啟更自然的語音交互
“搜狗本來就是一家做AI(人工智能)的互聯(lián)網(wǎng)公司?!痹?月3日的搜狗“知音”語音交互引擎發(fā)布會(huì)上,CTO楊洪濤這樣說。當(dāng)天,搜狐網(wǎng)絡(luò)大廈電梯里的LED屏還在播放搜狗十周年生日的一段視頻。 也就是在搜狗輸入法十周年生日慶典上,CEO王小川曾表示:搜狗輸入法用戶規(guī)模已超過5.2億,無論在PC端還是移動(dòng)端,都領(lǐng)先其他競(jìng)爭(zhēng)者。搜狗輸入法的下一步是要不斷優(yōu)化自然語言處理技術(shù),向人工智能方向發(fā)展,尤其在涉及語音識(shí)別、語義理解以及人機(jī)交互方面的語音輸入領(lǐng)域。 從12年開始研發(fā)智能語音技術(shù),即便同科大訊飛等專精人工智能領(lǐng)域的企業(yè)相比,布局晚了許多,但搜狗依舊可以算是業(yè)內(nèi)老兵了,在搜狗輸入法和搜狗搜索中也都有語音交互的應(yīng)用。 在釘科技看來,這次發(fā)布會(huì)的意義,對(duì)搜狗而言,除了表明技術(shù)更加成熟之外,就是為與各領(lǐng)域伙伴的合作做一個(gè)鋪墊。楊洪濤在當(dāng)天也有類似的表述:知音引擎要具備開放的屬性。開放,就是在出行等垂直領(lǐng)域的延伸,為相關(guān)合作伙伴提供語音交互支持,向更多的總段入口進(jìn)行布局。
原創(chuàng)
2016-08-04 07:47:30
來源:釘科技??
作者:郭建輝

img_20160803_141333_副本.jpg

【釘科技,北京報(bào)道】“搜狗本來就是一家做AI(人工智能)的互聯(lián)網(wǎng)公司?!痹?月3日的搜狗“知音”語音交互引擎發(fā)布會(huì)上,CTO楊洪濤這樣說。當(dāng)天,搜狐網(wǎng)絡(luò)大廈電梯里的LED屏還在播放搜狗十周年生日的一段視頻。

也就是在搜狗輸入法十周年生日慶典上,CEO王小川曾表示:搜狗輸入法用戶規(guī)模已超過5.2億,無論在PC端還是移動(dòng)端,都領(lǐng)先其他競(jìng)爭(zhēng)者。搜狗輸入法的下一步是要不斷優(yōu)化自然語言處理技術(shù),向人工智能方向發(fā)展,尤其在涉及語音識(shí)別、語義理解以及人機(jī)交互方面的語音輸入領(lǐng)域。

從12年開始研發(fā)智能語音技術(shù),即便同科大訊飛等專精人工智能領(lǐng)域的企業(yè)相比,布局晚了許多,但搜狗依舊可以算是業(yè)內(nèi)老兵了,在搜狗輸入法和搜狗搜索中也都有語音交互的應(yīng)用。

在釘科技看來,這次發(fā)布會(huì)的意義,對(duì)搜狗而言,除了表明技術(shù)更加成熟之外,就是為與各領(lǐng)域伙伴的合作做一個(gè)鋪墊。楊洪濤在當(dāng)天也有類似的表述:知音引擎要具備開放的屬性。開放,就是在出行等垂直領(lǐng)域的延伸,為相關(guān)合作伙伴提供語音交互支持,向更多的總段入口進(jìn)行布局。

img_20160803_142406_副本.jpg

搜狗語音交互技術(shù)中心負(fù)責(zé)人王硯峰介紹,在今年3月份針對(duì)搜狗、訊飛、百度三家的語音引擎的第三方評(píng)測(cè)中,搜狗與訊飛能力持平,整體領(lǐng)先百度。

在現(xiàn)場(chǎng)播放的橫向?qū)Ρ纫曨l和體驗(yàn)中,釘科技的直觀感受是,搜狗知音在相關(guān)內(nèi)容的連續(xù)延伸搜索方面有比較好的表現(xiàn),可以順暢進(jìn)行多輪對(duì)話。能夠處理更復(fù)雜的用戶交互邏輯,用更自然并且用戶更容易接受和理解的方式進(jìn)行交互,更好地感知用戶語音請(qǐng)求背后的真正需求,從而提供更為便捷的人性化服務(wù)。

例如,當(dāng)用戶說我要去首都機(jī)場(chǎng),它會(huì)問T1還是T2,當(dāng)用戶確定航站樓后,它會(huì)問是出發(fā)還是接人。

讓熱印象比較深刻的是,在語音輸入章XX時(shí),首次轉(zhuǎn)換的文字為“張”,當(dāng)使用者說改為立早“章”之后,文字得到了糾正,這在一些場(chǎng)景,比如駕駛場(chǎng)景中,是相當(dāng)方便的,也能更好地保證駕駛員的安全。

知音的知也恰恰在這些方面得到了體現(xiàn)。

王硯峰表示,“知音”在語音識(shí)別、語音糾錯(cuò)、知識(shí)圖譜信息整合能力及多輪對(duì)話理解方面具有技術(shù)優(yōu)勢(shì)。而這種優(yōu)勢(shì),在搜狗方面看來,得益于輸入法及搜索積累下來的大量數(shù)據(jù)對(duì)于其語義理解能力的錘煉。

釘科技認(rèn)為,搜索引擎團(tuán)隊(duì)適合拓展人工智能業(yè)務(wù)的原因之一也正在于可以占有和調(diào)用足夠量的數(shù)據(jù),而且這些數(shù)據(jù)具備相當(dāng)?shù)臅r(shí)效性和活性。

img_20160803_142929_副本.jpg

搜狗方面羅列了一組數(shù)據(jù):搜狗在線語音輸入法語音助手請(qǐng)求次數(shù)超過1.4億次, 用戶每天使用率占8%。依托于深度學(xué)習(xí)的語義理解,搜狗語義引擎較2013年應(yīng)用之初錯(cuò)誤率降低了60%,較2015年降低了30%。

搜狗輸入法用戶每天能產(chǎn)生的預(yù)料規(guī)模達(dá)到11.7萬小時(shí),這比當(dāng)前任何語音技術(shù)團(tuán)隊(duì)所使用的預(yù)料規(guī)模都要大。此外,搜狗表示正在通過端到端的模型、主動(dòng)積累錯(cuò)誤反饋、線上部署GPU加速等手段促進(jìn)機(jī)器語義理解的智能性。在談及要提高語義理解能力需要基于優(yōu)質(zhì)的、大規(guī)模材料時(shí),楊洪濤這樣表述。

語音識(shí)別、語音交互、語義理解,在這些層面,搜狗知音都比之前的語音應(yīng)用更加成熟。當(dāng)然,在釘科技看來,知音距離不僅“能聽會(huì)說”,還“能理解會(huì)思考”尚有一段距離。

真正的理解和思考,或許正如楊洪濤所說,就是能夠替代人做出合乎實(shí)際的判斷和選擇,在這個(gè)層面上,知音還需要學(xué)習(xí),足夠成熟的時(shí)候,或許就不需要用戶再通過額外的交互將“張”改為“章”(當(dāng)然,搜狗方面的用意主要在于出現(xiàn)錯(cuò)誤時(shí)方便修改)。

img_20160803_143636_副本.jpg

楊洪濤表示,不久之后,搜狗將會(huì)發(fā)布相關(guān)的語音文字高準(zhǔn)確率轉(zhuǎn)換的小應(yīng)用,目標(biāo)人群主要是媒體記者等文字工作者,或許能夠幫助記者實(shí)現(xiàn)“用嘴寫稿”的夢(mèng)想。

最新文章
1
長(zhǎng)虹派發(fā)超10億元消費(fèi)大禮包,助力家電“以舊換新”
2
AI風(fēng)潮洶涌而來 海信AI電視重塑音畫交互新體驗(yàn)
3
FPGA可堪大算力?
4
全球液晶電視面板最新出貨量:國(guó)屏一哥京東方第一
5
iPhone 16全球價(jià)格對(duì)比:中國(guó)最便宜!比均價(jià)低1200元
6
一加13性能跑分:多核過萬分超蘋果A18,目前最強(qiáng)!
7
補(bǔ)貼力度大、范圍廣,家電以舊換新活動(dòng)效果拉滿
8
海信發(fā)布全新一代AI電視,引領(lǐng)AI畫質(zhì)新標(biāo)桿
9
海信AI電視E7N正式發(fā)布,引領(lǐng)AI畫質(zhì)新標(biāo)桿
10
十一黃金周的百吋風(fēng)潮,海信電視率先刮起來了
11
快手游戲廠牌彈指宇宙 亮相2024東京電玩展
12
快手電商以舊換新政府補(bǔ)貼活動(dòng)上線 冰箱、洗衣機(jī)等8大品類享8折優(yōu)惠
13
聯(lián)想ThinkPad與英特爾攜手亮相2024抖音創(chuàng)作者大會(huì),加速生成式AI創(chuàng)作
14
英特爾發(fā)布至強(qiáng)6性能核處理器
15
蘋果iPhone 16首周銷量出爐,究竟是大漲還是不如預(yù)期?
16
5G標(biāo)準(zhǔn)必要專利小米中國(guó)第三!僅次于華為中興 雷軍:繼續(xù)死磕核心技術(shù)
17
奔馳、寶馬、大眾接連發(fā)聲:愿與中國(guó)加強(qiáng)新能源汽車合作
18
萬元機(jī)皇就差蘋果了!三星S25 Ultra國(guó)行版支持衛(wèi)星通信
19
ColorOS九月更新消息:Car+車聯(lián)功能、小布升級(jí)等功能
20
邊看電視邊度假 長(zhǎng)虹電視如何挖掘客廳場(chǎng)景新潛能
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512