AI大熱。
相比于算法的進步,人工智能在產(chǎn)品化和商業(yè)化層面還稍顯滯后。
當(dāng)下人工智能更多以To B的產(chǎn)品形態(tài)存在,而消費級產(chǎn)品雖在很早以前便充斥于市場中,但欠佳的用戶體驗與較慢的用戶接受度,使其直至現(xiàn)在仍舊難以進入主流。
相比而言,手機是一款普及度和使用頻率均非常高的消費級產(chǎn)品,與此同時,手機每天也可產(chǎn)生無數(shù)連續(xù)性的用戶操作數(shù)據(jù)和傳感器采集數(shù)據(jù)。因此,手機這一終端無疑是AI的最佳載體之一。
然而,雖然AI在手機端大有可為,但現(xiàn)階段依舊存在不少問題。
1、語音交互系統(tǒng)之殤
多年來,不少手機廠商多次嘗試在手機內(nèi)置入語音助手,其中Siri是用戶最為熟知的一個。Siri至今已推出6年時間,經(jīng)過這么多年的不斷打磨和優(yōu)化,表現(xiàn)并不能讓用戶滿意。
不止是Siri,其實無論是側(cè)重于閑聊的Chatbot,還是側(cè)重于任務(wù)處理的虛擬助理,在現(xiàn)階段仍然不成熟。
主要由于兩大原因:一是時機未到,其次技術(shù)(主要是NLP自然語言處理)還有很長的路要走。
①時機未到
時機未到,主要包括用戶尚未養(yǎng)成用使用語音交互的習(xí)慣,此外整個市場也處于培育階段。
科大訊飛執(zhí)行總裁胡郁曾指出,2014年科大訊飛與一手機巨頭簽署戰(zhàn)略合作,把語音交互技術(shù)應(yīng)用在他們的手機產(chǎn)品中。直到2017年,科大訊飛仍舊覺得語音交互系統(tǒng)在手機產(chǎn)品中的應(yīng)用時機未到,并不能排在最前面。
“根據(jù)經(jīng)驗,語音交互系統(tǒng)植入在硬件產(chǎn)品中的優(yōu)先級:首先是電視、機頂盒和冰箱,再到手機、機器人,最后才是VR?!焙粽劦?。
②技術(shù)難以突破
NLP是語音交互系統(tǒng)的核心技術(shù),然而中國科學(xué)院智能技術(shù)研究專家張鈸院士曾指出目前NLP難以突破人工智能,主要原因是難以突破確定性、完全的知識和信息,以及封閉化和特定化問題的三大基本限制條件。
張鈸院士用一個例子指出當(dāng)下NLP中的問題“一年以前,如果我和微軟小冰聊天。我說我叫張鈸,小冰就會傻眼了。因為它的語料庫里沒有我的信息。我如果說我是章子怡,小冰就應(yīng)該可以聊下去?!?/p>
2、手機AI芯片:看似前沿,實則應(yīng)用場景有限
鑒于英偉達、賽靈思的GPU、FPGA在AI市場上的優(yōu)秀表現(xiàn),很多人認為,手機AI芯片的時代也要到來。
近期,華為發(fā)布了手機專用AI芯片:麒麟970。
根據(jù)官方介紹,麒麟970在人臉識別、圖像處理和語音方面獲得前所未有的能力,提升手機應(yīng)用體驗的豐富性和效率。
這里筆者有個疑問,手機有必要用AI芯片嗎?
如華為官方所言,AI芯片更多是提高語音和圖像在本地的處理能力。但大規(guī)模的計算任務(wù)完全可以在云端完成,只有非常少的場景,才需要在本地處理。
哪些需要本地處理?
以我們熟知的圖片處理軟件Prisma為例,它能夠過人工智能把你手機中那些普通的照片模仿出著名藝術(shù)家畫作的風(fēng)格。
幾乎所有用戶都抱怨Prisma處理圖像等待的時間過久,主要因為圖像處理放在服務(wù)器和云端處理時間較長,但放在本地則面臨手機芯片吃不消的問題,一旦吃不消又會導(dǎo)致處理時間延長。
之后Prisma雖然實現(xiàn)了手機本地計算,通過大量優(yōu)化顯著降低了模型的復(fù)雜度(這樣做的負面影響導(dǎo)致效果變差),但對于手機CPU來說仍然負荷很大,速度仍然比較緩慢,部分風(fēng)格濾鏡需要計算10秒以上才能完成圖片轉(zhuǎn)換。
因此,類似Prisma這種復(fù)雜的場景,才往往需要手機專用AI芯片。
我們可以看到,麒麟970的主要作用是讓手機自身擁有承載深度神經(jīng)網(wǎng)絡(luò)的強大計算力,讓Prisma等這類需要跑在深度神經(jīng)網(wǎng)絡(luò)上的應(yīng)用提升體驗。
但實際上絕大多數(shù)應(yīng)用沒必要用深度網(wǎng)絡(luò)加速芯片去加速,一方面普通的手機芯片也可承載大多任務(wù),另一方面,復(fù)雜的任務(wù)云端也可保質(zhì)保量地解決。
目前智能手機上需要用到AI芯片去加速的應(yīng)用并沒有很多。雖然未來會有發(fā)揮的潛力,但現(xiàn)階段應(yīng)用場景十分有限。
3、什么AI功能才是手機的剛需?
在人工智能主流環(huán)境下,人們更多崇尚“算法為王”。但不少業(yè)內(nèi)人士們持有一個觀點:消費級AI領(lǐng)域里,一個好的產(chǎn)品經(jīng)理要比一個優(yōu)秀的算法工程師更重要。
由于消費級產(chǎn)品的獨特性,算法突破落地到終端產(chǎn)品當(dāng)中,其效果提升往往非常有限,相比而言,把握好產(chǎn)品體驗、抓準(zhǔn)用戶需求會更有意義。
蘋果歷來在人工智能的宣傳上比較低調(diào),但其實他們利用AI在增強用戶體驗方面有著不少探索。
蘋果相關(guān)負責(zé)人曾談到,人工智能已經(jīng)在為iPhone用戶帶來不少體驗上的提升:如識別陌生來電、Apple store使用深度學(xué)習(xí)辨別騙保行為,在解鎖后列出你最常使用的應(yīng)用、事項提醒,以及自動顯示附近標(biāo)記的酒店等,這些看似不起眼、但很實用的功能在蘋果全面擁抱機器學(xué)習(xí)及神經(jīng)網(wǎng)絡(luò)后,讓用戶的操作體驗越來越完美。
這些隱藏在iPhone中的AI便是“Apple Brain”,蘋果大腦已經(jīng)完全內(nèi)置于iPhone中。
從純技術(shù)角度講,要想實現(xiàn)上述功能,確實無需采用非常前沿的算法。但“實現(xiàn)”和“好用”這兩個結(jié)果有著質(zhì)的差別,要讓終端用戶滿意,這背后除了算法本身外,還有很多要考慮的因素。
AI研究者都知道,要讓機器學(xué)習(xí)模型的魯棒性強健,簡單地拿大量計算資源、用高級算法對大量數(shù)據(jù)進行粗暴式分析是行不通的,不僅造成計算資源的大量浪費,同時也容易出錯誤。這個時候,首先需要根據(jù)不同機型傳感器的特性、不同應(yīng)用的特性、不同用戶的特性,做很多規(guī)則的制定與定義。這塊看不見的工程其實非常復(fù)雜且繁瑣,同時也正是保證AI功能體驗優(yōu)秀的前提。
這里以與“Apple Brian”相似的國內(nèi)人工智能引擎“One Mind”為例,它是魅族Flyme自主研發(fā)的人工智能系統(tǒng)服務(wù),具備分析、決策、進化學(xué)習(xí)的能力。
其中“進程收割者”功能會對每個App的實時動態(tài)特征、喚醒方式、內(nèi)存占用等方面進行審查,一旦發(fā)現(xiàn)有行為異常的應(yīng)用,如占用大量資源、后臺強制喚醒等,則會對其進行清理。
在One Mind此前,行業(yè)內(nèi)絕大部分安卓系統(tǒng)采用“圈定白名單應(yīng)用”這種一刀切的方式去定義。 但對于不在白名單內(nèi),卻是用戶需要用到的APP,除非主動添加,否則便面臨被誤殺的問題。
語音識別出現(xiàn)錯誤用戶可忍受,濾鏡處理速度慢用戶也可忍受,但有些應(yīng)用明明在正常工作,卻被當(dāng)做是異常行為被關(guān)掉,這對用戶體驗的體驗影響是極其巨大的。
因此在做好AI功能之前,“進程收割者”首先要解決一大問題:如何定義“正常工作”?
Flyme團隊花了大量時間去重新定義“應(yīng)用工作”這件事,在制定好規(guī)則后,利用機器學(xué)習(xí)算法在規(guī)則體系下對用戶的行為進行學(xué)習(xí)、對后臺的應(yīng)用動態(tài)進行分析,據(jù)悉現(xiàn)階段,應(yīng)用識別準(zhǔn)確率可達到99.5%。
目前,整個人工智能與手機操作系統(tǒng)的結(jié)合才剛剛開始,相信未來 One Mind 會擁有更強大的場景分析能力和行為習(xí)慣的學(xué)習(xí)預(yù)測能力。Flyme負責(zé)人楊顏也公開表示:“現(xiàn)在的One Mind就像一個推開了新世界大門的孩子,它看到了不只是一束光,更是未來無限的可能?!?/p>
其實無論是蘋果的“Apple Brain”還是魅族Flyme的“One Mind”,都印證了蘋果高級副總裁Schiller的一句話:人工智能的目的,是讓用戶在不知不覺中得到AI帶來的體驗提升,用戶甚至都感覺不到它的存在,直到有一天才突然意識到,并發(fā)出感嘆:這一切到底怎么發(fā)生的?”
人工智能之于手機,并非陽春白雪,那些無需用戶刻意學(xué)習(xí)、持續(xù)提升用戶體驗、讓手機盡可能幫助用戶主動做正確決策的功能,才是手機人工智能的真需求。
- QQ:61149512