撰文 | 陳雪峰
圖片 | 網(wǎng) 絡(luò)
在智能電動(dòng)汽車(chē)的盛世狂歡中,一則與車(chē)載語(yǔ)音相關(guān)的專業(yè)新聞卻被許多人忽略。
5月8日,全球最大的語(yǔ)音和語(yǔ)言解決方案提供商N(yùn)uance宣布與斑馬網(wǎng)絡(luò)達(dá)成合作,將Nuance會(huì)話型人工智能語(yǔ)音識(shí)別技術(shù)引入斑馬網(wǎng)絡(luò)最新的智能網(wǎng)聯(lián)系統(tǒng)斑馬智行MARS(V3.0)。
有業(yè)內(nèi)人士驚呼,斑馬是不是要放棄阿里云ET智能語(yǔ)音?當(dāng)然不是。
也許你沒(méi)聽(tīng)說(shuō)過(guò)Nuance,但一定知道蘋(píng)果公司的Siri,該系統(tǒng)就采用了Nuance的語(yǔ)音技術(shù)。在2013年之前,Nuance幾乎是車(chē)載語(yǔ)音的代名詞,占據(jù)了國(guó)際主流OEM語(yǔ)音交互的市場(chǎng)。但是,它一直寂寂無(wú)名,直到與蘋(píng)果合作后,聲名鵲起。
現(xiàn)在,Nuance Automotive 以超過(guò)40種語(yǔ)言為道路上行駛的超過(guò)2.5億輛汽車(chē)提供技術(shù)支持,為奧迪、寶馬、戴姆勒、菲亞特、福特、通用、現(xiàn)代、上汽、豐田等幾乎全部主流汽車(chē)制造商打造會(huì)話型智能移動(dòng)體驗(yàn)。
據(jù)長(zhǎng)期關(guān)注該領(lǐng)域的資深媒體人孟為分析,斑馬與Nuance合作原因有二:其一、斑馬2.0中對(duì)于英語(yǔ)的識(shí)別一直是軟肋;其二、從斑馬1.0 的Nuance,到2.0換為阿里云ET智能語(yǔ)音,再到3.0可以在阿里云或Nuance兩者之間選其一,這可以看作是一直生長(zhǎng)于阿里生態(tài)中的斑馬嘗試努力接入更多外部資源的嘗試。
如果從另一個(gè)角度解讀,兩家公司的分分合合,則昭示著車(chē)載語(yǔ)音江湖錯(cuò)綜復(fù)雜的競(jìng)合關(guān)系。
在車(chē)載語(yǔ)音領(lǐng)域布局的不只是這些軟件供應(yīng)商,主機(jī)廠也在加速布局。不久前,特斯拉首席執(zhí)行官伊隆·馬斯克表示,特斯拉正在研究一系列新的語(yǔ)音命令,努力為車(chē)輛帶來(lái)更好的人工智能助理體驗(yàn)。
特斯拉是智能汽車(chē)的全球領(lǐng)先者,而智能的汽車(chē)一定離不開(kāi)智能的語(yǔ)音交互。因?yàn)樗梢院?jiǎn)化車(chē)內(nèi)的操控界面、操控方式,讓駕駛者更方便地操控車(chē)輛的功能。在取代傳統(tǒng)的交互方式后,還可以與駕駛員甚至車(chē)內(nèi)乘客進(jìn)行更深層次的“數(shù)據(jù)交互”,達(dá)到心領(lǐng)神會(huì)的境界。
如果到了真正的智能時(shí)代,智能語(yǔ)音將會(huì)成為乘員的AI助手。這是車(chē)載智能交互的終極奧義,但實(shí)現(xiàn)起來(lái)并不容易。這也是近年來(lái)諸多勢(shì)力前仆后繼,在此領(lǐng)域爭(zhēng)鋒、競(jìng)合的原因所在。
?車(chē)載語(yǔ)音起航
智能語(yǔ)音交互的發(fā)展,離我們并不遙遠(yuǎn)。
對(duì)于普羅大眾而言,智能語(yǔ)音交互最初的概念,來(lái)源于微軟的小冰、蘋(píng)果的Siri。它們能聽(tīng)懂用戶說(shuō)話,并通過(guò)大量的語(yǔ)音數(shù)據(jù)庫(kù)訓(xùn)練,找到用戶會(huì)話之間的某種關(guān)聯(lián)性,提取相應(yīng)規(guī)則內(nèi)的詞語(yǔ)或語(yǔ)句,反饋給人類。
這是一個(gè)復(fù)雜的過(guò)程,需要一定實(shí)力的公司才能推進(jìn)。
在國(guó)內(nèi),提到語(yǔ)音交互的先驅(qū),必然繞不開(kāi)中科大的科大訊飛。早在2012年,科大訊飛即提出基于云加端的架構(gòu),以及自然語(yǔ)言理解的技術(shù),使汽車(chē)上的語(yǔ)音交互更加自然。
幾乎在同一時(shí)期,未來(lái)車(chē)載語(yǔ)音交互的選手也開(kāi)始入場(chǎng)。2011年,博泰與科大訊飛合作推出全球第一臺(tái)自然語(yǔ)言的交互系統(tǒng)iVoka;2012年06月,云知聲成立,同年出門(mén)問(wèn)問(wèn)成立;這一年,已在劍橋成立5年的思必馳也有所動(dòng)作,聯(lián)合創(chuàng)始人俞凱在上海交通大學(xué)創(chuàng)建智能語(yǔ)音技術(shù)實(shí)驗(yàn)室,將人機(jī)口語(yǔ)對(duì)話系統(tǒng)的全面技術(shù)引入國(guó)內(nèi)。
2014年,思必馳推出業(yè)內(nèi)首個(gè)麥克風(fēng)陣列的降噪技術(shù),可用于對(duì)聲場(chǎng)的空間特性進(jìn)行采樣并處理,使得“聲控”成為可能,尤其是在復(fù)雜的車(chē)載環(huán)境中。
這段期間,由于中文環(huán)境的特殊性,科大訊飛在國(guó)內(nèi)車(chē)載語(yǔ)音市場(chǎng)獨(dú)領(lǐng)風(fēng)騷,占據(jù)了大半市場(chǎng)。與之相對(duì)應(yīng)的是,各大OEM都在推出功能重疊、幾無(wú)差異的車(chē)載語(yǔ)音功能。
正是這些當(dāng)年的語(yǔ)音交互新人,共同拉開(kāi)了車(chē)載語(yǔ)音交互的大幕。接下來(lái)的三年,則是初創(chuàng)公司與OEM和Tier親密接觸的美好歲月。
2015年3月23日,上市公司均勝電子的全資子公司均勝車(chē)聯(lián)宣布,收購(gòu)語(yǔ)音識(shí)別公司車(chē)音網(wǎng)10%的股權(quán)。
2016年9月1日,成立近7年的車(chē)載語(yǔ)音交互廠商普強(qiáng)信息宣布C輪融資,迎來(lái)在車(chē)載導(dǎo)航領(lǐng)域低調(diào)布局的戰(zhàn)略投資者四維圖新。
2017年1月,剛剛獲得1000萬(wàn)美金融資的初創(chuàng)公司驀然認(rèn)知,宣布要重點(diǎn)布局車(chē)載領(lǐng)域,其合作伙伴包括四維圖新;同年4月,出門(mén)問(wèn)問(wèn)獲得大眾汽車(chē)集團(tuán)1.8億美元D輪融資,雙方還成立了合資公司。
這一時(shí)期,車(chē)載語(yǔ)音交互不再只是語(yǔ)音廠商的獨(dú)角戲,越來(lái)越多的OEM、供應(yīng)商開(kāi)始重視語(yǔ)音交互在智能座艙中的應(yīng)用,紛紛與語(yǔ)音廠商建立深度合作關(guān)系,或者直接投資入股。
對(duì)于車(chē)載語(yǔ)音提供商而言,汽車(chē)廠商和Tier1的入局加速了行業(yè)的發(fā)展進(jìn)程,也意味著越來(lái)越多的資本和玩家將涌入賽道。
2017年6月,云知聲發(fā)布智能中控方案Pandora,隨即完成近3億元C輪融資。一年之后,其C輪系列融資總額定格在13 億元人民幣,創(chuàng)下語(yǔ)音技術(shù)領(lǐng)域單輪融資最高記錄。
??云知聲CEO黃偉
幾乎在同一時(shí)間,思必馳宣布獲得D輪5億元人民幣融資,元禾控股、中國(guó)民生投資集團(tuán)領(lǐng)投,深創(chuàng)投、富士康、聯(lián)發(fā)科跟投。
?BAT欲一統(tǒng)江湖
在互聯(lián)網(wǎng)領(lǐng)域,如果某個(gè)細(xì)分市場(chǎng)出現(xiàn)了巨大的市場(chǎng)機(jī)遇,一定少不了BAT的身影。
毋庸置疑,語(yǔ)音交互是一個(gè)未來(lái)車(chē)載交互的重要入口,也是用戶數(shù)據(jù)、服務(wù)數(shù)據(jù)、定制化數(shù)據(jù)的重要采集端。初創(chuàng)公司們的優(yōu)勢(shì)是先行一步,BAT則是瞄準(zhǔn)時(shí)機(jī),重兵涌入。
2017年7月5日,百度正式對(duì)外發(fā)布DuerOS開(kāi)放平臺(tái),該平臺(tái)包括智能設(shè)備開(kāi)放平臺(tái)和技能開(kāi)放平臺(tái),支撐這兩個(gè)平臺(tái)的則是DuerOS對(duì)話核心系統(tǒng),其應(yīng)用領(lǐng)域之一即是車(chē)載交互。
??博泰集團(tuán)創(chuàng)始人兼董事長(zhǎng)應(yīng)宜倫
發(fā)布會(huì)當(dāng)天,車(chē)聯(lián)網(wǎng)供應(yīng)商博泰集團(tuán)宣布與DuerOS合作,讓“AI賦能汽車(chē)”。隨后,百度相繼與東風(fēng)、福特等OEM建立合作關(guān)系,推進(jìn)落地。
2017年底,騰訊發(fā)布騰訊車(chē)聯(lián)“AI in car生態(tài)系統(tǒng)”,并與廣汽、長(zhǎng)安、吉利、比亞迪、東風(fēng)柳汽等主機(jī)廠達(dá)成戰(zhàn)略合作。AI in car系統(tǒng)的核心,事實(shí)上就是以騰訊語(yǔ)音助手為車(chē)載語(yǔ)音輸出控制能力,建立車(chē)載交互中心,用騰訊生態(tài)體系下的內(nèi)容澆灌成長(zhǎng)。
號(hào)稱要打造國(guó)產(chǎn)車(chē)載OS的阿里AliOS,在同上汽合作成功后,也沒(méi)有忘記替換掉Nuance,研發(fā)自己的語(yǔ)音交互系統(tǒng)。
BAT的入局,凸顯出車(chē)載語(yǔ)音交互的重要性,但對(duì)于語(yǔ)音交互廠商而言,苦樂(lè)參半。特別是國(guó)內(nèi)創(chuàng)業(yè)公司,在上升過(guò)程中一旦遇到BAT,不是被收購(gòu)就是被針對(duì),鮮少有突圍者。
云知聲CEO黃偉曾透露,2013年BAT其中一家想要收購(gòu)云知聲,但最終他拒絕了收購(gòu)邀約,選擇了另一條路。
2018年9月,云知聲與吉利集團(tuán)旗下億咖通科技(ECARX)宣布共同出資成立一家合資公司,落地在合肥高新區(qū)。
雙方的合作將基于云知聲的語(yǔ)音識(shí)別、語(yǔ)音合成、聲紋識(shí)別、語(yǔ)義理解以及后續(xù)不斷拓展的圖像等AI技術(shù),融合億咖通科技在車(chē)載云平臺(tái)、內(nèi)容和車(chē)載產(chǎn)品等方面的設(shè)計(jì)經(jīng)驗(yàn),開(kāi)展面向汽車(chē)前裝市場(chǎng)的車(chē)規(guī)級(jí) AI 芯片研發(fā)。
2019年初,思必馳發(fā)布AI語(yǔ)音芯片:深聰TAIHANG芯片(TH1520),可應(yīng)用于車(chē)載、智能終端等領(lǐng)域。普強(qiáng)信息則借助四維圖新旗下的杰發(fā)科技,推進(jìn)其“云+端+芯片”的車(chē)載語(yǔ)音方案。
為提升與BAT同臺(tái)競(jìng)技的砝碼,語(yǔ)音廠商們?cè)讷@得巨額融資后,直接將語(yǔ)音識(shí)別處理的軟件算法之爭(zhēng),拉到芯片競(jìng)爭(zhēng)的層面。這時(shí),從表面看起來(lái)大家都站在了同一起跑線上。
但是,熱衷于軍備競(jìng)賽的自主車(chē)載語(yǔ)音廠商,真的能依靠資本贏下這一城嗎?
?鷸蚌相爭(zhēng),漁翁得利
語(yǔ)音交互分為三個(gè)階段,聽(tīng)清、聽(tīng)懂和會(huì)意。首先要解決語(yǔ)音的識(shí)別,其次要能讓機(jī)器讀懂語(yǔ)音的意思,這都需要依靠深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的不斷迭代升級(jí)。
但是,由于車(chē)載環(huán)境的特殊性,不能隨意增大處理器算力以及功耗,目前的語(yǔ)音識(shí)別多依賴云端處理,在網(wǎng)絡(luò)環(huán)境良好的情況下才能達(dá)到較好的語(yǔ)音識(shí)別。識(shí)別之后,自然語(yǔ)音理解、對(duì)話管理、自然語(yǔ)言生成才能進(jìn)行下去。
這是一個(gè)復(fù)雜的過(guò)程,需要專業(yè)的廠商來(lái)做。眾所周知,未來(lái)的社會(huì),是數(shù)據(jù)為王,無(wú)論OEM、語(yǔ)音廠商還是終端集成商,都希望擁有數(shù)據(jù)。但各自為政,并不能促進(jìn)語(yǔ)音技術(shù)的升級(jí),服務(wù)的多樣化,應(yīng)用的便利性。
一位業(yè)內(nèi)資深人士表示,車(chē)載語(yǔ)音交互不能走車(chē)聯(lián)網(wǎng)發(fā)展的老路,供應(yīng)商的角色在供應(yīng)鏈中處于被動(dòng)局面,OEM擁有大量數(shù)據(jù)卻不能有效利用。
他認(rèn)為,行業(yè)需要一個(gè)集成化、定制化語(yǔ)音交互的服務(wù)提供商,站在語(yǔ)音技術(shù)供應(yīng)商和OEM之間,充當(dāng)二者的橋梁。既可以靈活選擇不同的語(yǔ)音技術(shù)方案,也可以提供定制化、多樣化的語(yǔ)音交互產(chǎn)品,供OEM放心使用,無(wú)須擔(dān)憂數(shù)據(jù)落灰。
換言之,對(duì)于OEM而言,一個(gè)靈活可插拔式的服務(wù)平臺(tái),更具有吸引力。對(duì)于整個(gè)車(chē)載語(yǔ)音交互產(chǎn)業(yè)鏈而言,開(kāi)放、靈活、自主型的平臺(tái)型服務(wù)提供商,可能會(huì)成為未來(lái)的趨勢(shì)。
時(shí)下,國(guó)產(chǎn)車(chē)載語(yǔ)音交互的江湖亂戰(zhàn)仍在繼續(xù)。有一種觀點(diǎn)認(rèn)為,最終的得利者可能并不是語(yǔ)音技術(shù)的提供方,而是中立的第三方平臺(tái)型服務(wù)商。也就是說(shuō),誰(shuí)擁有成熟的上下游資源,誰(shuí)就最有可能成為未來(lái)車(chē)載智能語(yǔ)音交互產(chǎn)業(yè)鏈的話事人。
至于語(yǔ)音交互的下一個(gè)時(shí)代,智能不再只是空談,而是真正走進(jìn)人們的體驗(yàn)當(dāng)中。
首先,語(yǔ)音交互不再僅限于簡(jiǎn)單的語(yǔ)音識(shí)別,提供命令式的服務(wù),而是會(huì)通過(guò)記錄用戶使用習(xí)慣、喜好等數(shù)據(jù),當(dāng)用戶提出相應(yīng)的服務(wù)要求時(shí),為其提供滿足甚至超出預(yù)期的服務(wù)。
達(dá)到這一步,既需要在用戶數(shù)據(jù)方面的積累,同時(shí)也要有強(qiáng)大的語(yǔ)音交互引擎做支撐,這些都是基礎(chǔ)能力,有了基礎(chǔ)能力才能更聚焦探索智能化的服務(wù)。
其次,在語(yǔ)音之外,因?yàn)椴糠纸换サ谋憷?,手?shì)、視覺(jué)等交互也會(huì)發(fā)揮作用。屆時(shí),車(chē)載交互將會(huì)呈現(xiàn)出一個(gè)多模態(tài)交互的狀態(tài)。
—END—
文章推薦
探索沃爾沃XC60:豪華SUV中的安全典范 傳祺gs4霧燈在哪開(kāi) 傳祺gs4倒車(chē)燈型號(hào) 比亞迪元用什么機(jī)油好 gs4空調(diào)濾芯怎么換 gs4自動(dòng)空調(diào)怎么用 傳祺gs4水箱在哪里 廣汽gs4傳祺換車(chē)門(mén) 傳祺gs4儀表盤(pán)圖標(biāo) 傳祺gs4雨刷怎么用最新文章
探索沃爾沃XC60:豪華SUV中的安全典范 傳祺gs4霧燈在哪開(kāi) 傳祺gs4倒車(chē)燈型號(hào) 比亞迪元用什么機(jī)油好 gs4空調(diào)濾芯怎么換 gs4自動(dòng)空調(diào)怎么用 傳祺gs4水箱在哪里 廣汽gs4傳祺換車(chē)門(mén) 傳祺gs4儀表盤(pán)圖標(biāo) 傳祺gs4雨刷怎么用