在去年10月,小鵬P7發(fā)布智能語(yǔ)音交互系統(tǒng)之后,經(jīng)過(guò)9個(gè)月的打磨,這套系統(tǒng)有了新的提升,此前的很多功能都已經(jīng)可用一句“您好 小P”來(lái)對(duì)話解決,那么此次再升級(jí)的內(nèi)容是什么?答案是對(duì)AI的理解。
AI發(fā)展到今天,逐漸進(jìn)入到尋常生活,從家居到車(chē)載、從個(gè)人穿戴到公共娛樂(lè),AI通過(guò)語(yǔ)音交互帶給人類(lèi)的感受最為直接,關(guān)于這份“感受”,小鵬汽車(chē)在尋找最接近人類(lèi)的可能。
聲音只有親耳聽(tīng)到最為真實(shí),小鵬收集包括P7在內(nèi)的8款車(chē)加上真人語(yǔ)音,進(jìn)行系統(tǒng)盲測(cè),依次根據(jù)與真人的相似度、音質(zhì)清晰度和喜歡該聲音的程度來(lái)打分。最終小鵬P7得到平均7.48分,位列第一。意想不到的是,真人語(yǔ)音播報(bào)的聲音竟然只有5.87分,排在第三位。通過(guò)此次測(cè)試表明,真人聲音搭載在車(chē)機(jī)系統(tǒng)中,并不一定是最令人舒適的聲音。
即將在小鵬P7 Xmart OS 2.6.1版本上線的智能語(yǔ)音交互系統(tǒng),主要內(nèi)容是新增了全新AI聲音。小P的新聲音與常規(guī)的車(chē)載語(yǔ)音助手聲音有著代際的差別,這一點(diǎn)用語(yǔ)言難以敘述,但有幾項(xiàng)指標(biāo)可以表明小P新聲音的變化。
更真實(shí)——采用“全新一代超大規(guī)模在線神經(jīng)網(wǎng)絡(luò)引擎+小型離線拼接引擎”的技術(shù)組合,使全新AI聲音更加細(xì)膩、自然,更像真人般的氣息頓挫,能表達(dá)更多情緒。新聲音的MOS語(yǔ)音質(zhì)量評(píng)測(cè)得分4.49,是目前微軟MOS得分最高的車(chē)載語(yǔ)音助手。語(yǔ)音質(zhì)量評(píng)測(cè)指標(biāo)MOS(Mean Opinion Score)是一項(xiàng)被國(guó)際普遍認(rèn)可的語(yǔ)音質(zhì)量評(píng)測(cè)方法,它可以判斷一個(gè)機(jī)器聲音多大程度像真實(shí)人聲,滿分為5分,分?jǐn)?shù)越高證明聲音越完美,越令人舒適。同時(shí),全新AI聲音擁有包括助理、聊天、客服、愉快、溫和、親熱、抒情、新聞、嚴(yán)肅、不滿、生氣、害怕、悲傷、冷靜等14種強(qiáng)烈情緒的變換能力,后續(xù)版本將逐步開(kāi)發(fā)其應(yīng)用場(chǎng)景。
更生動(dòng)——小P全新AI聲音采用24K采樣技術(shù),現(xiàn)有聲音為16k,各種場(chǎng)景下的聲音反饋都被精心調(diào)教,新舊聲音對(duì)比有明顯的音質(zhì)差距。HiFi級(jí)高保真音質(zhì)配合高品質(zhì)音響組合,給用戶帶來(lái)沉浸感十足的交互體驗(yàn)。
更極致——通過(guò)小鵬汽車(chē)自研的端云融合多級(jí)緩存技術(shù),車(chē)輛可預(yù)測(cè)當(dāng)下的網(wǎng)絡(luò)情況,智能選擇在線神經(jīng)網(wǎng)絡(luò)引擎或離線引擎進(jìn)行聲音合成,在弱網(wǎng)或無(wú)網(wǎng)絡(luò)環(huán)境下,依然帶來(lái)高音質(zhì)語(yǔ)音播報(bào)。同時(shí),通過(guò)一系列創(chuàng)新性落地解決方案,包括智能預(yù)測(cè)算法、智能拼接等,可做到97%超高在線率。
與一般的車(chē)載語(yǔ)音助手不同的是,小P能夠連續(xù)對(duì)話,無(wú)須重復(fù)喚醒,每25秒最多達(dá)10個(gè)指令。而且在傾聽(tīng)時(shí),可自行過(guò)濾無(wú)效語(yǔ)句,不是對(duì)它說(shuō)的指令,它不會(huì)執(zhí)行。這一點(diǎn)還可以區(qū)分主副駕的不同指令,一人喚醒小P后,小P只與這一人語(yǔ)音對(duì)話,進(jìn)一步防止穿插進(jìn)干擾聲音。
小鵬汽車(chē)表示,對(duì)車(chē)載語(yǔ)音系統(tǒng)的深度探索,終極目標(biāo)是實(shí)現(xiàn)整車(chē)功能的全語(yǔ)音控制。從而在真正的無(wú)人駕駛到來(lái)之前,用智能語(yǔ)音實(shí)現(xiàn)智能座艙的功能,比如在用戶不便于用手進(jìn)行操作時(shí),協(xié)助用戶完成設(shè)置導(dǎo)航、搜索音樂(lè)、調(diào)整空調(diào)等功能。當(dāng)無(wú)人駕駛真正到來(lái)時(shí),智能座艙將更多的體現(xiàn)出其娛樂(lè)、辦公、休息等屬性,此時(shí)車(chē)載智能語(yǔ)音將成為人車(chē)交互最重要的交互方式,承擔(dān)更多的車(chē)輛控制和信息娛樂(lè)功能,實(shí)現(xiàn)整車(chē)功能的全語(yǔ)音控制。
目前,小鵬全語(yǔ)音車(chē)載系統(tǒng)也支持在NGP自動(dòng)導(dǎo)航輔助駕駛狀態(tài)下,通過(guò)語(yǔ)音控制車(chē)輛自動(dòng)變道。駕駛員可喚醒小P說(shuō)“請(qǐng)幫我向左變道”、“請(qǐng)把前面的車(chē)超了”,控制車(chē)輛實(shí)現(xiàn)向左變道和向右變道語(yǔ)音控制變道功能,該功能是業(yè)內(nèi)首個(gè)通過(guò)語(yǔ)音控制駕駛輔助變道的功能。
小鵬汽車(chē)AI產(chǎn)品專(zhuān)家郝超表示,這套車(chē)載語(yǔ)音系統(tǒng)的“耳朵”和“嗓子”可以是市場(chǎng)上已成熟的通用技術(shù)來(lái)提供,但“大腦”一定是小鵬自研的。比如說(shuō)語(yǔ)義識(shí)別和語(yǔ)義理解,即該語(yǔ)言屬什么領(lǐng)域、要表達(dá)的內(nèi)容是什么,要如何做出回應(yīng)……簡(jiǎn)而言之,如何把聲音帶上車(chē)并服務(wù)于車(chē)主,是小鵬研發(fā)的根本。
從技術(shù)角度講,語(yǔ)音合成的方式有很多種,主流方法有單元拼接;合成器;基于深度神經(jīng)網(wǎng)絡(luò)合成。不同技術(shù)有不同的特點(diǎn),但新一代技術(shù)會(huì)比上一代更加自動(dòng)化,運(yùn)算力更強(qiáng),生成的聲音更加逼真。小P新聲音采用了“全新一代超大規(guī)模在線神經(jīng)網(wǎng)絡(luò)引擎+小型離線拼接引擎”的技術(shù)組合。
前兩種方法會(huì)產(chǎn)生機(jī)械的嗡嗡聲,或者跳音這種強(qiáng)烈不平衡感,用戶能明顯感受到它并不像人。第三種基于深度神經(jīng)網(wǎng)絡(luò)技術(shù)合成聲音是近些年突破的新技術(shù),該模型通過(guò)大量數(shù)據(jù)和算力打磨后,可以輸出無(wú)限逼近真人的聲音,小鵬稱(chēng)這是一個(gè)更前瞻也更冒險(xiǎn)的技術(shù)嘗試。
如何理解這個(gè)技術(shù)組合,需要明確“在線”和“離線”的概念。這里可以參考游戲場(chǎng)景:離線可以理解為像“紙牌”這種不需要上網(wǎng)的本地小游戲;在線則是像“王者”、“吃雞”這樣需要大量計(jì)算的聯(lián)網(wǎng)游戲。相對(duì)應(yīng)的,在線技術(shù)的目標(biāo)是生成更優(yōu)質(zhì)的聲音,離線技術(shù)則是一種兜底策略。
當(dāng)前通過(guò)“在線技術(shù)”生成聲音的業(yè)務(wù)主要應(yīng)用在智能音箱領(lǐng)域,汽車(chē)領(lǐng)域寥寥無(wú)幾,因?yàn)橐粝涞木W(wǎng)絡(luò)穩(wěn)定性很高,行車(chē)場(chǎng)景常有弱網(wǎng)和無(wú)網(wǎng)的情況。如果不解決弱網(wǎng)無(wú)網(wǎng)的聲音問(wèn)題,體驗(yàn)會(huì)非常差。所以小鵬汽車(chē)為了解決用戶在車(chē)內(nèi)絕大多數(shù)時(shí)間都能聽(tīng)到通過(guò)在線技術(shù)生成的聲音,自研了一系列解決網(wǎng)絡(luò)問(wèn)題的創(chuàng)新性落地解決方案,并且目前已向國(guó)家申報(bào)專(zhuān)利。
據(jù)小鵬官方介紹,其解決方案包括“智能離在線融合”:車(chē)機(jī)端采用了多策略融合模式,通過(guò)網(wǎng)絡(luò)、車(chē)機(jī)負(fù)載、播報(bào)業(yè)務(wù)場(chǎng)景策略綜合決策;“端云融合的多級(jí)緩存”:所有文本內(nèi)容采用了多級(jí)緩存策略,以提升響應(yīng)速度;“智能拼接”:為保證用戶在弱網(wǎng)或無(wú)網(wǎng)狀態(tài)下仍能收到完整在線聲音,采用了動(dòng)態(tài)在線轉(zhuǎn)離線切換策略,以實(shí)現(xiàn)卡在哪里就從哪里轉(zhuǎn)離線;“智能預(yù)加載算法”:小P會(huì)越來(lái)越聰明,能不斷提升個(gè)性化內(nèi)容播報(bào)的響應(yīng)速度,對(duì)用戶常用的指令反應(yīng)越來(lái)越快。“智能打斷”:讓NGP、導(dǎo)航等重要內(nèi)容優(yōu)先播報(bào),不讓用戶錯(cuò)過(guò)高優(yōu)緊急內(nèi)容,最大限度為用戶提供更流暢的聲音體驗(yàn)。
由此可見(jiàn),深度神經(jīng)網(wǎng)絡(luò)技術(shù)在車(chē)載領(lǐng)域的運(yùn)用,需要解決很多不曾出現(xiàn)的工程難題,不斷挖掘科技帶來(lái)的價(jià)值最大化。
小鵬汽車(chē)正將自己定調(diào)為一家科技公司,何小鵬稱(chēng)在成立時(shí)的想法就是希望能把智能汽車(chē)大眾化、普及化。
全語(yǔ)音車(chē)載系統(tǒng)為智能座艙提供了基礎(chǔ)可靠的智能體驗(yàn),目前小鵬已經(jīng)首創(chuàng)了連續(xù)對(duì)話、語(yǔ)音控制輔助駕駛功能。在越來(lái)越多科技公司踏入汽車(chē)市場(chǎng)的時(shí)候,小鵬也在不斷累積自研技術(shù)的實(shí)力,深入對(duì)全鏈路的把控。
文章推薦
探索沃爾沃XC60:豪華SUV中的安全典范 傳祺gs4霧燈在哪開(kāi) 傳祺gs4倒車(chē)燈型號(hào) 比亞迪元用什么機(jī)油好 gs4空調(diào)濾芯怎么換 gs4自動(dòng)空調(diào)怎么用 傳祺gs4水箱在哪里 廣汽gs4傳祺換車(chē)門(mén) 傳祺gs4儀表盤(pán)圖標(biāo) 傳祺gs4雨刷怎么用最新文章
探索沃爾沃XC60:豪華SUV中的安全典范 傳祺gs4霧燈在哪開(kāi) 傳祺gs4倒車(chē)燈型號(hào) 比亞迪元用什么機(jī)油好 gs4空調(diào)濾芯怎么換 gs4自動(dòng)空調(diào)怎么用 傳祺gs4水箱在哪里 廣汽gs4傳祺換車(chē)門(mén) 傳祺gs4儀表盤(pán)圖標(biāo) 傳祺gs4雨刷怎么用