隨著智能時(shí)代的到來(lái),語(yǔ)音已經(jīng)成為人機(jī)交互的主要途徑之一,手機(jī)語(yǔ)音助手、車載語(yǔ)音助手、智能音箱、語(yǔ)音搜索……在日常生活中語(yǔ)音交互無(wú)所不在。而語(yǔ)音交互對(duì)于智能汽車更是有著獨(dú)特的優(yōu)勢(shì),隨著智能化的發(fā)展,車機(jī)功能越來(lái)越多,實(shí)體按鍵越來(lái)越少,交互邏輯更加復(fù)雜,找一個(gè)功能可能要通過(guò)多級(jí)菜單,不僅給用戶帶來(lái)很多不便,甚至還會(huì)嚴(yán)重威脅駕駛安全,而通過(guò)語(yǔ)音交互可以幫助駕駛者降低手動(dòng)操作頻率,有效提升駕駛安全性。目前語(yǔ)音交互已經(jīng)成為汽車座艙智能化的標(biāo)志性代表,與車內(nèi)多種應(yīng)用相結(jié)合,成為座艙生態(tài)構(gòu)建的核心功能。
那么語(yǔ)音交互到底是怎么實(shí)現(xiàn)的呢?
假設(shè)我們對(duì)語(yǔ)音助手說(shuō)“播放陳奕迅的《孤勇者》”。語(yǔ)音助手會(huì)說(shuō)“好的,馬上為你播放陳奕迅的《孤勇者》”,并且開始播放音樂。在這個(gè)過(guò)程中,語(yǔ)音助手首先把聽到的聲音轉(zhuǎn)化成文字,然后再理解文字所表達(dá)的內(nèi)容,最后做出相應(yīng)策略,并把相應(yīng)策略轉(zhuǎn)化成語(yǔ)音。因此語(yǔ)音交互主要分為三個(gè)模塊:
語(yǔ)音識(shí)別:簡(jiǎn)稱ASR,是將聲音轉(zhuǎn)化成文字的過(guò)程,相當(dāng)于耳朵。
自然語(yǔ)言處理:簡(jiǎn)稱NLP,是理解和處理文本的過(guò)程,相當(dāng)于大腦。
語(yǔ)音合成:簡(jiǎn)稱TTS,是把文本轉(zhuǎn)化成語(yǔ)音的過(guò)程,相當(dāng)于嘴巴。
長(zhǎng)城汽車以“自研+合作”的研發(fā)模式,圍繞ASR、NLP、TTS三個(gè)關(guān)鍵環(huán)節(jié),開展云端和車端的全鏈路語(yǔ)音算法研發(fā),搭建高度靈活的語(yǔ)音交互技術(shù)平臺(tái),構(gòu)建行業(yè)突出的語(yǔ)音能力,讓語(yǔ)音識(shí)別更精準(zhǔn)、語(yǔ)境分析更合理、語(yǔ)義理解更自然。同時(shí)積極引入業(yè)界領(lǐng)先的專業(yè)伙伴深度共創(chuàng)語(yǔ)音生態(tài),實(shí)現(xiàn)多服務(wù)融合,在多模交互、情感化溝通和場(chǎng)景化交互等方面持續(xù)突破。此外,近日長(zhǎng)城汽車官宣正式成為百度文心一言首批先行體驗(yàn)官。將通過(guò)百度Apollo融合文心一言的全面能力,攜手打造基于智能汽車場(chǎng)景的大模型人工智能交互,開啟人工智能時(shí)代的汽車全新體驗(yàn)。
近日最新上市的哈弗二代大狗可謂是長(zhǎng)城汽車語(yǔ)音能力的集大成者,搭載了長(zhǎng)城汽車全新一代Coffee OS智能座艙系統(tǒng),具備比肩新勢(shì)力旗艦車型的語(yǔ)音交互能力,超極速、更便捷,讓對(duì)話0焦慮、更自然。
極致響應(yīng):行業(yè)第一梯隊(duì)的語(yǔ)音交互速度,喚醒速度只有250ms,喚醒率成功率高達(dá)95%; 車控技能毫秒級(jí)響應(yīng)(900ms),其他在線技能響應(yīng)速度1300ms。
可見即可說(shuō):可見即可說(shuō)、支持分詞、泛化,能夠靈活使用,簡(jiǎn)單的說(shuō)就是只需說(shuō)出屏幕的文字,就能夠?qū)崿F(xiàn)相關(guān)功能的控制,看到什么說(shuō)什么,簡(jiǎn)單易用。全新一代Coffee OS的語(yǔ)音助手,能夠支持940余條語(yǔ)音指令,覆蓋車控車設(shè)、系統(tǒng)設(shè)置、導(dǎo)航、多媒體等各種模塊。
3. 一句多意圖:指的是一句話可以發(fā)出多個(gè)連續(xù)指令,最多可以支持十個(gè)指令。例如可以說(shuō):“你好小哈,關(guān)閉天窗、關(guān)閉左側(cè)車窗、打開空調(diào)、打開座椅加熱、打開座椅按摩……“
4. 口語(yǔ)化指令:不局限于傳統(tǒng)的固定指令,能夠識(shí)別豐富的指令內(nèi)容,即使是口語(yǔ)化的表達(dá)也能實(shí)現(xiàn)語(yǔ)音控制。例如說(shuō)“我好熱“,語(yǔ)音助手接受指令后,會(huì)主動(dòng)打開空調(diào)、降低空調(diào)溫度等。
5. 多人拒識(shí):當(dāng)主駕/副駕喚醒語(yǔ)音助手后,其他乘客在車上閑聊、打電話甚至唱歌,都不會(huì)影響語(yǔ)音交互,語(yǔ)音助手只識(shí)別喚醒者的聲音和指令。
6. 信息查詢:支持二十余種信源查詢,包括查詢天氣、酒店、餐廳,股票,百科,火車票機(jī)票,垃圾分類等。
7. 聲音復(fù)刻:用戶在手機(jī)APP通過(guò)少量的錄音,訓(xùn)練得到音色和發(fā)音風(fēng)格與錄音非常相似的聲音模型,可以直接應(yīng)用到車機(jī)上進(jìn)行語(yǔ)音播報(bào)。例如可以讓孩子通過(guò)手機(jī)錄入聲音,然后將其應(yīng)用到車機(jī),這樣孩子的聲音就可以全天候陪伴
另外長(zhǎng)城汽車語(yǔ)音助手更是富有情感的陪聊專家,可以跟乘客閑聊、講故事、說(shuō)笑話等,甚至還可以跟一起玩成語(yǔ)接龍、飛花令等游戲。
【大 中 小】【打印】 【繁體】【投稿】【收藏】 【推薦】【舉報(bào)】【評(píng)論】 【關(guān)閉】 【返回頂部】
Copyright@2010-2013 ALL Right Reserved 鄂ICP備10201977號(hào)
關(guān)于我們 招商合作 聯(lián)系我們 免責(zé)申明 網(wǎng)站地圖 意見反饋 友情鏈接 戰(zhàn)略聯(lián)盟
客服電話
4000-888-943
7*24小時(shí)客戶服務(wù)
15527575559