欧美日韩国产动漫一区二区,AⅤ无码国产在线看Aⅴ

編輯指南：隨著技術(shù)的發(fā)展，智能座艙技術(shù)也在不斷發(fā)展。這篇文章作者系統(tǒng)地介紹了智能座艙的語言系統(tǒng)，從各個方面詳細介紹了汽車語音的功能介紹和整體架構(gòu)等。一起看你感興趣的東西。

智能座艙有兩大人工智能交互系統(tǒng)，一個基于視覺（計算機視覺）、一個基于語音。前者的應(yīng)用體現(xiàn)在IMS系統(tǒng)，我之前的文章有過介紹；后者的應(yīng)用在艙內(nèi)的語音功能。這篇文章就系統(tǒng)地介紹智能座艙的語音系統(tǒng)（VOS）。

一、概述

VOS（語音操作系統(tǒng)）旨在為用戶提供車內(nèi)環(huán)境下的語音交互服務(wù)。 VOS系統(tǒng)系統(tǒng)采用了喚醒、語音識別、語義理解等技術(shù)實現(xiàn)語音控制。

座艙的車設(shè)車控、地圖導(dǎo)航、音樂及多媒體應(yīng)用、系統(tǒng)設(shè)置、空調(diào)等均可通過語音來操作。除了針對車身、車載的控制外，語音還支持天氣查詢、日程管理以及閑聊對話。

用戶只要說喚醒詞，即可使用。語音指令可以一步直達功能，既能解放手指，又無需視線偏移注視車機中控區(qū)域，從而保障行車安全。

二、總體架構(gòu)

在總體的架構(gòu)上，語音系統(tǒng)可分為四個模塊。即車端系統(tǒng)、云端系統(tǒng)、語音運營管理平臺以及訓(xùn)練和分析統(tǒng)計模塊。整體的語音系統(tǒng)和要求，包括車端到云端鏈接、數(shù)據(jù)到功能的構(gòu)建、Online的運營平臺、線下線上的數(shù)據(jù)采集和標(biāo)注。

三、架構(gòu)模塊

1. VOS車端系統(tǒng)

車機端主要是對話系統(tǒng)（DS），也是用戶感受最直觀的，產(chǎn)品的重點側(cè)向交互設(shè)計。

2. VOS車端模塊

從上圖可以看到，車機端由以下幾個模塊組成：

音頻處理模塊：AEC /AGC/ANR/ BF；
喚醒模塊/本地ASR；
語音控制器語；
本地對話系統(tǒng)；
TTS模塊。

以上每個模塊均包含一個或多個應(yīng)用，這些應(yīng)用內(nèi)置在車機：音頻處理包括AEC (Acoustic Echo Cancelling)、VAD (Voice Activity Detection)、音頻壓縮、喚醒詞、本地的ASR識別等。該模塊可以對來自麥克風(fēng)的原始音頻信號進行各種預(yù)處理，向語音助手提供獲取喚醒信號、預(yù)處理后的音頻、本地ASR識別結(jié)果等接口。

前端信號處理包括：AEC、ANR、AGC、聲源定位（SSL）、Beamforming，全部通過軟件方案實現(xiàn)。

3. 語音助手

車機端負責(zé)語音對話的中樞控制模塊，負責(zé)協(xié)調(diào)車機端對話系統(tǒng)的總體流程。車機端的其他模塊或者被語音助手調(diào)用(音頻服務(wù)、本地對話系統(tǒng)、TTS模塊、應(yīng)用程序)，或者屬于語音助手的組成部分(對話控制器)。

4. 本地對話系統(tǒng)(本地DS)

本地對話系統(tǒng)是云端對話系統(tǒng)在車機上的一個鏡像。它負責(zé)執(zhí)行那些需要在車機上執(zhí)行的對話處理，如:離線無網(wǎng)絡(luò)狀態(tài)下的對話功能、基于本地SDK的導(dǎo)航或音樂搜索相關(guān)的對話處理、或者其他一些本地優(yōu)于云端的場景下的對話功能。本地對話系統(tǒng)提供了一系列接口供對話控制器進行調(diào)用。

本地對話系統(tǒng)從云端對話系統(tǒng)相同的基礎(chǔ)架構(gòu)衍生而來，和云端的設(shè)計和功能大體相同。

但也根據(jù)本地的特點和需求進行了變化。如鑒于車機運算資源的匱乏而精簡了模型；集成了車機專屬的基于SDK的媒體和導(dǎo)航搜索功能；本地對話系統(tǒng)包含語音識別、語義理解、語音合成，系統(tǒng)傾向于支持斷網(wǎng)場景下的業(yè)務(wù)，如車控、打電話等基本場景。

本地對話系統(tǒng)的交互入口是語音喚醒，有的喚醒會支持雙喚醒詞（隱含）。像百度地圖就支持“小度小度”也支持“小德小德”（高德地圖的喚醒詞），容錯率更好。

5. 本地NLU

本地NLU在無網(wǎng)絡(luò)狀態(tài)下，提供基礎(chǔ)語義理解服務(wù)，考慮到車機端的運算能力，在NLU模型上需做大量的模型裁剪和壓縮，并結(jié)合車機芯片進行指令集層面的優(yōu)化，確保將本地NLU的效果最大程度的逼近云端NLU的效果；本地NLU的資源大約是在線的1/10，最大程度的保證了本地的效果。

6. 本地TTS

TTS模塊被語音助手調(diào)用，負責(zé)將文本轉(zhuǎn)換為語音播報。TTS合成引擎由供應(yīng)商提供，對話話術(shù)的TTS文本通過話術(shù)運營系統(tǒng)來制定和編輯，其結(jié)果存儲在數(shù)據(jù)庫中、供對話系統(tǒng)調(diào)用。

四、云端系統(tǒng)

1. 對話系統(tǒng)

對話系統(tǒng)的云端部分（或者說在線對話系統(tǒng)）由多個部署在云服務(wù)上的服務(wù)和存儲組成。

云端向車機提供兩種接口：一種是基于TCP的socket流式數(shù)據(jù)傳輸接口，用于傳輸語音數(shù)據(jù)并給出

云端ASR識別結(jié)果和對話結(jié)果：一種是基于HTTP的用于發(fā)送非語音類消息的接口。云端服務(wù)可以部署在各種云服務(wù)（如aws、華為云等）的計算節(jié)點上；一套部署在具備64G內(nèi)存的計算節(jié)點

上的云端節(jié)點可以同時支持2-3萬臺設(shè)備的訪問。

對話系統(tǒng)的云端部分主要提供以下幾項功能：

在線ASR識別對話服務(wù)模塊可以接受用戶發(fā)起的語音對話的音頻輸入，并給出識別結(jié)果。
對話對話服務(wù)模塊可以接受用戶發(fā)起的語音對話的文本輸入，并給出相應(yīng)的對話結(jié)果，包括TTS文本、要車機進行的操作、車機用來屏顯的內(nèi)容等。
其他功能如向用戶進行主動推送等。

2. 模型

模型主要提供各種AI算法的運行模型數(shù)據(jù)，包括聲學(xué)模型、語言模型等等多個不同算法不同用途的模型，可獨立升級，來實現(xiàn)最優(yōu)的AI處理效果。

對于通用領(lǐng)域，模型優(yōu)化能夠帶來整體的提升，例如整體升級聲學(xué)模型和語言模型，在用戶數(shù)據(jù)積累到一定程度的時候，如1萬小時交互音頻數(shù)據(jù)，可以帶來20%-30%錯誤率下降。

對于專有領(lǐng)域，模型優(yōu)化能夠?qū)崿F(xiàn)從極低到極高，甚至從無到有的提升，例如一些產(chǎn)品強相關(guān)的詞匯、使用常見的一些專有名詞、人名地名等，都可以做特定的優(yōu)化，達到通用的效果。

3. 云端TTS

云端TTS有別于本地端TTS，基于強大的計算能力，云端使用更大的數(shù)據(jù)庫，技術(shù)上使用基于拼接的方案，相比于本地端基于參數(shù)合成的TTS，音質(zhì)更自然； TTS的聲音可以進行定制，需要經(jīng)過文本設(shè)計、發(fā)音人確認、錄音場地和錄音、數(shù)據(jù)篩選、標(biāo)注、訓(xùn)練等過程。

五、運營平臺

運營平臺通過云端和線上對話系統(tǒng)聯(lián)通，負責(zé)以可視化的形式干預(yù)對話系統(tǒng)線上的數(shù)據(jù)和功能。其中主要包含兩大類功能：數(shù)據(jù)運營、功能運營。

1. 數(shù)據(jù)運營

數(shù)據(jù)部分的運營主要針對兩部分比較常用的可運營數(shù)據(jù)：

針對系統(tǒng)接入的CP/SP的可運營的內(nèi)容，比如喜馬拉雅的推薦數(shù)據(jù)、黃頁數(shù)據(jù)等等，可以在系統(tǒng)中以手動的方式調(diào)整數(shù)據(jù)的內(nèi)容、排序等；
針對企業(yè)自有的數(shù)據(jù)，比如主機廠獨有的充電樁數(shù)據(jù)、服務(wù)門店數(shù)據(jù)，可以有機的結(jié)合到對話系統(tǒng)中來。

2. 功能運營

功能運營主要是在特定的時間點，比如某些節(jié)日、或者有特殊意義的日子、或者臨時發(fā)生一些事件的時候，通過快速干預(yù)某些特定的說法的反饋，通過編輯特定說法的TTS回復(fù)，來實現(xiàn)系統(tǒng)對特殊情況的特殊處理。

六、訓(xùn)練及分析

1. 用戶數(shù)據(jù)統(tǒng)計分析

用戶數(shù)據(jù)統(tǒng)計分析系統(tǒng)，通過對所有實車用戶使用車載語音的情況進行統(tǒng)計分析，能夠得出不同維度、不同粒度的分析報表。定期進行報表的解讀和分析，可用得出的結(jié)論來指導(dǎo)系統(tǒng)功能的改進。

2. 訓(xùn)練系統(tǒng)

針對音頻、文本、圖像的采集+標(biāo)注系統(tǒng)，企業(yè)通過定期常規(guī)的對線上數(shù)據(jù)的回收、標(biāo)注和不定期的對特殊要求數(shù)據(jù)的采集、標(biāo)注，生產(chǎn)出各個AI模型需要的數(shù)據(jù)，提供模型訓(xùn)練支持；每次模型訓(xùn)練完畢會有迭代上線，從而實現(xiàn)訓(xùn)練數(shù)據(jù)系統(tǒng)和線上模型的一個閉環(huán)迭代，不斷的提升整體的語音產(chǎn)品的能力。

以上便是對智能座艙車載語音系統(tǒng)的完整介紹。如果你對智能座艙產(chǎn)品感興趣，關(guān)注我。

本文由 @賽博七號原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自Unsplash，基于 CC0 協(xié)議。

1.《關(guān)于電腦怎么轉(zhuǎn)發(fā)語音消息，你需要知道這些智能座艙系列六：車載語音系統(tǒng)介紹》援引自互聯(lián)網(wǎng)，旨在傳遞更多網(wǎng)絡(luò)信息知識，僅代表作者本人觀點，與本網(wǎng)站無關(guān)，侵刪請聯(lián)系頁腳下方聯(lián)系方式。

2.《關(guān)于電腦怎么轉(zhuǎn)發(fā)語音消息，你需要知道這些智能座艙系列六：車載語音系統(tǒng)介紹》僅供讀者參考，本網(wǎng)站未對該內(nèi)容進行證實，對其原創(chuàng)性、真實性、完整性、及時性不作任何保證。

3.文章轉(zhuǎn)載時請保留本站內(nèi)容來源地址，http://f99ss.com/gl/3116448.html

丝袜人妻一区二区三区_少妇福利无码视频_亚洲理论片在线观看_一级毛片国产A级片

關(guān)于電腦怎么轉(zhuǎn)發(fā)語音消息，你需要知道這些智能座艙系列六：車載語音系統(tǒng)介紹

1. VOS車端系統(tǒng)

2. VOS車端模塊

3. 語音助手

4. 本地對話系統(tǒng)(本地DS)

5. 本地NLU

6. 本地TTS

1. 對話系統(tǒng)

2. 模型

3. 云端TTS

1. 數(shù)據(jù)運營

2. 功能運營

1. 用戶數(shù)據(jù)統(tǒng)計分析

2. 訓(xùn)練系統(tǒng)

電腦怎么轉(zhuǎn)發(fā)語音？總結(jié)很全面速看!筆記本上內(nèi)置的智能語音助手，比手機還好用

關(guān)于電腦怎么轉(zhuǎn)發(fā)語音消息，你需要知道這些大家快來看，不用再敲鍵盤寫文章啦

電腦怎么轉(zhuǎn)發(fā)語音消息？我來告訴你答案這款超好用的文字轉(zhuǎn)語音神器，接近真人發(fā)音，感情色彩豐富

丝袜人妻一区二区三区_少妇福利无码视频_亚洲理论片在线观看_一级毛片国产A级片

關(guān)于電腦怎么轉(zhuǎn)發(fā)語音消息，你需要知道這些智能座艙系列六：車載語音系統(tǒng)介紹

1. VOS車端系統(tǒng)

2. VOS車端模塊

3. 語音助手

4. 本地對話系統(tǒng)(本地DS)

5. 本地NLU

6. 本地TTS

1. 對話系統(tǒng)

2. 模型

3. 云端TTS

1. 數(shù)據(jù)運營

2. 功能運營

1. 用戶數(shù)據(jù)統(tǒng)計分析

2. 訓(xùn)練系統(tǒng)

電腦怎么轉(zhuǎn)發(fā)語音？總結(jié)很全面速看!筆記本上內(nèi)置的智能語音助手，比手機還好用

關(guān)于電腦怎么轉(zhuǎn)發(fā)語音消息，你需要知道這些大家快來看，不用再敲鍵盤寫文章啦

電腦怎么轉(zhuǎn)發(fā)語音消息？我來告訴你答案這款超好用的文字轉(zhuǎn)語音神器，接近真人發(fā)音，感情色彩豐富

關(guān)于電腦怎么轉(zhuǎn)發(fā)語音消息，你需要知道這些智能座艙系列六：車載語音系統(tǒng)介紹

電腦怎么轉(zhuǎn)發(fā)語音？總結(jié)很全面速看!筆記本上內(nèi)置的智能語音助手，比手機還好用

關(guān)于電腦怎么轉(zhuǎn)發(fā)語音消息，你需要知道這些大家快來看，不用再敲鍵盤寫文章啦

電腦怎么轉(zhuǎn)發(fā)語音消息？我來告訴你答案這款超好用的文字轉(zhuǎn)語音神器，接近真人發(fā)音，感情色彩豐富