訊飛語音輸入語音識別技術(shù)原理是什么訊飛語音識別技術(shù)特點介紹【詳解】

2020-11-25 01:38:23 科技數(shù)碼

　　語音識別技術(shù)原理簡介

　　自動語音識別技術(shù)(Auto Speech Recognize，簡稱ASR)所要解決的問題是讓計算機能夠“聽懂”人類的語音，將語音中包含的文字信息“提取”出來。ASR技術(shù)在“能聽會說”的智能計算機系統(tǒng)中扮演著重要角色，相當(dāng)于給計算機系統(tǒng)安裝上“耳朵”，使其具備“能聽”的功能，進(jìn)而實現(xiàn)信息時代利用“語音”這一最自然、最便捷的手段進(jìn)行人機通信和交互。

　　語音識別技術(shù)所面臨的問題是非常艱巨和困難的。盡管早在二十世紀(jì)五十年代，世界各國就開始了對這項技術(shù)孜孜不倦的研究，特別是最近二十年，國內(nèi)外非常多的研究機構(gòu)和企業(yè)都加入到語音識別技術(shù)的研究領(lǐng)域，投入了極大的努力，也取得了豐碩的成果，但是直到今天，距離該技術(shù)得到完美解決還存在著巨大的差距，不過這并不妨礙不斷進(jìn)步的語音識別系統(tǒng)在許多相對受限的場合下獲得成功的應(yīng)用。

　　如今，語音識別技術(shù)已經(jīng)發(fā)展成為涉及聲學(xué)、語言學(xué)、數(shù)字信號處理、統(tǒng)計模式識別等多學(xué)科技術(shù)的一項綜合性技術(shù)。基于語音識別技術(shù)研發(fā)的現(xiàn)代語音識別系統(tǒng)在很多場景下獲得了成功的應(yīng)用，不同任務(wù)條件下所采用的技術(shù)又會有所不同。下圖是在一個相對通用的任務(wù)條件下的語音識別系統(tǒng)示意圖。語音識別系統(tǒng)構(gòu)建過程整體上包括兩大部分：訓(xùn)練和識別。訓(xùn)練通常是離線完成的，對預(yù)先收集好的海量語音、語言數(shù)據(jù)庫進(jìn)行信號處理和知識挖掘，獲取語音識別系統(tǒng)所需要的“聲學(xué)模型”和“語言模型”;而識別過程通常是在線完成的，對用戶實時的語音進(jìn)行自動識別。識別過程通常又可以分為“前端”和“后端”兩大模塊：“前端”模塊主要的作用是進(jìn)行端點檢測(去除多余的靜音和非說話聲)、降噪、特征提取等;“后端”模塊的作用是利用訓(xùn)練好的“聲學(xué)模型”和“語言模型”對用戶說話的特征向量進(jìn)行統(tǒng)計模式識別(又稱“解碼”)，得到其包含的文字信息，此外，后端模塊還存在一個“自適應(yīng)”的反饋模塊，可以對用戶的語音進(jìn)行自學(xué)習(xí)，從而對“聲學(xué)模型”和“語音模型”進(jìn)行必要的“校正”，進(jìn)一步提高識別的準(zhǔn)確率。

　　語音識別技術(shù)發(fā)展歷史及現(xiàn)狀

　　語音識別的研究工作大約開始于20世紀(jì)50年代，當(dāng)時AT&T Bell實驗室基于共振峰提取技術(shù)實現(xiàn)了第一個可識別十個英文數(shù)字的語音識別系統(tǒng)——Audry系統(tǒng)。

　　60年代，計算機的應(yīng)用推動了語音識別的發(fā)展。這時期的重要成果是提出了動態(tài)時間規(guī)劃(DP)和線性預(yù)測分析技術(shù)(LPC)，其中后者較好地解決了語音信號產(chǎn)生模型的問題，對語音識別的發(fā)展產(chǎn)生了深遠(yuǎn)影響。

　　70年代，語音識別領(lǐng)域取得了較大進(jìn)展。在理論上，LP技術(shù)得到進(jìn)一步發(fā)展，動態(tài)時間歸正技術(shù)(DTW)基本成熟，特別是提出了矢量量化(VQ)和隱馬爾可夫模型(HMM)理論。在實踐上，實現(xiàn)了基于線性預(yù)測倒譜和DTW技術(shù)的特定人孤立語音識別系統(tǒng)。

　　80年代，MFCC的參數(shù)提取技術(shù)和HMM模型的深入使用使得語音識別技術(shù)得到進(jìn)一步的發(fā)展，語音識別的問題逐步在理論體系上得到了比較完整和準(zhǔn)確的描述，同時在實踐上又逐步研發(fā)出效率較高的解決算法。

　　90年代以來，在美國國防部的Darpa測試、Ears計劃、近期的Gales計劃，以及我國863計劃等推動下，一大批高水平的研究機構(gòu)和企業(yè)加入到語音識別的研究領(lǐng)域，極大地推動了語音識別技術(shù)的發(fā)展和應(yīng)用。語音識別系統(tǒng)已經(jīng)從過去的小詞匯量、孤立詞識別、特定人識別、安靜環(huán)境等簡單任務(wù)逐步發(fā)展到大詞匯量、連續(xù)語音、非特定人、噪聲環(huán)境下的識別任務(wù)，從單純的語音識別任務(wù)發(fā)展到語音翻譯任務(wù)，從實驗室系統(tǒng)走向商用系統(tǒng)。

　　訊飛語音識別技術(shù)

　　訊飛語音識別技術(shù)的理念是提供信息時代人機溝通的最佳方式。在核心技術(shù)研究方面，科大訊飛公司一直秉承著“頂天立地”的方針?！绊斕臁?，就是要求在基礎(chǔ)技術(shù)上不斷創(chuàng)新，不斷突破;“立地”，就是技術(shù)要和實際應(yīng)用相結(jié)合，最終能夠產(chǎn)生經(jīng)濟效益和社會效益。訊飛語音識別技術(shù)的研究繼承了這樣的優(yōu)良傳統(tǒng)，在基礎(chǔ)技術(shù)方面銳意進(jìn)取，不斷創(chuàng)新，特別是在特征魯棒性、模型區(qū)分性訓(xùn)練、大詞匯量語音識別解碼技術(shù)、語音模糊搜索等方面提出了多項創(chuàng)新性觀點，并多次在國內(nèi)外著名的學(xué)術(shù)期刊、會議及?？线M(jìn)行發(fā)表，取得了豐碩的成果。在技術(shù)與實際應(yīng)用相結(jié)合方面，也充分考慮了應(yīng)用系統(tǒng)之間的差異，為客戶量身定制，提供了語音命令識別、智能語音搜索、語音檢索等技術(shù)，并正在開展針對自然連續(xù)語流的會議內(nèi)容轉(zhuǎn)寫識別整套解決方案。

　　下面是科大訊飛對語音識別技術(shù)的整體規(guī)劃：

　　命令詞識別技術(shù)—在受限的命令詞或者語法范圍提供自動語音識別服務(wù)，需要很少的計算資源，但是要求用戶能夠“配合”語音識別系統(tǒng)，盡量說“集內(nèi)詞”。

　　智能的人機交互技術(shù)—結(jié)合大詞匯量語音識別、自然語言理解、信息檢索等技術(shù)提供特定領(lǐng)域內(nèi)相對開放輸入的語音識別服務(wù)，對用戶的限制較為寬松，在所限定的領(lǐng)域內(nèi)可以以自然語言的方式進(jìn)行人機交互。

　　語音轉(zhuǎn)寫技術(shù)—在無特殊限定的范圍內(nèi)完成對連續(xù)自然語音進(jìn)行內(nèi)容轉(zhuǎn)寫，目前還需要較大的計算資源。

　　語音搜索技術(shù)—語音技術(shù)和搜索技術(shù)的結(jié)合，提供最便捷的信息搜索服務(wù)。

1.《訊飛語音輸入語音識別技術(shù)原理是什么訊飛語音識別技術(shù)特點介紹【詳解】》援引自互聯(lián)網(wǎng)，旨在傳遞更多網(wǎng)絡(luò)信息知識，僅代表作者本人觀點，與本網(wǎng)站無關(guān)，侵刪請聯(lián)系頁腳下方聯(lián)系方式。

2.《訊飛語音輸入語音識別技術(shù)原理是什么訊飛語音識別技術(shù)特點介紹【詳解】》僅供讀者參考，本網(wǎng)站未對該內(nèi)容進(jìn)行證實，對其原創(chuàng)性、真實性、完整性、及時性不作任何保證。

3.文章轉(zhuǎn)載時請保留本站內(nèi)容來源地址，http://f99ss.com/keji/433355.html

超光速通訊量子超光速通信是什么量子超光速通信優(yōu)點介紹【圖文】

和數(shù)是什么數(shù)字技術(shù)原理是什么數(shù)字技術(shù)優(yōu)勢介紹【詳解】

數(shù)字技術(shù)原理術(shù)語大全　　世界通信與信息技術(shù)的迅猛發(fā)展將引發(fā)整個電視廣播產(chǎn)業(yè)鏈的變革，數(shù)字電視是這一變革中的關(guān)鍵環(huán)節(jié)。伴隨著電視廣播的全面數(shù)字化，傳統(tǒng)的電視媒體將在技術(shù)、功能上逐步與信息、通信領(lǐng)域的其它手段相互融合，從而形成全新的、龐大的數(shù)字電視產(chǎn)業(yè)。這一新興產(chǎn)業(yè)已經(jīng)引起廣泛的關(guān)注，各發(fā)達(dá)國家根據(jù)自己的國情，已分別制定出由模擬電視向數(shù)字電視過渡的方...

手機語音信箱手機語音信箱如何使用手機語音信箱功能介紹【詳解】

手機語音信箱如何使用　　語音信箱　　當(dāng)您工作繁忙、手機關(guān)機、手機超出網(wǎng)絡(luò)覆蓋范圍或電池沒電而無法接聽來電時，您可通過手機鍵盤操作設(shè)置語音信箱轉(zhuǎn)移功能，語音信箱將隨時替您收錄來話，使您不會錯過任何電話，同時可使您回避某些電話，減少打擾。當(dāng)您的手機處于可接通狀態(tài)，短消息中心會即時通知您收聽已記錄的留言?！　≌Z音信箱———來電一個也不丟　　語音信箱是移...

什么叫納米技術(shù) 納米技術(shù)是什么納米技術(shù)在通信中的應(yīng)用介紹【圖文】

納米技術(shù)在通信中的應(yīng)用　　納米科技中的“納米”為10-9 m，用符號表示為nm，是lmm的100萬分之一。原子的直徑為0.1-0.3nm。研究小于10-l0m以下的原子內(nèi)部結(jié)構(gòu)屬于原子核物理、粒子物理的范疇?！　〖{米科技是指在納米尺度(1nm到l00nm之間)上研究物質(zhì)(包括原子、分子的操縱)的特性和相互作用，以及利用這些特性的多學(xué)科交叉的科學(xué)和...

surround StereoSurround音頻是什么 StereoSurround音頻技術(shù)特點【圖文】

什么是StereoSurround音頻技術(shù)　　StereoSurround音頻技術(shù)是一種環(huán)繞立體聲音頻壓縮編碼技術(shù)。聲音具有很強的表現(xiàn)力，而過去視頻、音頻組合系統(tǒng)卻只重視圖像清晰度而忽視聲音質(zhì)量，致使視聽融合感差，綜合表現(xiàn)能力不能充分發(fā)揮。立體聲出現(xiàn)后，聲系統(tǒng)質(zhì)量得到了提高，但雙聲道立體聲具有方向感而缺少環(huán)境感。因此，在四聲道立體聲基礎(chǔ)上出現(xiàn)的環(huán)...

網(wǎng)絡(luò)可視電話網(wǎng)絡(luò)可視電話是什么網(wǎng)絡(luò)可視電話技術(shù)介紹【詳解】

網(wǎng)絡(luò)可視電話是什么　　網(wǎng)絡(luò)可視電話是一種基于網(wǎng)絡(luò)傳輸?shù)模曨l、語音于一體的多媒體通信業(yè)務(wù)，用戶進(jìn)行語音通話的同時，通過終端的屏幕看到對方的視頻圖像，同時將自己的本地圖像傳輸?shù)綄Ψ健＞W(wǎng)絡(luò)可視電話是基于VoIP技術(shù)的語音、視頻通信軟件，與語音交換服務(wù)器、電話網(wǎng)關(guān)和接點交換服務(wù)器構(gòu)成完整的語音、視頻通信平臺?！　【W(wǎng)絡(luò)可視電話系統(tǒng)主要設(shè)備包括：語音交換...

信用卡提額技術(shù) 信用卡提額技術(shù)一覽，信用卡提額有哪些技巧與好處？

大家覺得自己現(xiàn)在信用卡的額度夠用嗎？如果不夠用沒關(guān)系，相信看了本文之后大家就知道怎么幫助自己的信用卡提額了！今天本站就偷偷告訴大家一些信用卡提額技術(shù)，相信大家一定會受用匪淺！　　信用卡提額技術(shù)一覽：　　1、多刷卡　　經(jīng)常用信用卡，不管多少錢，只要能刷卡，那就使用信用卡支付?！　?、多用額度　　最好每月賬單消費至少占總額的30%。3、臨時提額　　對...

計算機應(yīng)用技術(shù)專業(yè)介紹計算機應(yīng)用技術(shù)專業(yè)介紹 [代碼590101]

[導(dǎo)讀]：本文講述了計算機應(yīng)用技術(shù)專業(yè)的基本信息及專業(yè)介紹，如計算機應(yīng)用技術(shù)專業(yè)的課程設(shè)置、就業(yè)方向、就業(yè)前景等，還包括開設(shè)計算機應(yīng)用技術(shù)專業(yè)的院校名單。計算機應(yīng)用技術(shù)專業(yè)基本信息學(xué)歷層次：?？茖I(yè)名稱：計算機應(yīng)用技術(shù)專業(yè)代碼：590101所屬門類：電子信息所屬學(xué)科：計算機類培養(yǎng)方向：衛(wèi)生信息管理、移動應(yīng)用開發(fā)、游戲軟件開發(fā)、動漫設(shè)計與制作、計算...

tcl鈦金空調(diào) 鈦金是什么金 TCL鈦金空調(diào)技術(shù)大揭秘

材質(zhì)決定性能！材質(zhì)對空調(diào)行業(yè)的發(fā)展有至關(guān)重要的作用，因為空調(diào)的功能創(chuàng)新是建立在好材質(zhì)的基礎(chǔ)上。材質(zhì)決定性能！材質(zhì)對空調(diào)行業(yè)的發(fā)展有至關(guān)重要的作用，因為空調(diào)的功能創(chuàng)新是建立在好材質(zhì)的基礎(chǔ)上?？照{(diào)企業(yè)往往單憑外表的不斷改變和詞語的不斷更新立于行業(yè)之地，不是長久之計。想要在空調(diào)行業(yè)新的高度上睥睨天下，一套...

丝袜人妻一区二区三区_少妇福利无码视频_亚洲理论片在线观看_一级毛片国产A级片

訊飛語音輸入語音識別技術(shù)原理是什么訊飛語音識別技術(shù)特點介紹【詳解】

超光速通訊量子超光速通信是什么量子超光速通信優(yōu)點介紹【圖文】

入是什么結(jié)構(gòu) 電話網(wǎng)絡(luò)結(jié)構(gòu)是什么不同電話網(wǎng)絡(luò)系統(tǒng)介紹【圖文】

和數(shù)是什么數(shù)字技術(shù)原理是什么數(shù)字技術(shù)優(yōu)勢介紹【詳解】

手機語音信箱手機語音信箱如何使用手機語音信箱功能介紹【詳解】

什么叫納米技術(shù) 納米技術(shù)是什么納米技術(shù)在通信中的應(yīng)用介紹【圖文】

surround StereoSurround音頻是什么 StereoSurround音頻技術(shù)特點【圖文】

網(wǎng)絡(luò)可視電話網(wǎng)絡(luò)可視電話是什么網(wǎng)絡(luò)可視電話技術(shù)介紹【詳解】

信用卡提額技術(shù) 信用卡提額技術(shù)一覽，信用卡提額有哪些技巧與好處？

計算機應(yīng)用技術(shù)專業(yè)介紹計算機應(yīng)用技術(shù)專業(yè)介紹 [代碼590101]

tcl鈦金空調(diào) 鈦金是什么金 TCL鈦金空調(diào)技術(shù)大揭秘

訊飛語音輸入 語音識別技術(shù)原理是什么 訊飛語音識別技術(shù)特點介紹【詳解】

超光速通訊 量子超光速通信是什么 量子超光速通信優(yōu)點介紹【圖文】

入是什么結(jié)構(gòu) 電話網(wǎng)絡(luò)結(jié)構(gòu)是什么 不同電話網(wǎng)絡(luò)系統(tǒng)介紹【圖文】

訊飛語音輸入語音識別技術(shù)原理是什么訊飛語音識別技術(shù)特點介紹【詳解】

超光速通訊量子超光速通信是什么量子超光速通信優(yōu)點介紹【圖文】

入是什么結(jié)構(gòu) 電話網(wǎng)絡(luò)結(jié)構(gòu)是什么不同電話網(wǎng)絡(luò)系統(tǒng)介紹【圖文】