5良好的開源語音識別/語音到文本系統(tǒng)20開源語音識別
它可能是歷史上最古老的語音識別軟件之一。它的發(fā)展始于1991年的京都大學(xué),然后在2005年所有權(quán)轉(zhuǎn)移給了一個獨(dú)立的項目團(tuán)隊。
Julius的主要功能包括執(zhí)行實時STT的能力、低內(nèi)存占用(20,000個單詞小于64 MB)、輸出最佳單詞N-最佳單詞和單詞圖的能力以及作為服務(wù)器單元運(yùn)行的能力。這個軟件主要是為學(xué)術(shù)和研究機(jī)構(gòu)設(shè)計的。用c語言編寫,可以在Linux、Windows、macOS甚至Android(智能手機(jī)上)上運(yùn)行。
目前只支持英語和日語。軟件應(yīng)該很容易從Linux發(fā)行倉庫安裝。在包裹管理器里搜索朱利葉斯。最新版本大概是這篇文章發(fā)表前的一個半月。
Wav2Letter++
5良好的開源語音識別/語音到文本系統(tǒng)22開源語音識別
如果你正在尋找一個更時尚的,那么這個一定會適合你。Wav2Letter++是兩個月前Facebook的AI研究團(tuán)隊發(fā)布的開源語言識別軟件。代碼在BSD許可下發(fā)布。
Facebook將其圖書館描述為“最快、最先進(jìn)的語音識別系統(tǒng)”。它的構(gòu)建理念是默認(rèn)情況下針對性能進(jìn)行優(yōu)化。Facebook最新的機(jī)器學(xué)習(xí)庫手電筒(手電筒)也被用作Wav2Letter++的底層核心。
Wav2Letter++需要你為描述的語言建立一個模型來訓(xùn)練算法。沒有任何語言(包括英語)的預(yù)培訓(xùn)模式。它只是一個用C++編寫的機(jī)器學(xué)習(xí)驅(qū)動的文語轉(zhuǎn)換工具,所以取名Wav2Letter++。
項目主頁
深度速度2
5良好的開源語音識別/語音到文本系統(tǒng)24開源語音識別
中國軟件巨頭百度的研究人員也在開發(fā)他們自己的語音到文本轉(zhuǎn)換引擎“深度語音2”。它是一個端到端的開源引擎,使用“PaddlePaddle”深度學(xué)習(xí)框架來轉(zhuǎn)換英文或中文字符。代碼在BSD許可下發(fā)布。
引擎可以在你想要的任何模型和任何語言上訓(xùn)練。模型沒有隨代碼一起發(fā)布。你必須像其他軟件一樣建立自己的模型。DeepSpeech2的源代碼是用Python寫的,用過的話會很好用。
項目主頁
總結(jié)
語音識別領(lǐng)域仍由專有軟件巨頭主導(dǎo),如Google和IBM(為此提供閉源商業(yè)服務(wù)),但開源類似軟件大有可為。這五個開源語音識別引擎應(yīng)該能夠幫助你構(gòu)建應(yīng)用,并且隨著時間的推移會不斷發(fā)展。幾年后,我們希望開源能像其他行業(yè)一樣,成為這些技術(shù)的規(guī)范。
如果您對列表有其他建議或意見,我們很樂意在下面聽到。
本文由原創(chuàng)編輯,榮譽(yù)推出
1.《speech 5 款不錯的開源語音識別/語音文字轉(zhuǎn)換系統(tǒng) | Linux 中國》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡(luò)信息知識,僅代表作者本人觀點(diǎn),與本網(wǎng)站無關(guān),侵刪請聯(lián)系頁腳下方聯(lián)系方式。
2.《speech 5 款不錯的開源語音識別/語音文字轉(zhuǎn)換系統(tǒng) | Linux 中國》僅供讀者參考,本網(wǎng)站未對該內(nèi)容進(jìn)行證實,對其原創(chuàng)性、真實性、完整性、及時性不作任何保證。
3.文章轉(zhuǎn)載時請保留本站內(nèi)容來源地址,http://f99ss.com/guoji/1067547.html