- 首頁(yè)
- 產(chǎn)品百科
- 語(yǔ)音識(shí)別
相關(guān)案例
語(yǔ)音識(shí)別技術(shù)簡(jiǎn)介
2019/11/17 16:52:33 查看:1127
語(yǔ)音識(shí)別技術(shù),也被稱為自動(dòng)語(yǔ)音識(shí)別Automatic Speech Recognition,(ASR),其目標(biāo)是將人類的語(yǔ)音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列。與說(shuō)話人識(shí)別及說(shuō)話人確認(rèn)不同,后者嘗試識(shí)別或確認(rèn)發(fā)出語(yǔ)音的說(shuō)話人而非其中所包含的詞匯內(nèi)容。
語(yǔ)音識(shí)別的工作模式
音識(shí)別一般來(lái)說(shuō)具有兩種工作模式:識(shí)別模式和命令模式。語(yǔ)音識(shí)別程序的實(shí)現(xiàn)也會(huì)根據(jù)兩種模式的不同而采用不同類型的程序。識(shí)別模式的工作原理是:引擎系統(tǒng)在后臺(tái)直接給出一個(gè)詞庫(kù)和識(shí)別模板庫(kù),任何系統(tǒng)都不需要再進(jìn)一 步對(duì)識(shí)別語(yǔ)法進(jìn)行改動(dòng),只需要根據(jù)識(shí)別引擎提供的主程序源代碼進(jìn)行改寫(xiě)就可以了。命令模式相對(duì)來(lái)說(shuō)實(shí)現(xiàn)起來(lái)比較困難,詞典必須要由程序員自己編寫(xiě),然后再進(jìn)行編程,后還要根據(jù)語(yǔ)音詞典進(jìn)行處理和更正。識(shí)別模式與命令模式大的不同就是,程序員要根據(jù)詞典內(nèi)容進(jìn)行代碼的核對(duì)與修改。
語(yǔ)音識(shí)別環(huán)境設(shè)置
一般語(yǔ)音識(shí)別程序的環(huán)境設(shè)置步驟包括CTI服務(wù)器硬件默認(rèn)參數(shù)采集與設(shè)定,識(shí)別硬件采集卡初始化,引擎端口設(shè)置等幾個(gè)部分。
1、CTI 服務(wù)器設(shè)置。
應(yīng)用程序的所有工作都是根據(jù)CTI技術(shù)(Computer Telephone Integration)來(lái)工作的, 語(yǔ)音硬件平臺(tái)默認(rèn)設(shè)定 CTI 服務(wù)器。
2、語(yǔ)音采集系統(tǒng)的初始化。
語(yǔ)音識(shí)別的平臺(tái)會(huì)通過(guò)判斷是否已經(jīng)輸入語(yǔ)音來(lái)進(jìn)行工作,那么獲得語(yǔ)音就需要語(yǔ)音采集系統(tǒng)了。為了采集和輸出,我們一般采用語(yǔ)音卡作為工具。工作時(shí),打開(kāi)語(yǔ)音卡內(nèi)自帶的板卡,然后在程序中加入?yún)?shù)就可以運(yùn)行了。
3、引擎端口設(shè)置。語(yǔ)音開(kāi)發(fā)平臺(tái)已對(duì)硬件API接口函數(shù)進(jìn)行提供, 因此只需對(duì)函數(shù)進(jìn)行調(diào)用和賦值即可。
語(yǔ)音字典的編譯
語(yǔ)音字典的設(shè)置包括語(yǔ)法、識(shí)別語(yǔ)音的規(guī)則、語(yǔ)音模板制作等內(nèi)容,根據(jù)語(yǔ)音平臺(tái)的規(guī)則來(lái)進(jìn)行。在語(yǔ)音字典設(shè)置時(shí),首先要設(shè)置語(yǔ)音識(shí)別核心包,再根據(jù)自己編譯的語(yǔ)音的規(guī)則來(lái)完成字典的全部設(shè)置。
編制識(shí)別主程序
在編譯語(yǔ)音識(shí)別程序的后階段,程序員需要為主程序編寫(xiě)GUI(Graphical User Interface) 界面,以便于用戶與計(jì)算機(jī)進(jìn)行交互操作。
聯(lián)系我們
- 北京朝陽(yáng)區(qū)惠新西街天建大廈
- Email: 179288518@qq.com
- 技術(shù):
- 商務(wù):
- QQ:
- 工作時(shí)間 9:00pm – 18:00pm.
虛擬現(xiàn)實(shí)VR/AR
體感互動(dòng)
關(guān)注我們
? 2018-2019 u3dz.com 版權(quán)所有 京ICP備16066575號(hào)-5