【2015年5月25日】隨著智能手機(jī)的快速普及,語(yǔ)音識(shí)別輸入作為一種便捷易行的文字輸入方式,一直是學(xué)術(shù)界和產(chǎn)業(yè)界關(guān)注的熱點(diǎn)。作為擁有三十余年研發(fā)經(jīng)驗(yàn)的行業(yè)先行者,東芝公司在語(yǔ)音識(shí)別領(lǐng)域一直進(jìn)行著卓有成效的理論研究和產(chǎn)品開(kāi)發(fā),對(duì)中文語(yǔ)音識(shí)別系統(tǒng)的創(chuàng)新不斷取得實(shí)質(zhì)性突破。近期,東芝公司設(shè)在中國(guó)的研究開(kāi)發(fā)中心傳來(lái)最新消息:通過(guò)利用深度學(xué)習(xí)算法對(duì)模型進(jìn)行最優(yōu)化,東芝將為中文連續(xù)語(yǔ)音識(shí)別帶來(lái)更具應(yīng)用價(jià)值的解決方案。
東芝語(yǔ)音識(shí)別技術(shù)支持不同層次的系統(tǒng)要求,高魯棒性嵌入式語(yǔ)音識(shí)別引擎和針對(duì)不同口音的技術(shù)優(yōu)化使其可用于各類(lèi)電子設(shè)備。在現(xiàn)有高效語(yǔ)音識(shí)別系統(tǒng)的基礎(chǔ)上,為進(jìn)一步提升中文連續(xù)語(yǔ)音識(shí)別準(zhǔn)確率,東芝語(yǔ)音研發(fā)團(tuán)隊(duì)利用鑒別性基頻特征和帶調(diào)聲學(xué)建模,圓滿解決了中文所特有的同音異調(diào)詞語(yǔ)辨別的技術(shù)難題。同時(shí),新系統(tǒng)增加了對(duì)英文縮略語(yǔ)的識(shí)別功能,在中英文互譯應(yīng)用中更加得心應(yīng)手。
面對(duì)中文語(yǔ)音識(shí)別實(shí)用化的兩大難點(diǎn)——新詞識(shí)別和口語(yǔ)識(shí)別,技術(shù)人員引入全新的詞捕捉算法和深度學(xué)習(xí)算法,大幅提升了識(shí)別準(zhǔn)確率。據(jù)東芝語(yǔ)音研發(fā)團(tuán)隊(duì)負(fù)責(zé)人丁沛博士透露,新系統(tǒng)可將中文新詞的識(shí)別率提高至98%以上,而對(duì)朗讀語(yǔ)音和會(huì)議口語(yǔ)的識(shí)別率分別超過(guò)了95%和92%,在各類(lèi)場(chǎng)景下都能實(shí)現(xiàn)高精度識(shí)別,為高質(zhì)量的人機(jī)交互打下基礎(chǔ)。
始于上世紀(jì)70年代的東芝語(yǔ)音識(shí)別技術(shù)現(xiàn)已形成以東京-劍橋-北京為中心的全球研發(fā)體系,開(kāi)發(fā)出包括中、日、英、法、德等十四種以上的語(yǔ)言識(shí)別系統(tǒng)。目前,東芝在中文語(yǔ)音的識(shí)別、合成和自然語(yǔ)言處理技術(shù)的研發(fā)上成果卓著,廣泛應(yīng)用于PC、車(chē)載、移動(dòng)通信、互聯(lián)網(wǎng)等領(lǐng)域,并在多項(xiàng)國(guó)際評(píng)比中展現(xiàn)出行業(yè)領(lǐng)導(dǎo)力。東芝(中國(guó))研究開(kāi)發(fā)中心作為東芝全球四大研發(fā)基地之一,近年來(lái)在人機(jī)交互、軟件開(kāi)發(fā)和高校合作方面都取得了積極進(jìn)展,不斷將全球最尖端的技術(shù)方案引入中國(guó),強(qiáng)化東芝各業(yè)務(wù)領(lǐng)域的市場(chǎng)競(jìng)爭(zhēng)力。
此次對(duì)于中文語(yǔ)音識(shí)別系統(tǒng)的技術(shù)升級(jí),顯示了東芝(中國(guó))研究開(kāi)發(fā)中心在該領(lǐng)域的持續(xù)專注和領(lǐng)先實(shí)力,是對(duì)中文語(yǔ)音識(shí)別應(yīng)用的又一次技術(shù)突破。據(jù)悉,此次創(chuàng)新將加速東芝語(yǔ)音技術(shù)在中國(guó)的產(chǎn)品化和市場(chǎng)推廣,將更具實(shí)用價(jià)值的語(yǔ)音系統(tǒng)帶給中國(guó)用戶。