近期,東芝開發(fā)了支持中日、中英翻譯的會(huì)議支援系統(tǒng)。該系統(tǒng)使用公司最新研發(fā)的文本整理技術(shù)和關(guān)鍵詞抽取技術(shù),解決了會(huì)議中的專業(yè)術(shù)語、口語化發(fā)言等翻譯問題,使同聲翻譯的精度大幅提高。文本整理技術(shù),是將發(fā)言內(nèi)容分割成多個(gè)易翻譯的單元,再按正確語法整理成文的技術(shù);關(guān)鍵詞抽取技術(shù),是從會(huì)議資料中自動(dòng)抽取關(guān)鍵詞的技術(shù)。按計(jì)劃,東芝將在內(nèi)部啟動(dòng)運(yùn)行,以測(cè)評(píng)該系統(tǒng)是否能達(dá)到預(yù)期效果。
隨著制造業(yè)的全球化及中國(guó)、印度等新興國(guó)家市場(chǎng)的日益增長(zhǎng),東芝與海外企業(yè)之間的會(huì)議交流使用外語的情況不斷增多,而不同語言導(dǎo)致的溝通障礙和誤解、翻譯成本增加、外語人才管理等,都已成為日漸突出的經(jīng)營(yíng)課題。
當(dāng)下,語音識(shí)別和機(jī)器翻譯技術(shù)突飛猛進(jìn),尤其在旅行和購物等日常會(huì)話方面,已出現(xiàn)實(shí)用性語音翻譯工具。然而,會(huì)議中的專業(yè)術(shù)語和口語性發(fā)言等增加了翻譯難度,迄今尚未開發(fā)出適用于商務(wù)領(lǐng)域的實(shí)用化翻譯系統(tǒng)。為解決這一問題,東芝推出外語會(huì)議支援系統(tǒng)。
該系統(tǒng)采用東芝最新研發(fā)的文本整理技術(shù),即利用捕捉發(fā)言者口語化發(fā)言的共通性的規(guī)則型翻譯,與收集大量多樣化實(shí)例而逐漸改進(jìn)的統(tǒng)計(jì)型翻譯,將難翻譯、難理解的語句修整為易翻譯句法和長(zhǎng)度。而相關(guān)的文本整理網(wǎng)絡(luò)工具,可收集大量的文本整理實(shí)例和對(duì)整理結(jié)果進(jìn)行高效評(píng)價(jià),從而大幅提高文本整理的精度。
為防止未知詞匯造成的聲音識(shí)別精度和翻譯精度下降,東芝還研發(fā)了關(guān)鍵詞抽取技術(shù)。即從會(huì)議資料中自動(dòng)抽取專業(yè)術(shù)語等會(huì)議所需詞匯,在會(huì)議開始前預(yù)先存儲(chǔ)該詞匯的正確翻譯。經(jīng)過文本整理后的原文,通過關(guān)鍵詞抽取技術(shù)和東芝獨(dú)有的統(tǒng)計(jì)型+規(guī)則型混合機(jī)器翻譯方式進(jìn)行處理,對(duì)各種發(fā)言實(shí)現(xiàn)高品質(zhì)翻譯。
此外,東芝還開發(fā)了支持遠(yuǎn)程會(huì)議、面對(duì)面會(huì)議和演講的支援系統(tǒng)。使用該系統(tǒng)在公司內(nèi)部進(jìn)行測(cè)評(píng),日語能力測(cè)試二級(jí)或二級(jí)以上的測(cè)試對(duì)象對(duì)日語會(huì)議內(nèi)容的理解度從60%提高到80%,而日語能力測(cè)試二級(jí)以下或完全不懂日語的測(cè)試對(duì)象理解度則從30%提高到60%。該系統(tǒng)此前僅在開發(fā)部門內(nèi)部進(jìn)行試運(yùn)行,本次則將在包括5家中國(guó)當(dāng)?shù)毓驹趦?nèi)的東芝集團(tuán)內(nèi)部投入試運(yùn)行。東芝將在內(nèi)部應(yīng)用的基礎(chǔ)上,不斷積累內(nèi)部會(huì)議翻譯所需的語言數(shù)據(jù),在力爭(zhēng)將翻譯譯文的可理解度提高到80%以上的同時(shí),不斷完善會(huì)議語音應(yīng)用系統(tǒng)的各項(xiàng)功能。
相關(guān)視頻請(qǐng)點(diǎn)擊:http://3rlvecde.com/aboutus/dzsp/cpxc/video11.html