試想一下,我們?cè)诟咚俟飞鲜褂肎PS導(dǎo)航時(shí),我們更愿意口述目的地還是手動(dòng)輸入目的地?未來,語音將極大程度上代替鍵盤,成為我們與計(jì)算機(jī)交流的主要方式。
隨著深度學(xué)習(xí)、大數(shù)據(jù)以及云計(jì)算在語音識(shí)別中的廣泛應(yīng)用,語音識(shí)別的技術(shù)得到了長(zhǎng)足的進(jìn)展,在此方面有多年經(jīng)驗(yàn)的東芝綜合運(yùn)用其先進(jìn)的語音、圖像識(shí)別技術(shù)并綜合云計(jì)算服務(wù),開發(fā)出能夠助力人與人交流的AI技術(shù)——“RECAIUS?”。
為了實(shí)現(xiàn)人與AI安心、舒適、協(xié)調(diào)共存,AI需要具備能夠捕捉人類感知和體驗(yàn)的判斷。在語音識(shí)別方面,即便AI沒有完全聽清人們的語音,也能夠從表情動(dòng)作中給出恰當(dāng)?shù)膽?yīng)答,并實(shí)現(xiàn)一對(duì)一的簡(jiǎn)單會(huì)話,還可分辨多個(gè)會(huì)話組合,通過計(jì)算機(jī)算法形成文本。為此,東芝開發(fā)出的 RECAIUS? 能夠根據(jù)人的表情、聲音和動(dòng)作,綜合判斷把握具體意圖和狀況并做出適宜應(yīng)答?!?/p>
“RECAIUS?” 你身邊的同聲傳譯
試想一下,如果一個(gè)以英語為母語的人,他一句普通話也不懂,當(dāng)他想和一位土生土長(zhǎng)的中國(guó)人交談,他面臨的選擇有兩個(gè):要么他開始艱難的學(xué)習(xí),直到能夠熟練掌握中文;要么他就得雇另一個(gè)人來幫他翻譯對(duì)話,而有了“RECAIUS?”,就相當(dāng)于你身邊有一位同聲傳譯。
相對(duì)你手機(jī)里面其他的翻譯軟件,東芝的“RECAIUS?”具備了同聲傳譯的功能,其不僅可以翻譯多國(guó)語言,而且即便是語句間沒有間斷的連續(xù)語音,“RECAIUS?”也能自動(dòng)判斷適合翻譯的單位,實(shí)現(xiàn)智能斷句,然后逐句完成翻譯。面對(duì)一些固有名詞被生硬直譯后無法理解的情況,使用者可以登錄固有詞匯或例句,給出應(yīng)當(dāng)如何翻譯的指示,“RECAIUS?”就能給出恰當(dāng)?shù)姆g。
所見即能翻譯 真正的讀圖時(shí)代
除了語音識(shí)別、交互、翻譯等功能,東芝還開發(fā)了將可視文字信息即時(shí)翻譯成其他語言的技術(shù)。想象一下,人們出國(guó)旅行,來到一家以美味著稱的餐館,卻往往被菜單上的異國(guó)文字搞得一頭霧水,如果菜單上又沒有圖片,根本不知道該如何點(diǎn)菜,而東芝的“RECAIUS?”可幫你擺脫這個(gè)困境,拿起智能手機(jī)對(duì)準(zhǔn)菜單進(jìn)行拍攝,東芝“RECAIUS?”可以瞬間把菜品翻譯成母語,讓你輕松點(diǎn)菜。
(圖:抹茶 綠茶 烘焙茶 烏龍茶 玄米茶 中國(guó)茶)
但是,人們用相機(jī)拍攝圖像時(shí),照片上不只有文字,還有背景、圖案等其他信息,為了能夠清晰地從復(fù)雜圖像中辨別出文字信息,東芝開發(fā)出獨(dú)有的圖像特征提取技術(shù),可以精準(zhǔn)檢測(cè)到文字。而這一技術(shù)對(duì)國(guó)外的街景圖像很有效果,“RECAIUS?”可以輕松地從街景的圖像中識(shí)別其中的字符串,判斷語言屬性并將字符翻譯成你需要的語言文字顯示在屏幕上。未來我們帶上AR眼鏡,沉浸在異國(guó)他鄉(xiāng)的外語世界,或許能夠?qū)⒀矍俺涑庵庹Z的世界轉(zhuǎn)換成母語來欣賞,會(huì)不會(huì)是一種非常陌生而又熟悉的景象?
東芝秉承“以人為本”的技術(shù)研發(fā)理念
梅木秀雄表示:“隨著科技的進(jìn)步以及物聯(lián)網(wǎng)IoT(Internet of Things)時(shí)代的到來,未來不僅是物與物相連,還有人與人相連以及人與物相連。為了給人們的生活和工作創(chuàng)造更加安心、安全、舒適的環(huán)境,東芝將一如既往地秉承以人為本的理念,開發(fā)越來越智能的AI技術(shù),實(shí)現(xiàn)更安全、舒適、人與AI和諧共生的社會(huì)?!?/p>
*標(biāo)注的日期為日文原文發(fā)布日期
*注:RECAIUS是東芝數(shù)字解決方案株式會(huì)社在日本的商標(biāo)以及注冊(cè)商標(biāo)。