波多无码193尤物在线_性无码专区一级_日韩亚洲av人人夜夜澡人人爽_不打码成 人影片在线观看

8887725
翻譯資源
智能語(yǔ)音技術(shù)如何拯救翻譯機(jī):翻譯機(jī)的技術(shù)抉擇和優(yōu)勝略汰
來(lái)源:本站    錄入:2018-8-15
雷鋒網(wǎng)按:智能語(yǔ)音技術(shù)經(jīng)年之后的不斷完善,尤其是隨著語(yǔ)音識(shí)別準(zhǔn)確率的不斷提高,基于智能語(yǔ)音技術(shù)的智能硬件紛至沓來(lái),除了智能音箱一再受眾人追捧外,智能翻譯機(jī)也悄然逆襲,并入這條快車(chē)道。
不同于智能音箱因沒(méi)有明確的應(yīng)用場(chǎng)景備受詬病,智能翻譯機(jī)倒是有諸如商務(wù)會(huì)議、出國(guó)旅行等針對(duì)性較強(qiáng)的應(yīng)用場(chǎng)景,由此帶來(lái)的則是對(duì)深度學(xué)習(xí)算法更高的要求。
機(jī)器翻譯系統(tǒng):RNN、CNN、transformer
智能翻譯機(jī)的技術(shù)基礎(chǔ)說(shuō)到底還是智能語(yǔ)音技術(shù),這一點(diǎn)與智能音箱極為相似,其中,神經(jīng)網(wǎng)絡(luò)翻譯系統(tǒng)尤為關(guān)鍵,各大廠商紛紛針對(duì)這一系統(tǒng)進(jìn)行自研,諸如谷歌的GNMT、科大訊飛的INMT、搜狗的SNMT等。
用于機(jī)器翻譯的神經(jīng)網(wǎng)絡(luò)系統(tǒng)最為經(jīng)典的基礎(chǔ)技術(shù)可以歸為兩類(lèi)——RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))和CNN(卷積神經(jīng)網(wǎng)絡(luò))。主要區(qū)別在于兩類(lèi)系統(tǒng)的執(zhí)行順序不同,采用RNN神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯系統(tǒng)是順序執(zhí)行任務(wù),在進(jìn)行翻譯工作時(shí),要對(duì)整個(gè)句子從左到右或從右到左依次執(zhí)行,精準(zhǔn)度較高,但無(wú)法充分應(yīng)用系統(tǒng)硬件GPU的并行運(yùn)算能力;采用CNN神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯系統(tǒng)則是并行執(zhí)行任務(wù),計(jì)算效率更高。
 
CNN卷積傳輸示意圖
雖然采用CNN的系統(tǒng)的計(jì)算效率更高,但是在做機(jī)器翻譯時(shí)采用CNN的神經(jīng)網(wǎng)絡(luò)系統(tǒng)一直不如采用RNN的神經(jīng)網(wǎng)絡(luò)系統(tǒng),尤其是在翻譯精準(zhǔn)度上差強(qiáng)人意。因而,長(zhǎng)久以來(lái),諸多做翻譯機(jī)的公司雖然對(duì)RNN和CNN都在跟進(jìn)研究,但是各家產(chǎn)品中使用的翻譯系統(tǒng)仍是基于RNN架構(gòu)的較多。
2017年5月,F(xiàn)acebook的FAIR團(tuán)隊(duì)提出一種使用全新CNN架構(gòu)的fairseq,官方給出的數(shù)據(jù)是比基于RNN架構(gòu)的機(jī)器翻譯系統(tǒng)的速度高出9倍,同時(shí),準(zhǔn)確性也是當(dāng)時(shí)最好的。這在當(dāng)時(shí)也一度被認(rèn)為是機(jī)器翻譯系統(tǒng)技術(shù)的一個(gè)轉(zhuǎn)折點(diǎn)。據(jù)雷鋒網(wǎng)了解,就在1個(gè)月后,谷歌在發(fā)表的《Attention is all you need》論文中提出了不使用CNN及RNN的transformer架構(gòu),官方表示采用該架構(gòu)的機(jī)器翻譯模型實(shí)際效果超越了當(dāng)時(shí)所有公開(kāi)的機(jī)器翻譯模型。
 
在技術(shù)角逐的同時(shí),也不乏有科技公司的產(chǎn)品跟進(jìn)。例如搜狗于2017年7月上線了基于transformer的機(jī)器翻譯系統(tǒng)模型,在解決了transformer機(jī)器翻譯系統(tǒng)模型原生系統(tǒng)解碼器解碼速度慢的問(wèn)題后,將速度提升了8倍,并可以運(yùn)用到離線翻譯功能。
 
另外,技術(shù)之間各有優(yōu)勢(shì)也是必然的,尤其是在還沒(méi)有一個(gè)成熟的技術(shù)時(shí),做產(chǎn)品和技術(shù)研發(fā)適度整合多種技術(shù)也是必由之路。例如搜狗在跟進(jìn)transformer機(jī)器翻譯模型的同時(shí),仍然在用CNN做語(yǔ)音識(shí)別上的訓(xùn)練,搜狗語(yǔ)音交互技術(shù)中心研發(fā)總監(jiān)陳偉在參加對(duì)外活動(dòng)時(shí)曾提到:在做語(yǔ)音識(shí)別時(shí),搜狗用50層CNN結(jié)構(gòu)得到語(yǔ)音識(shí)別模型,基于此模型,訓(xùn)練離線語(yǔ)音識(shí)別模型。
產(chǎn)品形態(tài):手機(jī)、耳機(jī)和翻譯機(jī)
翻譯機(jī)的產(chǎn)品形態(tài)主要有三大類(lèi);翻譯機(jī)、翻譯手機(jī)和翻譯耳機(jī)。
 
現(xiàn)在主流市場(chǎng)還是將翻譯機(jī)做成智能硬件單品,例如科大訊飛的曉譯、有道翻譯蛋等,但是市面上較為高端的翻譯機(jī)價(jià)格都在千元左右,科大訊飛的曉譯2.0價(jià)格標(biāo)定為2999元,這其實(shí)已接近市場(chǎng)上中高端手機(jī)的價(jià)格,因而,還是吸引了以智能翻譯機(jī)為主導(dǎo)功能的智能手機(jī)的入局。2018年6月,國(guó)內(nèi)糖果手機(jī)推出糖果S20,支持語(yǔ)音翻譯、拍照翻譯、104種語(yǔ)言、離線翻譯,提供24小時(shí)在線人工翻譯服務(wù),將翻譯機(jī)功能再度整合到手機(jī)中。
耳機(jī)類(lèi)翻譯機(jī)最初在國(guó)外較為流行,如谷歌的Pixel Buds翻譯耳機(jī)、Waverley Lab的Pilot翻譯耳機(jī),通過(guò)藍(lán)牙與手機(jī)中的翻譯APP相連,硬件思路類(lèi)似藍(lán)牙耳機(jī),這類(lèi)產(chǎn)品更多地考慮到手機(jī)翻譯機(jī)帶來(lái)的便捷、禮儀、衛(wèi)生的問(wèn)題,解決了場(chǎng)景應(yīng)用中的一些尷尬局面。
具體各類(lèi)翻譯機(jī)產(chǎn)品,雷鋒網(wǎng)整理如下表:
 
智能翻譯機(jī)產(chǎn)品五花八門(mén),也很難說(shuō)今后是否還會(huì)出現(xiàn)其他應(yīng)用形態(tài)。不過(guò)就應(yīng)用來(lái)看,由于要實(shí)現(xiàn)語(yǔ)音識(shí)別、語(yǔ)音合成、機(jī)器翻譯等對(duì)系統(tǒng)功耗和性能要求較高的功能,同時(shí)還要考慮語(yǔ)種、口音、噪音干擾等復(fù)雜的應(yīng)用場(chǎng)景,現(xiàn)在的智能翻譯機(jī)還沒(méi)有發(fā)展到能夠作為一項(xiàng)功能整合到手機(jī)或其他成熟的硬件形式中。正如科大訊飛創(chuàng)始人胡郁談及訊飛翻譯機(jī)與谷歌Pixel(手機(jī))相機(jī)圖片翻譯的不同時(shí)的解釋?zhuān)汗雀韪鄰募夹g(shù)落地來(lái)考慮,這需要更強(qiáng)的處理器支持,并且也會(huì)增加手機(jī)的耗電量。
翻譯機(jī)的精準(zhǔn)度
精準(zhǔn)度是翻譯機(jī)的靈魂,也是對(duì)一個(gè)翻譯機(jī)的好壞最根本的考量。此前,就各大廠商自報(bào)成績(jī)單時(shí),科大訊飛的曉譯2.0發(fā)布時(shí),官方給出的準(zhǔn)確率是98%,搜狗官方公布最新的語(yǔ)音識(shí)別準(zhǔn)確率是97%。
各大廠商官方公布的準(zhǔn)確率確實(shí)很高,不過(guò)在實(shí)際應(yīng)用中還需要考慮諸如口音、口語(yǔ)及環(huán)境噪聲的問(wèn)題。剛好小編手上有曉譯2.0可供做翻譯測(cè)試,兩組測(cè)試結(jié)果如下:
英文原文:So really,both Linux and Git kind of arose almost as an unintended consequence of your desire not to have to work with many people.
識(shí)別/翻譯結(jié)果:So really,both limitsand get kind of rose almost as an unintended consequence of your desire not to have to work with many people.(因此,實(shí)際上兩者的限制和得到種玫瑰幾乎作為一個(gè)意外的后果,你的愿望不需要與太多的人一起工作。)
 
中文原文:gitHub是一個(gè)面向開(kāi)源及私有軟件項(xiàng)目的托管平臺(tái),因?yàn)橹恢С謌it 作為唯一的版本庫(kù)格式進(jìn)行托管,故名gitHub。
識(shí)別/翻譯結(jié)果:給她是一個(gè)面向開(kāi)源及自由軟件項(xiàng)目的托管平臺(tái),因?yàn)橹皇墙o他作為唯一的版本庫(kù)格式進(jìn)行托管,故名給他。(She is a hosting platform for open source and free software projects,because only for him as the only version of the library format for hosting,so named him.)
 
從結(jié)果來(lái)看,識(shí)別率還是很好的,只是在一些專(zhuān)業(yè)詞匯上還無(wú)法準(zhǔn)確識(shí)別;而翻譯結(jié)果準(zhǔn)確率夠高,口語(yǔ)化略顯不足。由此看來(lái),官方給出的語(yǔ)音識(shí)別準(zhǔn)確率不能完全用來(lái)衡量翻譯機(jī)產(chǎn)品的翻譯能力。
誰(shuí)在攪局者
正是近年來(lái)出國(guó)旅行備受推崇,外加智能語(yǔ)音技術(shù)得到一定突破,使得翻譯機(jī)的研發(fā)被提上日程。但是處于風(fēng)口的翻譯機(jī)在備受追捧的同時(shí),自然也少不了攪局者。
從產(chǎn)品形態(tài)來(lái)看,有耳機(jī),也有手機(jī),有基于手機(jī)APP的應(yīng)用,也有智能硬件單品。其中以智能硬件單品居多,其他產(chǎn)品形態(tài)更多則是一種嘗試,如無(wú)意外,整個(gè)產(chǎn)業(yè)現(xiàn)在的重心還是要回到智能硬件單品這一形式潛心做功能升級(jí)和技術(shù)研發(fā)。
從翻譯機(jī)的價(jià)格來(lái)看,跨度在百元到幾千元之間,一些沒(méi)有成型技術(shù)的團(tuán)隊(duì)加入智能語(yǔ)音系統(tǒng)的翻譯機(jī)的價(jià)格甚至尚不及一支功能簡(jiǎn)單的錄音筆,可想其產(chǎn)品架構(gòu)中軟硬件系統(tǒng)的性能會(huì)是怎樣的情形,同時(shí)也使得其很難再擁有足夠的資本繼續(xù)做技術(shù)研發(fā)和產(chǎn)品迭代。
 
雷鋒網(wǎng)小結(jié)
大家看到智能翻譯機(jī)的時(shí)候經(jīng)常會(huì)認(rèn)為專(zhuān)業(yè)翻譯人員很快會(huì)面臨失業(yè)問(wèn)題,其實(shí)如此說(shuō)來(lái)為時(shí)尚早。現(xiàn)在的翻譯機(jī)自身還存在諸多問(wèn)題有待解決,雖然解決出國(guó)旅行時(shí)的點(diǎn)餐、問(wèn)路已不是問(wèn)題,但是面對(duì)諸如商務(wù)會(huì)晤、技術(shù)論壇等更為專(zhuān)業(yè)的應(yīng)用場(chǎng)景,或是娛樂(lè)場(chǎng)所、賽事解說(shuō)等更為復(fù)雜的周?chē)h(huán)境及人文環(huán)境,智能翻譯機(jī)的實(shí)際應(yīng)用還是略顯吃力。
不過(guò)就技術(shù)角度來(lái)講,雖然諸多技術(shù)和產(chǎn)品紛紛涌入,而其實(shí),這也才剛剛開(kāi)始。
產(chǎn)品是技術(shù)最好的檢驗(yàn)。語(yǔ)音技術(shù)正在經(jīng)歷著這樣的檢驗(yàn),經(jīng)過(guò)了智能音響的檢驗(yàn),這一輪是智能翻譯機(jī)的檢驗(yàn)。
智能翻譯機(jī)居當(dāng)下風(fēng)口,技術(shù)雛形雖然已有,但是機(jī)器翻譯系統(tǒng)的翻譯速度和翻譯準(zhǔn)確度還需要在整個(gè)AI大環(huán)境下繼續(xù)打磨,在翻譯匹配度、翻譯口語(yǔ)化能力、環(huán)境辨別能力,甚至具體產(chǎn)品形態(tài)上還需要繼續(xù)經(jīng)受市場(chǎng)用戶的各類(lèi)反饋和研發(fā)團(tuán)隊(duì)的不斷改進(jìn)。
至于當(dāng)下市場(chǎng)中魚(yú)龍混雜的入局者,市場(chǎng)自然會(huì)進(jìn)行優(yōu)勝劣汰,剩下的終將會(huì)是最適合你的產(chǎn)品。返回搜狐,查看更多
 
分享到:
 
官方微博: