国产传媒18精品免费观看,欧美人妻精品一区二区三区,999热线在线观看,www四虎最新成人永久网站

AI同聲傳譯讓你瞬間掌握60種語(yǔ)言的那一天會(huì)發(fā)生什么事情?

首頁(yè) > 快訊 > > 正文

日期:2024-10-09 10:08:46    來源:今日熱點(diǎn)網(wǎng)    

隨著AI技術(shù)的快速發(fā)展,語(yǔ)言不再是溝通的障礙。最新的AI同聲傳譯技術(shù)的突破,讓每個(gè)人都可以在不同語(yǔ)言環(huán)境下無(wú)縫交流,不必?fù)?dān)心語(yǔ)言差異帶來的不便。這種技術(shù)讓每個(gè)普通人隨時(shí)“攜帶”一個(gè)專屬的同聲傳譯員出門成為可能。那么,隨著技術(shù)的成熟,哪些應(yīng)用場(chǎng)景將最先受到影響,成為我們?nèi)粘I畹囊徊糠?

當(dāng)下,許多人對(duì)AI翻譯軟件已經(jīng)不再陌生,這些軟件大多依托于文字翻譯技術(shù),并逐步融入了AI語(yǔ)音合成功能,來模擬同聲傳譯的體驗(yàn)。例如,科大訊飛同傳、有道翻譯官和騰訊翻譯君等產(chǎn)品,都是這一領(lǐng)域的代表。這類軟件的工作原理一般是首先快速識(shí)別講話者的語(yǔ)音,并將其轉(zhuǎn)化為文字,再通過強(qiáng)大的自然語(yǔ)言處理算法對(duì)這些文字進(jìn)行翻譯,最后將翻譯后每個(gè)句子逐個(gè)轉(zhuǎn)化成語(yǔ)音并播放,實(shí)現(xiàn)“實(shí)時(shí)翻譯”的效果。

然而,這一系列流程不可避免地會(huì)帶來翻譯延遲問題。為了減少延遲,許多翻譯軟件選擇放棄語(yǔ)音播放功能,轉(zhuǎn)而只顯示翻譯后的文字。這種方式能夠?qū)崟r(shí)翻譯語(yǔ)音并以“字幕”的形式不斷更新,即便由于輸入的變化導(dǎo)致翻譯結(jié)果頻繁調(diào)整、推倒重來,也不會(huì)影響用戶的閱讀體驗(yàn)。通過取消語(yǔ)音播放,更新后的翻譯內(nèi)容可以更迅速、連續(xù)地呈現(xiàn)在用戶面前,從而提升整體使用體驗(yàn)。

而AI同聲傳譯模型則使用了完全不同的原理。

得益于近年AI模型的爆發(fā)性進(jìn)展,追求極低延遲的、直接將語(yǔ)音翻譯成語(yǔ)音的同聲傳譯模型在2024年開始逐漸出現(xiàn)。這類模型目的是直接或間接地將語(yǔ)音翻譯成目標(biāo)語(yǔ)言的語(yǔ)音。其中,三款表現(xiàn)出色的模型尤其受到關(guān)注,也是最接近真人同聲傳譯的方案:Meta(原Facebook)的Seamless-Streaming,中科院計(jì)算技術(shù)研究所的StreamSpeech,以及知了未來的同聲傳譯v3模型。這類模型的有別于傳統(tǒng)的AI翻譯軟件,它會(huì)嘗試模仿人類翻譯時(shí)的行為,不將發(fā)言人講話的內(nèi)容立馬翻譯出來,而是邊“聽”邊判斷當(dāng)前發(fā)言內(nèi)容是否足夠適合完整、是否需要聽取更多的內(nèi)容才能進(jìn)行翻譯。

Meta在AI領(lǐng)域擁有顯著的影響力,尤其是在開源貢獻(xiàn)和前沿技術(shù)研究方面。其AI研究部門Meta AI多個(gè)人工智能領(lǐng)域取得了重要突破,LLaMA(大型語(yǔ)言模型)作為其推出的開源模型,已經(jīng)在AI研究界廣泛使用;并且其推出的開源框架PyTorch已經(jīng)成為全球AI研究和應(yīng)用中的主流工具。其同聲傳譯模型Seamless-Streaming此次同樣開源,允許任何人訪問其核心原理,根據(jù)其發(fā)表的相關(guān)論文顯示(https://ai.meta.com/resources/models-and-libraries/seamless-communication-models/),Seamless-Streaming選擇使用“EMMA”策略來判斷翻譯機(jī)是否應(yīng)該立刻翻譯聽取到的內(nèi)容還是等待更多內(nèi)容的輸入。在測(cè)試使用中,Seamless-Streaming模型做到了3秒左右的延遲的準(zhǔn)確翻譯,簡(jiǎn)單來說就是翻譯內(nèi)容滯后于原本發(fā)言3秒鐘左右。相較于傳統(tǒng)AI翻譯軟件“同聲傳譯”的15秒以上的延遲有了突破性的優(yōu)化,真正達(dá)到了真人同聲傳譯延遲的水準(zhǔn),但可惜準(zhǔn)確性相較于傳統(tǒng)AI翻譯仍有些不足。尤其是中文等復(fù)雜語(yǔ)言的翻譯測(cè)試中,時(shí)長(zhǎng)出現(xiàn)會(huì)錯(cuò)意、聽不懂“言下之意”的問題。

而作為國(guó)內(nèi)最高學(xué)術(shù)機(jī)構(gòu)和綜合性科研中心,中科院同樣開源了其關(guān)于StreamSpeech模型的研究。根據(jù)其發(fā)表的論文顯示(https://arxiv.org/abs/2406.03049),StreamSpeech主要采用了檢查“Alignments”的方式來判斷翻譯機(jī)的等待與否。令人震驚的是,該翻譯模型的翻譯延遲達(dá)到了驚人的0.3秒,值得一提的是,這甚至于人類的平均反應(yīng)時(shí)間相當(dāng)。這一翻譯速度已經(jīng)遠(yuǎn)遠(yuǎn)超過真人能企及的水平,對(duì)于真人同聲傳譯員來說,從演講人說出單詞到聽到并理解到腦中的時(shí)間就已不止0.3秒??上壳霸撃P虚_源的部分中該模型僅支持英法、英西、英德的翻譯,暫時(shí)不支持中文。并且在低延遲模型的測(cè)試中,翻譯的流暢程度有些差強(qiáng)人意,翻譯出來的內(nèi)容更像是“逐字機(jī)翻”而非流暢的翻譯語(yǔ)句意思。這個(gè)問題的出現(xiàn)更多是因?yàn)檠舆t太低,導(dǎo)致翻譯機(jī)“被迫”翻譯一些還沒有完成的句子所造成的。

不同于Meta與中科院,知了未來是一支位于倫敦的小型華人研發(fā)團(tuán)隊(duì)。該團(tuán)隊(duì)目前正在融資中,且并尚未開源其模型;其關(guān)于此模型公開信息僅有測(cè)試體驗(yàn)窗口(https://translate.weil-ai.com/)與論文摘要。根據(jù)其公開的論文摘要顯示,知了未來的同聲傳譯v3模型相較于前兩家,創(chuàng)新之處在于其將“是否等待更多輸入”的功能直接交給了翻譯模型?,F(xiàn)在其正在內(nèi)測(cè)兩款模型:小(mini)模型以低延遲為首要目標(biāo),根據(jù)內(nèi)測(cè)其翻譯延遲平均為1-3秒,在發(fā)言人講話清晰時(shí)翻譯準(zhǔn)確率遠(yuǎn)超上述兩款模型。大(large)模型以高精度為特點(diǎn),翻譯延遲平均為2-5秒,而翻譯準(zhǔn)確與流暢程度達(dá)到甚至超越了真人水準(zhǔn),甚至支持中英混合表達(dá)、古詩(shī)詞、方言與流行梗的準(zhǔn)確翻譯。美中不足的是該模型目前內(nèi)測(cè)名額有限,并且測(cè)試火爆經(jīng)常出現(xiàn)排隊(duì)使用的狀況;其網(wǎng)頁(yè)翻譯功能距離落地產(chǎn)品還有一段距離,目前更像一個(gè)“模型展示”的網(wǎng)頁(yè)。

綜上所述,AI同聲傳譯的技術(shù)突破已經(jīng)讓更多潛在的可能性進(jìn)入現(xiàn)實(shí),我們距離電影《流浪地球》中的“兩個(gè)不同語(yǔ)言的人戴上耳機(jī)之后可以正常交流”的場(chǎng)景已經(jīng)肉眼可見的飛速接近。而當(dāng)下最接近這個(gè)場(chǎng)景的知了未來同聲傳譯等軟件還未開始任何的產(chǎn)品落地;到底會(huì)先在哪個(gè)場(chǎng)景看到它的使用?誰(shuí)會(huì)是第一批用戶?成為了交給市場(chǎng)的下一個(gè)問題。

在思考這個(gè)問題之前,我們回看一下同聲傳譯即將實(shí)現(xiàn)的核心功能:將講話人的聲音作為實(shí)時(shí)輸入,將翻譯好的語(yǔ)音模擬講話人的音調(diào)作為實(shí)時(shí)輸出。那么給定這個(gè)功能下,我們想了一些非常好的例子在這里分享給大家,希望能激發(fā)大家的靈感:

一、空乘播報(bào)

在國(guó)際航班上,乘務(wù)員通常被要求會(huì)講兩國(guó)甚至是多國(guó)語(yǔ)言。除了更好的服務(wù)旅客,更重要的是在飛行途中對(duì)于旅程等信息的播報(bào),例如“入境須知、航班轉(zhuǎn)機(jī)信息”等內(nèi)容需要讓不同國(guó)家的旅客聽明白的話就需要同時(shí)說不同的語(yǔ)言。而多語(yǔ)言對(duì)于空乘來說確實(shí)是一個(gè)不小的挑戰(zhàn),但凡口語(yǔ)表達(dá)的不清晰就會(huì)給旅客造成困擾。而AI同聲傳譯或許在這個(gè)時(shí)候就可以幫上忙,僅需要空乘會(huì)說一種語(yǔ)言,AI負(fù)責(zé)將其內(nèi)容以相同的音色傳入乘客的耳中,讓飛機(jī)上來自五湖四海的旅客都可以聽清楚聽明白、并且讓旅途更安心。

二、在線教育

隨著在線教育的全球化進(jìn)程加快,越來越多的教育平臺(tái)和機(jī)構(gòu)希望吸引來自世界各地的學(xué)生。然而,語(yǔ)言差異常常成為學(xué)生獲取優(yōu)質(zhì)教育資源的障礙。尤其是母語(yǔ)為小語(yǔ)種的學(xué)生,在學(xué)習(xí)非母語(yǔ)課程時(shí),往往不僅難以理解,還影響到他們?cè)跀?shù)學(xué)、物理等核心學(xué)科的學(xué)習(xí)能力,許多有天賦的學(xué)生因此被埋沒。AI同聲傳譯技術(shù)恰好能夠打破這一壁壘,為講師提供實(shí)時(shí)翻譯服務(wù),使得無(wú)論講師使用何種語(yǔ)言授課,學(xué)生都能同步獲取翻譯內(nèi)容,從而在全球化的教育環(huán)境中不再受到語(yǔ)言的限制。

AI同聲傳譯技術(shù)能夠?yàn)檫@些場(chǎng)合提供實(shí)時(shí)、精準(zhǔn)的翻譯服務(wù),避免信息傳遞中的延遲與誤解,從而促進(jìn)更加高效的國(guó)際交流與合作。那除此之外,未來還有哪些可能的使用場(chǎng)景?或許下一個(gè)突破點(diǎn),就藏在我們?nèi)粘I钪械哪硞€(gè)細(xì)節(jié)。隨著技術(shù)的不斷完善,AI同聲傳譯將逐步進(jìn)入更多的日常應(yīng)用場(chǎng)景,成為未來全球化溝通不可或缺的一部分。

未來已來,我們拭目以待。

免責(zé)聲明:市場(chǎng)有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買賣依據(jù)。

關(guān)鍵詞:

下一篇:AI生態(tài)建設(shè)及開發(fā)者論壇成功舉行:思特奇攜手開發(fā)者共建繁榮AI生態(tài),把握智能新機(jī)遇
上一篇:“你好BOE”重磅亮相首屆上海國(guó)際光影節(jié) 打造“藝術(shù)x科技”頂級(jí)影像盛宴

科技

 
国产性一交一乱一伦一色一情| 一区二区三区| 国产成人一区二区三区在线观看| 成人性爱视频在线观看| 女人与zzzooooxxxx| 色哟哟网站在线观看| 日本做床爱全过程激烈视频| 被几个领导玩弄一晚上| 久久国产精品77777| 几个东北熟妇的性经历| chinese猛1打桩浪小辉| 久久久97精品国产一区蜜桃| 久久久久夜夜夜精品国产| 在教室伦流澡到高潮h免费视频| 免费网站看v片在线18禁无码| sm调教室虐男受调教h打开腿| 欧美性受xxxx黑人xyx性爽| 免费无码中文字幕A级毛片HD| √天堂资源在线官网| 大肉大捧一进一出| 美女裸体a级毛片| 宝宝腿再趴开一点就不疼了 | 特色表演| 亚洲成av人电影在线观看| 狠狠色噜噜狠狠狠狠888奇禾| 大乳丰满人妻中文字幕日本| b站禁止转播404入口| 40岁了水还特别多怎么回事 | 亚洲精品国产综合久久久久紧| 成人午夜福利视频| 搡老熟女多毛丰满国产精品| 国产精品xxxx国产喷水| 中文字幕一区二区精品区| 差差漫画免费看入口弹窗页面| 最近中文字幕2019免费版日本| 亚洲av国产爽歪歪无码| summertime在线播放| 女女女女bbbbbb毛片在线| 人妻丰满熟妇AV无码区动漫| 久久久精品人妻无码专区不卡 | 艳妇乳肉豪妇荡乳av|