Facebook開源新AI語言模型,“可對100種語言實現(xiàn)一對一翻譯”
根據(jù)《siliconangle》消息:Facebook表示其利用AI技術(shù)在不依賴英語數(shù)據(jù)的情況下翻譯任意兩種語言的嘗試,已經(jīng)取得了實質(zhì)性進展。Facebook正在開源一種名為M2M-100的新AI語言模型,該模型可以在100種語言中的任何一對之間進行翻譯。據(jù)稱,以前的多語言模型嚴重依賴英語作為中介,例如,中文譯成法文的步驟通常是從中文譯成英文,然后再從英文譯成法文。在大多數(shù)情況下,這種模型都可以很
原創(chuàng)
2020-10-21 13:08:12
來源:釘科技??

根據(jù)《siliconangle》消息:Facebook表示其利用AI技術(shù)在不依賴英語數(shù)據(jù)的情況下翻譯任意兩種語言的嘗試,已經(jīng)取得了實質(zhì)性進展。Facebook正在開源一種名為M2M-100的新AI語言模型,該模型可以在100種語言中的任何一對之間進行翻譯。

【201020】Facebook開源新AI語言模型,可對100中語言實現(xiàn)一對一翻譯168_副本.png

據(jù)稱,以前的多語言模型嚴重依賴英語作為中介,例如,中文譯成法文的步驟通常是從中文譯成英文,然后再從英文譯成法文。在大多數(shù)情況下,這種模型都可以很好地工作,但是在涉及更復雜的句子和短語時通常不準確。

Facebook表示,M2M-100可以直接從中文翻譯成法語,或者在100多種語言對之間進行翻譯,從而更好地保留含義,而無需使用英語作為中介。

在這么多不同的語言對之間進行翻譯不是一件容易的事,因為模型需要訪問海量的高質(zhì)量訓練數(shù)據(jù)。Facebook人工智能研究員Angela Fan在一篇博客文章中解釋了她和她的團隊如何著手創(chuàng)建一個龐大的“多對多”數(shù)據(jù)集,其中包含100多種不同語言的超過75億個句子。

這些數(shù)據(jù)根據(jù)諸如語言分類、地理和文化相似性等參數(shù)分為14種不同的語言組。然后,在每個語言組中,F(xiàn)acebook為每個語言標識一到三種“過渡語言”,作為將其翻譯成不同語言的基礎(chǔ)。

M2M-100模型比Facebook當前使用的以英語為中心的多語言模型準確度更高。該公司聲稱,M2M -100在評估機器翻譯的BLEU度量標準上比之前模型高出“10分”。

Facebook最終希望用M2M-100替換之前的翻譯模型,以提高其翻譯質(zhì)量。(釘科技根據(jù)《siliconangle》消息編譯)

最新文章
1
海信家電2024年報:新風空調(diào)市占率第一 進入AI空氣管家時代
2
2025快手磁力大會:加速“生成新商業(yè)”,AI全面重塑商業(yè)經(jīng)營
3
三星推出AI神家電,中國家電的AI智慧生活解決方案何時到來?
4
索尼集團成員Aniplex上海線下店煥新開業(yè),開創(chuàng)IP+沉浸互動新空間
5
2025中國國際消費電子博覽會(CICE)德國推介會在柏林成功舉辦
6
DeepSeek的低成本神話后,云大廠們?yōu)楹芜€要增加算力投入
7
AI智啟生活 第15屆深圳國際移動電子展亮點“劇透”
8
4年前理想李想和特斯拉陶琳說的話,值得所有人深思
9
TCL上新Mini LED電視,T7L為何“最能打”,Q9L為何“最值得買”?
10
八年前用A9帶火屏幕發(fā)聲技術(shù)的索尼,今年會有OLED新品嗎?
11
海信視像發(fā)布2024年可持續(xù)發(fā)展報告:以綠色科技推動可持續(xù)發(fā)展
12
都叫“養(yǎng)鮮”冰箱,格力、容聲有啥不一樣?
13
財報觀察:2024全球智能家電銷量第一品牌,講好新故事?
14
續(xù)航滅霸 +倍強大 vivo Y300 Pro+正式發(fā)布
15
BOE(京東方)f-OLED柔性顯示技術(shù)策源地論壇舉辦 攜手中關(guān)村論壇共筑科技創(chuàng)新高地
16
海信視像2024年營收凈利雙增,高端穩(wěn)步增長,蟬聯(lián)世界第二
17
精裝修熱水系統(tǒng)市場外資占優(yōu),高端住宅需求點燃新增長(2025年1-2月)
18
AI家電:技術(shù)狂歡還是實用革命?
19
中國半導體并購潮起
20
小家電市場表現(xiàn)低迷,2025年小家電市場面臨嚴峻挑戰(zhàn)
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512