微軟的新圖像字幕算法,準(zhǔn)確性或超人類
[釘科技編譯] 綜合《thesouthafrican》和《theverge》消息:微軟開發(fā)了一種新的圖像字幕算法,該算法在某些有限的測試中準(zhǔn)確性超過了人類,據(jù)稱其將被合并到該公司用于視力障礙者的應(yīng)用程序“Seeing AI”及其更大的Office產(chǎn)品系列中。圖像字幕技術(shù)滿足了諸如為圖像創(chuàng)建替換文本的任務(wù),該功能對于增加可訪問性特別重要。微軟AI團(tuán)隊的軟件工程經(jīng)理Saqib Shaikh在新聞發(fā)布會
原創(chuàng)
2020-10-18 09:46:38
來源:釘科技??

[釘科技編譯] 綜合《thesouthafrican》和《theverge》消息:微軟開發(fā)了一種新的圖像字幕算法,該算法在某些有限的測試中準(zhǔn)確性超過了人類,據(jù)稱其將被合并到該公司用于視力障礙者的應(yīng)用程序“Seeing AI”及其更大的Office產(chǎn)品系列中。

image.png

圖像字幕技術(shù)滿足了諸如為圖像創(chuàng)建替換文本的任務(wù),該功能對于增加可訪問性特別重要。微軟AI團(tuán)隊的軟件工程經(jīng)理Saqib Shaikh在新聞發(fā)布會上說:“理想情況下,每個人都將在文檔、網(wǎng)絡(luò)、社交媒體中為所有圖像添加替代文本,因為這使盲人可以訪問內(nèi)容并參與互動。但是,人們沒有。因此,有一些應(yīng)用程序使用圖像標(biāo)題作為替代文本的方式”。

微軟表示,新算法效果是當(dāng)前算法的兩倍,對于使用諸如微軟 Seeing AI之類的應(yīng)用的用戶來說,這將意味著極大改善用戶體驗。

Seeing AI利用計算機視覺為視障人士描述通過智能手機攝像頭看到的世界。微軟算法不僅能夠識別人和物體,還能夠識別物體之間的關(guān)系,這意味著該算法能夠?qū)⒛橙嗣枋鰹椤白谝巫由匣蜃x書”。

在9月份的一篇論文中,新算法在一個被稱為 "nocaps "的圖像字幕基準(zhǔn)測試上取得了有史以來最高的分?jǐn)?shù)。nocaps基準(zhǔn)測試由超過166000個人類生成的字幕組成,描述了從Open Images Dataset中提取的約15100張圖片,這些圖片涵蓋了從運動到假日抓拍,再到美食攝影等等的一系列場景。 (釘科技綜合《thesouthafrican》和《theverge》消息編譯)

最新文章
1
快手聯(lián)合創(chuàng)始人楊遠(yuǎn)熙:AI驅(qū)動,釋放數(shù)字經(jīng)濟(jì)新動能
2
創(chuàng)新玩法引爆狂歡,時代少年團(tuán)五周年快手獨家系列直播幸福加倍
3
快手品牌自播轉(zhuǎn)型:平臺政策牽引 品牌錨定“渠道長期經(jīng)營價值”
4
IDC中國手機市場Q3:vivo、OPPO分化,華為起勢迅猛,AI拉力漸強
5
絕美小OPhone,OPPO Reno13 系列正式發(fā)布,2699元起!
6
競爭將更加激烈,TCL李東生表示LCD大屏幕主流地位短期難撼
7
蘋果史上最薄手機!曝iPhone 17 Air原型機無實體SIM卡槽
8
全球高端電視市場再變,海信TCL領(lǐng)先LG突破韓系雙雄兩極格局
9
“國補”之下,家電市場的變與不變
10
五大半導(dǎo)體國際組織呼吁:攜手應(yīng)對全球產(chǎn)業(yè)共性問題
11
REDMI史上最強:K80 Pro配備全焦段5000萬旗艦三攝
12
勇闖洗衣機賽道,清潔家電勝算幾何?
13
以舊換新明年延續(xù) 鄉(xiāng)鎮(zhèn)商家怎么應(yīng)對?
14
史上最強Mate未發(fā)先火!超305萬人想買Mate 70
15
蘋果要首發(fā)!臺積電宣布2nm已準(zhǔn)備就緒
16
白電前三季:美的海爾領(lǐng)先,TCL惠而浦領(lǐng)漲,明示三大趨向
17
榮耀300系列厚度僅6.97毫米,比一根吸管還要薄!
18
REDMI K80系列 11月27日19:00狂暴登場
19
Gartner預(yù)測,到2027年40%的AI數(shù)據(jù)中心將因電力不足而導(dǎo)致運營受限
20
“折疊屏鼻祖”宣告破產(chǎn),60億估值的“神話”何以破滅?
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512