微軟的新圖像字幕算法,準確性或超人類
[釘科技編譯] 綜合《thesouthafrican》和《theverge》消息:微軟開發(fā)了一種新的圖像字幕算法,該算法在某些有限的測試中準確性超過了人類,據(jù)稱其將被合并到該公司用于視力障礙者的應(yīng)用程序“Seeing AI”及其更大的Office產(chǎn)品系列中。圖像字幕技術(shù)滿足了諸如為圖像創(chuàng)建替換文本的任務(wù),該功能對于增加可訪問性特別重要。微軟AI團隊的軟件工程經(jīng)理Saqib Shaikh在新聞發(fā)布會
原創(chuàng)
2020-10-18 09:46:38
來源:釘科技??

[釘科技編譯] 綜合《thesouthafrican》和《theverge》消息:微軟開發(fā)了一種新的圖像字幕算法,該算法在某些有限的測試中準確性超過了人類,據(jù)稱其將被合并到該公司用于視力障礙者的應(yīng)用程序“Seeing AI”及其更大的Office產(chǎn)品系列中。

image.png

圖像字幕技術(shù)滿足了諸如為圖像創(chuàng)建替換文本的任務(wù),該功能對于增加可訪問性特別重要。微軟AI團隊的軟件工程經(jīng)理Saqib Shaikh在新聞發(fā)布會上說:“理想情況下,每個人都將在文檔、網(wǎng)絡(luò)、社交媒體中為所有圖像添加替代文本,因為這使盲人可以訪問內(nèi)容并參與互動。但是,人們沒有。因此,有一些應(yīng)用程序使用圖像標題作為替代文本的方式”。

微軟表示,新算法效果是當前算法的兩倍,對于使用諸如微軟 Seeing AI之類的應(yīng)用的用戶來說,這將意味著極大改善用戶體驗。

Seeing AI利用計算機視覺為視障人士描述通過智能手機攝像頭看到的世界。微軟算法不僅能夠識別人和物體,還能夠識別物體之間的關(guān)系,這意味著該算法能夠?qū)⒛橙嗣枋鰹椤白谝巫由匣蜃x書”。

在9月份的一篇論文中,新算法在一個被稱為 "nocaps "的圖像字幕基準測試上取得了有史以來最高的分數(shù)。nocaps基準測試由超過166000個人類生成的字幕組成,描述了從Open Images Dataset中提取的約15100張圖片,這些圖片涵蓋了從運動到假日抓拍,再到美食攝影等等的一系列場景。 (釘科技綜合《thesouthafrican》和《theverge》消息編譯)

最新文章
1
打造全行業(yè)最強交互方式,海信AI電視亮相ACE
2
“國補”給家電行業(yè)帶來了哪些影響?
3
進入下半場,5G網(wǎng)絡(luò)建設(shè)如何“闖關(guān)”?
4
全年營收預(yù)增近30%,臺積電稱“AI需求剛開始”
5
TCL華星:首款量產(chǎn)印刷OLED產(chǎn)品將是醫(yī)療設(shè)備顯示屏
6
智能電視“套娃式”收費何時休,該如何規(guī)范電視收費問題?
7
本月發(fā)布!小米15全球首發(fā)驍龍旗艦芯皇
8
一加13搭載驍龍8至尊版:性能升級堪稱劃時代
9
驍龍峰會2024直擊:榮耀攜手高通,共同定義AI原生應(yīng)用場景
10
觀察:壁掛爐以舊換新,還需打通三大“消費堵點”
11
臺積電發(fā)布2024年第三季度財報:營收同比增長39%,凈利潤約720億人民幣
12
2024年9月中國家用智能門鎖線上市場總結(jié)
13
集成灶被通報三批次不合格,市場何時“止跌”?
14
洞察消費趨向:日立家電如何定義品質(zhì)生活的新標準
15
三星最輕薄折疊屏!Galaxy Z Fold特別版發(fā)布:售價14500元
16
第三季度顯示器銷量出爐:小米中國第3!
17
引領(lǐng)消費電子科技創(chuàng)新 打造智慧場景沉浸式體驗 2024電博會精彩落幕
18
越來越多的凈水器能加熱之后,電水壺會越來越難賣?
19
論壇直擊|人工智能創(chuàng)新應(yīng)用發(fā)展領(lǐng)航交流會下午場精彩紛呈,共謀產(chǎn)業(yè)發(fā)展新篇章
20
論壇直擊|人工智能創(chuàng)新應(yīng)用發(fā)展領(lǐng)航交流會 圓滿舉辦
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512