搜狗推出“唇語識別”技術 垂直場景下達到90%準確率
鳳凰科技訊(作者/二維馬)12月14日消息,搜狗今日推出了一種人機交互新技術唇語識別,通過機器視覺識別說話人唇部動作,來解讀說話者所說的內(nèi)容。搜狗官方表示,通過復雜端到端深度神經(jīng)網(wǎng)絡技術進行中文唇語序列建模,經(jīng)過數(shù)千小時的真實唇語數(shù)據(jù)訓練,終于取得了唇語識別效果。在非特定人開放口語測試集上,該系統(tǒng)達到60%以上的準確率,超過google發(fā)布的英文唇語系統(tǒng)50%以上的準確率,在垂直場景如車載、智能家
2017-12-15 07:59:46
來源:鳳凰科技??

鳳凰科技訊(作者/二維馬)12月14日消息,搜狗今日推出了一種人機交互新技術唇語識別,通過機器視覺識別說話人唇部動作,來解讀說話者所說的內(nèi)容。

搜狗官方表示,通過復雜端到端深度神經(jīng)網(wǎng)絡技術進行中文唇語序列建模,經(jīng)過數(shù)千小時的真實唇語數(shù)據(jù)訓練,終于取得了唇語識別效果。在非特定人開放口語測試集上,該系統(tǒng)達到60%以上的準確率,超過google發(fā)布的英文唇語系統(tǒng)50%以上的準確率,在垂直場景如車載、智能家居等場景下甚至已經(jīng)達到90%的準確率。

作為人機交互的形式之一,未來唇語識別技術可以輔助語音交互及圖像識別,在日常生活、安防、公益等各個領域?qū)崿F(xiàn)廣泛應用。比如在車載場景下,周圍噪音過大時會對語音指令產(chǎn)生干擾,通過唇語識別技術則可以規(guī)避干擾,保證人車交互的準確性和穩(wěn)定性,日常不便發(fā)聲的公共場所也可以保證說話內(nèi)容的私密性;在安防領域,由于目前多數(shù)監(jiān)控只有攝像頭沒有麥克風,往往只能看清嘴型卻不知道在說什么,給案情分析帶來很多難題,而唇語識別技術可以幫助公安人員獲取重要的講話信息,為公共安全提供有效支持。除此之外,唇語識別技術還能發(fā)揮巨大的公益價值,幫助先天性聽障人群或老年人,讓他們更好地理解和表達自己。

最新文章
1
當貝采用極米光機,投影行業(yè)從競爭走向競合,格局打開了
2
向新而生的青島電博會,在鏈接什么樣的數(shù)智生活未來?
3
打造全行業(yè)最強交互方式,海信AI電視亮相ACE
4
“國補”給家電行業(yè)帶來了哪些影響?
5
進入下半場,5G網(wǎng)絡建設如何“闖關”?
6
全年營收預增近30%,臺積電稱“AI需求剛開始”
7
TCL華星:首款量產(chǎn)印刷OLED產(chǎn)品將是醫(yī)療設備顯示屏
8
智能電視“套娃式”收費何時休,該如何規(guī)范電視收費問題?
9
本月發(fā)布!小米15全球首發(fā)驍龍旗艦芯皇
10
一加13搭載驍龍8至尊版:性能升級堪稱劃時代
11
驍龍峰會2024直擊:榮耀攜手高通,共同定義AI原生應用場景
12
觀察:壁掛爐以舊換新,還需打通三大“消費堵點”
13
臺積電發(fā)布2024年第三季度財報:營收同比增長39%,凈利潤約720億人民幣
14
2024年9月中國家用智能門鎖線上市場總結
15
集成灶被通報三批次不合格,市場何時“止跌”?
16
洞察消費趨向:日立家電如何定義品質(zhì)生活的新標準
17
三星最輕薄折疊屏!Galaxy Z Fold特別版發(fā)布:售價14500元
18
第三季度顯示器銷量出爐:小米中國第3!
19
引領消費電子科技創(chuàng)新 打造智慧場景沉浸式體驗 2024電博會精彩落幕
20
越來越多的凈水器能加熱之后,電水壺會越來越難賣?
關于我們

微信掃一掃,加關注

商務合作
  • QQ:61149512