AI“讀唇術(shù)”,靠什么讓“失語者”重新“開口”?
[釘科技編譯]不出聲,僅僅通過喉嚨和下顎的皮膚震動就能知道想說什么。說道這,首先想到的可能是“古老的讀唇術(shù)”?,F(xiàn)在,人工智能可能會讓這門顯得頗神秘的“技藝”被更多人掌握。之前,有科研人員研發(fā)AI唇語識別:運用機器視覺技術(shù)從視頻中識別出說話人的人臉,提取此人連續(xù)說話時口型變化的特征。通過機器視覺識別,不用聽聲音,僅靠識別說話人的唇部動作,解讀說話者所說的內(nèi)容。近日,不同于運用機器視覺技術(shù)識別說話人的
原創(chuàng)
2020-04-06 07:30:49
來源:釘科技??

[釘科技編譯]不出聲,僅僅通過喉嚨和下顎的皮膚震動就能知道想說什么。說道這,首先想到的可能是“古老的讀唇術(shù)”?,F(xiàn)在,人工智能可能會讓這門顯得頗神秘的“技藝”被更多人掌握。

之前,有科研人員研發(fā)AI唇語識別:運用機器視覺技術(shù)從視頻中識別出說話人的人臉,提取此人連續(xù)說話時口型變化的特征。通過機器視覺識別,不用聽聲音,僅靠識別說話人的唇部動作,解讀說話者所說的內(nèi)容。近日,不同于運用機器視覺技術(shù)識別說話人的唇部動作的的技術(shù),一種僅靠檢測喉嚨運動的“讀唇術(shù)”據(jù)說也被研發(fā)出來了。

圖片 1.png

據(jù)《itmedia》網(wǎng)站消息,近日,東京大學(xué)和索尼計算機科學(xué)研究所共同研發(fā)出的AI系統(tǒng)“Derma”,通過將傳感器貼合在喉嚨周圍的皮膚上,就能成功實現(xiàn)從口形(無聲說話)到語音的轉(zhuǎn)化。

研究靈感最初來源于視聽障礙者的觸診唇讀法,他們會用手指觸摸說話者的嘴唇和下巴周圍,以此讀取說話內(nèi)容。也就是說,他們通過觸摸障礙者嘴唇周圍的皮膚得知他們的說話內(nèi)容。

AI系統(tǒng)“Derma”應(yīng)用時,在下顎皮膚的兩個位置安裝加速度計和角速度傳感器,輔之機器學(xué)習(xí),通過隨著說話發(fā)生的下顎運動和舌肌運動引起的從下顎到喉嚨的皮膚顫動,進行無聲“語音識別”。(釘科技編譯,消息來源: https://www.itmedia.co.jp/news/articles/2003/18/news046.html)

原創(chuàng)文章
最新文章
1
Forter發(fā)布針對跨境電商的消費者身份安全技術(shù)革新
2
iPhone 17系列迎來“重大設(shè)計變更”,同時采用鋁和玻璃兩種材料
3
華為只打高端局,和蘋果、奔馳硬碰硬
4
五成英美受訪者表示,今年黑五消費可能持平或高于往年
5
5G“揚帆”再升級!2027年我國5G網(wǎng)絡(luò)接入流量占比將超75%
6
2024三季度全球電視出貨量同比增長11%,中國市場面臨下滑
7
兩家家電企業(yè)突發(fā)高層變動,白電行業(yè)迎新變數(shù)?
8
REDMI K80系列今日發(fā)布 關(guān)鍵配置提前看:性能、屏幕、影像史上最強
9
斷供7nm芯片!臺積電:在中美半導(dǎo)體之間保持中立不現(xiàn)實
10
添可的炒菜機,石頭的洗衣機,清潔電器品牌新增長曲線不同路
11
在王府井,我發(fā)現(xiàn)了一個數(shù)字文化新地標(biāo)
12
快手聯(lián)合創(chuàng)始人楊遠熙:AI驅(qū)動,釋放數(shù)字經(jīng)濟新動能
13
創(chuàng)新玩法引爆狂歡,時代少年團五周年快手獨家系列直播幸福加倍
14
快手品牌自播轉(zhuǎn)型:平臺政策牽引 品牌錨定“渠道長期經(jīng)營價值”
15
IDC中國手機市場Q3:vivo、OPPO分化,華為起勢迅猛,AI拉力漸強
16
絕美小OPhone,OPPO Reno13 系列正式發(fā)布,2699元起!
17
競爭將更加激烈,TCL李東生表示LCD大屏幕主流地位短期難撼
18
蘋果史上最薄手機!曝iPhone 17 Air原型機無實體SIM卡槽
19
全球高端電視市場再變,海信TCL領(lǐng)先LG突破韓系雙雄兩極格局
20
“國補”之下,家電市場的變與不變
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512