[釘科技編譯]不出聲,僅僅通過(guò)喉嚨和下顎的皮膚震動(dòng)就能知道想說(shuō)什么。說(shuō)道這,首先想到的可能是“古老的讀唇術(shù)”?,F(xiàn)在,人工智能可能會(huì)讓這門(mén)顯得頗神秘的“技藝”被更多人掌握。
之前,有科研人員研發(fā)AI唇語(yǔ)識(shí)別:運(yùn)用機(jī)器視覺(jué)技術(shù)從視頻中識(shí)別出說(shuō)話人的人臉,提取此人連續(xù)說(shuō)話時(shí)口型變化的特征。通過(guò)機(jī)器視覺(jué)識(shí)別,不用聽(tīng)聲音,僅靠識(shí)別說(shuō)話人的唇部動(dòng)作,解讀說(shuō)話者所說(shuō)的內(nèi)容。近日,不同于運(yùn)用機(jī)器視覺(jué)技術(shù)識(shí)別說(shuō)話人的唇部動(dòng)作的的技術(shù),一種僅靠檢測(cè)喉嚨運(yùn)動(dòng)的“讀唇術(shù)”據(jù)說(shuō)也被研發(fā)出來(lái)了。
據(jù)《itmedia》網(wǎng)站消息,近日,東京大學(xué)和索尼計(jì)算機(jī)科學(xué)研究所共同研發(fā)出的AI系統(tǒng)“Derma”,通過(guò)將傳感器貼合在喉嚨周?chē)钠つw上,就能成功實(shí)現(xiàn)從口形(無(wú)聲說(shuō)話)到語(yǔ)音的轉(zhuǎn)化。
研究靈感最初來(lái)源于視聽(tīng)障礙者的觸診唇讀法,他們會(huì)用手指觸摸說(shuō)話者的嘴唇和下巴周?chē)?,以此讀取說(shuō)話內(nèi)容。也就是說(shuō),他們通過(guò)觸摸障礙者嘴唇周?chē)钠つw得知他們的說(shuō)話內(nèi)容。
AI系統(tǒng)“Derma”應(yīng)用時(shí),在下顎皮膚的兩個(gè)位置安裝加速度計(jì)和角速度傳感器,輔之機(jī)器學(xué)習(xí),通過(guò)隨著說(shuō)話發(fā)生的下顎運(yùn)動(dòng)和舌肌運(yùn)動(dòng)引起的從下顎到喉嚨的皮膚顫動(dòng),進(jìn)行無(wú)聲“語(yǔ)音識(shí)別”。(釘科技編譯,消息來(lái)源: https://www.itmedia.co.jp/news/articles/2003/18/news046.html)
- QQ:61149512