百度宣布開放4項語音技術 吳恩達稱或?qū)氐赘淖內(nèi)藱C交互
11月22日下午消息,百度今日宣布開放四項全新語音技術的接口,幫助用戶提升在使用語音與機器進行交流時的交互體驗,該決定恰逢百度語音開放平臺上線3周年。
原創(chuàng)
2016-11-22 18:07:42
來源:新浪科技??

百度首席科學家吳恩達

百度首席科學家吳恩達

  新浪科技訊 11月22日下午消息,百度今日宣布開放四項全新語音技術的接口,幫助用戶提升在使用語音與機器進行交流時的交互體驗,該決定恰逢百度語音開放平臺上線3周年。

  百度首席科學家吳恩達介紹了這四項語音技術,分別是情感合成、遠場方案、喚醒二期技術和長語音方案。

  “這些技術有很大的潛力,去徹底改變?nèi)藱C交互的效率和辦法。未來語音技術在很多應用場景有很好的機會,將為人機交互帶來巨大的改變?!眳嵌鬟_表示。

  具體方面,這些技術旨在解決用戶在使用語音交互的場合時,普遍感到困擾的一些關鍵問題。例如,百度情感合成技術主要聚焦在為合成語音“加入情感”,目前可達到接近真人發(fā)聲效果,百度今年早些時候曾利用此技術,復原已逝明星張國榮的聲音。

  類似地,開發(fā)者還可以利用新的接口,使語音識別距離增加到3-5米,將設備的語音喚醒率提升到95%以上同時更省電誤報更少,或提升長時間語音識別的準確率問題。這將為語音技術帶來遠比現(xiàn)在更多的想象空間,而不只是遙控電視或解鎖手機。

  例如,前兩者的代表是百度的“小度機器人人機語音交互點餐”,已在上海肯德基旗艦店投入應用,可遠距離隨時應答點餐。后者則已經(jīng)在諸多內(nèi)容記錄、智能客服、視頻轉(zhuǎn)寫等場景實現(xiàn)應用。

  此前,百度語音開放平臺已經(jīng)在手機、家電、汽車和通訊服務等多領域?qū)崿F(xiàn)合作覆蓋,具體合作伙伴包括聯(lián)想、中興、長虹、康佳、SONY、特斯拉、途勝、惠普、艾米通訊、攜程,及手機QQ閱讀等。

  公開資料顯示,百度語音開放平臺上線于2013年10月,目前每日在線語音識別要求1億4千萬,在線語音合成每日請求達2億,開發(fā)者數(shù)量超過14萬。

  值得一提的是,在吳恩達及其團隊的研發(fā)下,百度語音識別準確率目前已高達97%,深度語音識別系統(tǒng)Deep Speech 2還入選了 MIT 2016十大突破技術。(李根)

最新文章
1
從iQOO13發(fā)布,看iQOO如何成為手機行業(yè)的“增長之王”?
2
戰(zhàn)略定力逐步發(fā)威華帝前三季凈利增長12.28%
3
飽和的家電市場 沖出一匹“黑馬”
4
四季度沖刺加速,各地家電以舊換新品類再擴容
5
又賣爆了!小米15系列線下銷量同比大漲40%
6
iOS 18.1升級率翻倍!蘋果Apple Intelligence立大功
7
以"可持續(xù)"為在華發(fā)展關鍵的索尼,要在進博會上讓人"穿越"春夏秋冬?
8
樣樣超Pro,新十年旗艦大作一加13售價 4499 元起
9
康佳電視“雙十一”大促來襲,G9 Pro等爆款機型開啟“千級分區(qū)普及風暴”
10
快手村釣系列賽貴州站圓滿落幕,超燃“村味”賽事魅力盡顯
11
快手上線短劇分銷撮合平臺,助力行業(yè)運營提效
12
M4蘋果MacBook Pro來了:雖仍是12999元起售 但告別了8GB內(nèi)存時代!
13
國產(chǎn)手機年終大戰(zhàn):集體漲價,影像退潮,AI接棒內(nèi)卷大旗
14
中國廣電5G最新數(shù)據(jù)公布:“三年破五”還能否如期實現(xiàn)?
15
光模塊企業(yè)“光”速布局喜迎收獲期
16
“國補”政策下電視行業(yè)迎發(fā)展機遇,這些趨勢將主導未來
17
一加13今天發(fā)布 關鍵配置一覽:屏幕全球首發(fā)!
18
四季度沖刺加速,各地家電以舊換新品類再擴容
19
觀察:從小米15系列發(fā)布,看小米“人車家全生態(tài)”的高端勢能
20
智能手機觀察:vivo華為小米猛增,TOP6逐漸分化,行業(yè)現(xiàn)三大趨勢
關于我們

微信掃一掃,加關注

商務合作
  • QQ:61149512