百度人工智能又完成了一個(gè)“小目標(biāo)”,這次弄了個(gè)語音轉(zhuǎn)錄應(yīng)用
長期以來,人們在轉(zhuǎn)錄語音文件時(shí),常常需要通過手動(dòng)逐字錄入。但是 SwiftScribe 這款應(yīng)用通過集成百度自主研發(fā)的語音識(shí)別技術(shù)以及功能簡單的編輯工具,可以幫助人們實(shí)現(xiàn)語音文件快速、便捷的轉(zhuǎn)錄,提高生產(chǎn)效率。 ?據(jù)百度介紹,SwiftScribe 依托的核心技術(shù)來自百度的新一代深度語音識(shí)別系統(tǒng)—— Deep Speech 2。通過利用長達(dá)數(shù)千小時(shí)的標(biāo)注語音數(shù)據(jù)進(jìn)行“訓(xùn)練”,Deep Speech 2 可以不斷“學(xué)習(xí)”從語音中識(shí)別特定的字或詞。 
2017-03-14 12:13:18
來源:搜狐科技??
作者:?愛范兒

  

自從百度把人工智能當(dāng)做核心發(fā)展戰(zhàn)略之后,這方面的進(jìn)展也是神速。

3 月 13 日,百度宣布推出一款名為SwiftScribe的網(wǎng)頁版應(yīng)用,它能夠利用人工智能技術(shù)把語音文件進(jìn)行轉(zhuǎn)錄,感興趣的可以去試試看?! ?/p>

長期以來,人們在轉(zhuǎn)錄語音文件時(shí),常常需要通過手動(dòng)逐字錄入。但是 SwiftScribe 這款應(yīng)用通過集成百度自主研發(fā)的語音識(shí)別技術(shù)以及功能簡單的編輯工具,可以幫助人們實(shí)現(xiàn)語音文件快速、便捷的轉(zhuǎn)錄,提高生產(chǎn)效率。

據(jù)百度介紹,SwiftScribe 依托的核心技術(shù)來自百度的新一代深度語音識(shí)別系統(tǒng)—— Deep Speech 2。通過利用長達(dá)數(shù)千小時(shí)的標(biāo)注語音數(shù)據(jù)進(jìn)行“訓(xùn)練”,Deep Speech 2 可以不斷“學(xué)習(xí)”從語音中識(shí)別特定的字或詞。  

 ?。▓D片來自:Networked India)

此外,百度還通過直覺快捷鍵以及人機(jī)交互技術(shù)來解決語音錄入的不連貫問題。

對于那些職業(yè)速錄師來說,SwiftScribe 能成為他們的生產(chǎn)力利器。對于一段時(shí)長為一小時(shí)的語音文件來說,常規(guī)情況下需要 4-6 小時(shí)去進(jìn)行人工轉(zhuǎn)錄,并且每分鐘的轉(zhuǎn)錄成本約合 1 美元。如果使用 SwiftScribe 的話,所用時(shí)間能縮短差不多 40%。

不過,雖然人工智能可以提高生產(chǎn)力,短時(shí)間內(nèi)還沒辦法完全取代人類。在 SwiftScribe 完成初步的語音轉(zhuǎn)錄后,還需要人工去檢查大小寫、標(biāo)點(diǎn)符號(hào)、錯(cuò)別字等等。

據(jù)百度的項(xiàng)目經(jīng)理吳甜介紹,SwiftScribe 目前僅支持一小時(shí)以內(nèi)的語音文件轉(zhuǎn)錄,但團(tuán)隊(duì)還在對應(yīng)用的功能進(jìn)行進(jìn)一步開發(fā),以后可能會(huì)增加對視頻文件的語音識(shí)別、支持更多文件格式以及自動(dòng)添加標(biāo)點(diǎn)符號(hào)等功能。

從第一代的 Deep Speech 到第二代的 Deep Speech 2,百度已經(jīng)在深度語音識(shí)別技術(shù)上深耕多年。2016 年,百度推出了使用 Deep Speech 系統(tǒng)的 TalkType,為 Android 鍵盤添加語音錄入功能。同年,百度的深度語音識(shí)別系統(tǒng) Deep Speech 2 還入選了美國《麻省理工評論》的 2016 年十大突破技術(shù)?! ?/p>

 ?。ò俣?TalkType,圖片來自:VentureBeat)

如今,包括亞馬遜、蘋果、Google 和微軟在內(nèi)的多家互聯(lián)網(wǎng)巨頭都在布局語音識(shí)別技術(shù)領(lǐng)域,國內(nèi)的科大訊飛、搜狗等企業(yè)也都在語音識(shí)別領(lǐng)域有所建樹。

百度首席科學(xué)家吳恩達(dá)曾表示:

我認(rèn)為語音識(shí)別技術(shù)已經(jīng)發(fā)展到了非??煽康某潭?,使用的時(shí)候甚至都不用去想它。最好的科技往往是看不見的,而語音識(shí)別正在變得更加可靠,我希望它能夠退居幕后。

題圖來自:Prime Competence

最新文章
1
海信發(fā)布110吋世俱杯官方定制AI電視,支持比賽結(jié)果預(yù)測
2
海信110吋UX成2025世俱杯官方定制電視,AI智能體與體育賽事擦出火花
3
3999元起 iQOO 13性能之光閃耀電競新紀(jì)元
4
SUSE發(fā)布云安全行業(yè)趨勢報(bào)告 中國市場釋放積極信號(hào)
5
企業(yè)減產(chǎn)疊加“國補(bǔ)”政策,電視面板價(jià)格企穩(wěn)持平
6
81.49萬!小米SU7 Ultra炸場,小米15反成“局外人”?
7
家電以舊換新成效顯著 業(yè)界呼吁政策適當(dāng)延期
8
雷軍:小米即將成為全球最大的智能生態(tài)系統(tǒng)
9
快手電商生鮮食品行業(yè):雙11首周超6300個(gè)商家GMV增幅超100%
10
中網(wǎng)聯(lián)公布優(yōu)質(zhì)主播培育工程首批優(yōu)質(zhì)直播間 24個(gè)快手主播入選
11
中國移動(dòng),讓低空經(jīng)濟(jì)不止插上5G翅膀
12
從 “嵌入”到“融入”,誰在制造更好的嵌入式冰箱?
13
小米SU7 Ultra、澎湃OS 2、小米15系列等發(fā)布,硬核創(chuàng)新實(shí)現(xiàn)行業(yè)引領(lǐng)
14
TCL雙十一開售勇奪人臉識(shí)別鎖銷量第一,掀起人臉識(shí)別新潮流
15
11月排產(chǎn)高增33.6%:內(nèi)銷政策加持效果顯著,外銷旺季排產(chǎn)持續(xù)走強(qiáng)
16
運(yùn)營商三季報(bào)思考:增速減緩下,新路在何方?
17
頭部品牌首次推出百寸電視,大尺寸化已成為驅(qū)動(dòng)電視換新主力
18
突發(fā)!美對華芯片和AI投資限制升級(jí) 涉及三大技術(shù)
19
一加13引入全新超聲波指紋:支持3D指紋錄入、沾水解鎖
20
京東物流接入淘天集團(tuán)后,用戶能在天貓上享受家電送拆裝一體嗎?
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512