科大訊飛劉慶峰:人工智能未來會像水和電一樣,無所不在!
原創(chuàng)
2015-12-22 23:53:35

編者按:1956年最熱的兩個月,美國漢諾斯的達特茅斯學(xué)院中,一些科學(xué)家們正聚在一起,討論著看似對人類“無關(guān)痛癢”的話題:以機器模仿人類的學(xué)習(xí)及其他方面的智能。大家最終沒有達成共識,討論的內(nèi)容卻誕生出一個新名詞——人工智能。那年,也成了人工智能元年。

60年的時光,人工智能的發(fā)展經(jīng)歷著并不被眾人所知的起伏。而在這個被稱為“人工智能之年”的年份里,有人在嘈雜的人群中靜靜講述,有一天,人工智能將會像電影《超體》中的露西一樣,無處不在!


    【釘科技報道】12月21日,世界領(lǐng)先的語音交互及人工智能(英文簡稱A.I.)科研公司——科大訊飛,在北京國家會議中心召開了以“A.I.復(fù)始,萬物更新”為主題的2015年年度發(fā)布會。作為被稱為“人工智能之年”的2015年的收官大會,其內(nèi)容異彩紛呈,可以算得上是中國人工智能領(lǐng)域一場具有標(biāo)志性意義的大會。

    人工智能的發(fā)展經(jīng)歷了什么樣的歷程?有哪些人工智能產(chǎn)品能為我們的工作、生活、學(xué)習(xí)帶來幫助?「訊飛超腦」為代表的科大訊飛人工智能技術(shù),獲得了哪些創(chuàng)新性、革命性的技術(shù)突破?以開啟人工智能新紀元為目標(biāo)的科大訊飛都做出了解答。

    復(fù)始·更新:60年,一個輪回


   劉慶峰介紹,1956年的達特茅斯會議是人工智能研究的歷史起點,至今正好是一個60年甲子。在這60年的發(fā)展過程中,伴隨著計算機技術(shù)和民用科技突飛猛進的發(fā)展,人工智能研究本身經(jīng)歷了兩次波峰與波谷,而從2006年起始至今愈發(fā)升溫的人工智能熱,是第三次人工智能浪潮,而60年甲子的當(dāng)下,正處于人工智能爆發(fā)的前夜。

    在這第三次浪潮中,中國、美國和歐洲,不約而同地將人類大腦研究上升為國家戰(zhàn)略科研高度,而以科大訊飛為代表的中國科學(xué)家與產(chǎn)業(yè)勢力,也是歷史上第一次與西方的同行們同步前進,共同推動人類科學(xué)技術(shù)的前沿探索。
    劉慶峰表示,人工智能未來會像水和電一樣無所不在。而在人工智能的三個層次——計算智能、感知智能和認知智能之中,前兩者機器的能力已經(jīng)超越人類,讓機器實現(xiàn)認知智能是目前人工智能科研的焦點,這也是人區(qū)別于動物的最本質(zhì)能力。
    而從人類自身的發(fā)展來看,產(chǎn)生認知智能的標(biāo)志是語言的廣泛使用。所以,在第三次人工智能浪潮中,世界上眾多的科學(xué)家都不約而同地從“自然語言理解”這個研究方向上,尋找人工智能的突破口,亦即從語音與語言入手實現(xiàn)機器的認知革命。而科大訊飛也正是從這個方向上取得了令世人矚目的成就。
    訊飛超腦正在認知智能方向不斷突破

    從1998年成功研發(fā)出可實用的中文語音交互系統(tǒng)開始,至2014年發(fā)布“訊飛超腦”的這17年間,科大訊飛取得了讓行業(yè)和科技界矚目的一系列科研成就與產(chǎn)業(yè)化成果。

    科大訊飛的這些成果中,包括獲得NIST全球語種識別比賽的冠軍,JWSLT機器翻譯評測冠軍,在國內(nèi)替代人工進行英語口語測試與普通話級別考試,并在教育、車載、家居、通信、硬件和國家安全等眾多領(lǐng)域的產(chǎn)業(yè)化高速推進。這個過程中從一家大學(xué)生創(chuàng)業(yè)公司,成長成為目前市值超過500億的中國高科技公司。

    AIUI正式發(fā)布,訊飛超腦全新升級


    在產(chǎn)品發(fā)布環(huán)節(jié),劉慶峰首先定義了認知智能的三大核心支撐能力:人機交互、知識管理與推理學(xué)習(xí)。而隨后科大訊飛發(fā)布的訊飛超腦2.0科研項目,正是圍繞這三方面持續(xù)展開,不但賦予機器“能聽會說”的能力,還能賦予機器“能理解會思考”的能力。
    而在訊飛超腦的產(chǎn)業(yè)化應(yīng)用產(chǎn)品層面,年會發(fā)布了對科大訊飛具有里程碑意義的人機交互新產(chǎn)品——AIUI。劉慶峰認為,在實際上已經(jīng)到來的“萬物互聯(lián)”時代,客觀上對人機交互提出了更高的要求。但是,一方面目前大多數(shù)設(shè)備沒有屏幕并且與用戶之間有一定的距離,另一方面隨時隨地的多方交互的需求越發(fā)明顯。于是,科大訊飛又在此次大會上定義了“萬物互聯(lián)”時代的人機語音交互標(biāo)準(zhǔn),其基本能力應(yīng)該包括三方面:遠場識別、全雙工、多輪交互。
    AIUI集成了包括雙全工技術(shù)、麥克風(fēng)陣列技術(shù)、聲紋識別技術(shù)、方言識別、語義理解技術(shù)和內(nèi)容服務(wù)等——科大訊飛一些系列尖端科研成果和完善服務(wù),代表業(yè)界最高水準(zhǔn)的技術(shù)產(chǎn)品。開發(fā)者將可以一鍵獲取解決方案,通過集成麥克風(fēng)陣列、集成SDK以及定制云端服務(wù)等方式。
    更自然的人機交互是:聽得懂方言

    

    年初,山東大漢被車載語音導(dǎo)航逼瘋的消息傳播甚廣。一個普通話不標(biāo)準(zhǔn)的山東人,在環(huán)境嘈雜的車上,遠距離與不那么智能的導(dǎo)航交流,產(chǎn)生的結(jié)果就是讓人抓狂的識別與交互。而本次發(fā)布會上,科大訊飛通過遠場抗噪、方言識別、全雙工交互、多輪對話、糾錯等系列技術(shù),成功打破了“山東大漢的困境”。

    科大訊飛通過定位、麥克風(fēng)波束形成、回聲消除、抗混響、喚醒一系列技術(shù)形成的系統(tǒng)解決了遠距離識別問題。其次,科大訊飛實現(xiàn)了人機對話控制由單工(如手機語音助手的按一下說一下)轉(zhuǎn)變成全雙工(人和機器可以像打電話那樣同時聽和說)的交互轉(zhuǎn)變。

    多輪交互實現(xiàn)了機器對上下文連貫理解,使得人機交流不再是單調(diào)的一問一答,而是可以連續(xù)交流。再加上對話糾錯機制,人可以隨時糾正對話中雙方的錯誤,使說過的話不再是覆水難收。通過以上一系列技術(shù)形成的系統(tǒng),極大降低了環(huán)境、說法、習(xí)慣等對人機交互的干擾,實現(xiàn)高度自然的人機交互體驗。

    全學(xué)科閱卷+智學(xué)網(wǎng),訊飛超腦助力教育升級


    老師“忙”于改作業(yè)、判卷子、備授課,事倍功半;學(xué)生“盲”于做作業(yè)、找補習(xí)、問問題,低效重復(fù);而教育資源“?!?,數(shù)量多、來源廣,選擇難,雜亂無章更是給教學(xué)帶來極大困擾。劉慶峰用“忙”、“盲”、“?!边@三個字道出了教育面臨的窘境,而科大訊飛目前的技術(shù)進展正是解決以上問題的良方。
    劉慶峰表示,在訊飛超腦的應(yīng)用層面,教育產(chǎn)業(yè)也是科大訊飛將自身科研成果產(chǎn)業(yè)化最成功的領(lǐng)域之一。目前,全國已經(jīng)有31個省市的8000萬師生在使用科大訊飛面向K12教育所推出的高科技教學(xué)與考評產(chǎn)品,有效解決了之前的教育行業(yè)困境,不僅實現(xiàn)了語音與文字的識別、合成與分類,并且實現(xiàn)了智能批改、全科閱卷、資源庫自動建設(shè)等真正具備“人工智能”的產(chǎn)品目標(biāo),為中國的整個教育體系實現(xiàn)夢寐以求的個性化教學(xué)提供了有力支撐。
    正是在此基礎(chǔ)上,作為科大訊飛的to C教育產(chǎn)品——智學(xué)網(wǎng)與E聽說具備非常可觀的市場價值。
    目前,科大訊飛中文作文機器閱卷技術(shù)在2015年合肥、安慶中學(xué)會考上已經(jīng)取得應(yīng)用,人機閱卷對比結(jié)果顯示機器閱卷已經(jīng)相當(dāng)準(zhǔn)確!
    智學(xué)網(wǎng)秉承“基于大數(shù)據(jù)的發(fā)展性評價及教與學(xué)分析”的理念,以考試為切入點,可在線輔助老師完成出卷、閱卷、統(tǒng)分,將老師從繁瑣重復(fù)的閱卷工作中解放出來。同時,機器閱卷過程的全數(shù)字化,實現(xiàn)對學(xué)生答題數(shù)據(jù)的收集,通過對數(shù)據(jù)的分析,生成面對學(xué)校、班級、學(xué)生不同版本的專業(yè)化評測報告,以便老師進行針對性的教學(xué),進而促進學(xué)生實現(xiàn)個性化的學(xué)習(xí),極大提升學(xué)習(xí)效率。

    訊飛聽見:“即時語音轉(zhuǎn)寫”開啟知識管理新時代


    在發(fā)布會現(xiàn)場,科大訊飛全球首次將演講人董事長劉慶峰的演講同步轉(zhuǎn)寫成文字在大屏幕顯示,敢于接受現(xiàn)場數(shù)千參會者和數(shù)千萬觀看視頻直播觀眾的檢驗,并接受五名高級速錄師的挑戰(zhàn)?,F(xiàn)場識別正確率達到99%以上!這也標(biāo)志著科大訊飛又一次在業(yè)界率先實現(xiàn)了演講和會議場景下的語音轉(zhuǎn)寫技術(shù)突破。

    針對大型會議、現(xiàn)場采訪、個人交流等場景下的內(nèi)容整理需求,科大訊飛集成了單麥克解混響技術(shù)、陣列解混響技術(shù)、口語化識別等眾多最新研究成果,全球首發(fā)智能“軟件+硬件+服務(wù)”于一體的語音科技產(chǎn)品——訊飛聽見,包括手機App(錄音寶)、PC端網(wǎng)站(www.iflyrec.com)、智能硬件(錄音筆)。
    PC端網(wǎng)站能夠?qū)崿F(xiàn)雙屏智能編輯、角色自動分離、音頻精準(zhǔn)定位、快速按句回聽、發(fā)言實時上屏、格式多種多樣等功能,手機APP錄音寶則能解決常見的錄音回聽不方便、導(dǎo)出錄音復(fù)雜、錄音文件無法重命名等問題。同時,聽見錄音筆既增強了傳統(tǒng)錄音筆的錄音音質(zhì)、播放效果,更配備智能語音轉(zhuǎn)文字服務(wù),三者的結(jié)合實現(xiàn)了“軟件+硬件+服務(wù)”的完美統(tǒng)一。
    劉慶峰表示,實際上,音文轉(zhuǎn)寫是當(dāng)下都市生活的一種經(jīng)常性需求,在正式發(fā)布之前,錄音寶產(chǎn)品已經(jīng)有了超過100萬的用戶就是這種需求的證明。而隨著流媒體的不斷演進與普及,相信,在未來的圖文直播時代,科大訊飛的音文轉(zhuǎn)錄產(chǎn)品的價值將會更加凸顯。
    錄音寶、錄音筆與訊飛聽見網(wǎng)這三款新銳產(chǎn)品,將與訊飛輸入法(2.8億用戶)、靈犀語音助手(1.2億用戶)、DingDong智能音箱(2015年市場份額最大的WiFi音箱)、智學(xué)網(wǎng)、E聽說一道,構(gòu)成科大訊飛的To C產(chǎn)品線第一陣營,而科大訊飛還將繼續(xù)在To C業(yè)務(wù)的條線上,推出受市場歡迎的高科技產(chǎn)品。


    在實際上已經(jīng)到來的“萬物互聯(lián)時代”,語音為主,觸摸、圖像、手勢為輔,將成為人機交互的新常態(tài),而在這種人類生活的新常態(tài)中,人工智能技術(shù)的突破是用來延伸人類能力而非替代人類的。人工智能將使人類更幸福、更富想象力和創(chuàng)造力。

最新文章
1
快手電商舉行2024華北達人雙十一啟動會,助力達人大促GMV高效爆發(fā)
2
CNCC2024:可靈AI用戶已超360萬 獨立App即將上架
3
增混大電量時代來臨,寧德時代以驍遙電池驅(qū)動市場與自身雙增長
4
補齊自研CPU拼圖后,高通統(tǒng)一了PC、手機、汽車芯片架構(gòu)
5
我國電信業(yè)擴大對外開放,哪些行業(yè)將受益?
6
Mini LED背光產(chǎn)線又迎新玩家,助力智能電視行業(yè)逆勢回暖
7
走訪歐洲家電賣場,中外家電賣場竟有這些差異?
8
小米澎湃OS 2蛻變!盧偉冰:一眼快 一眼新
9
終于淘汰LCD!蘋果iPad mini 8首次升級OLED屏幕
10
新冷年+雙11+以舊換新,空調(diào)品質(zhì)換新怎么選?
11
方太高端全場景廚電睿隱系列發(fā)布,引領(lǐng)廚房未來十年變革
12
超越代際,以睿作答 | 方太2024幸福洞見大會暨全球新一代高端全嵌冰箱發(fā)布圓滿落幕
13
方太全球新一代高端全嵌冰箱 超越代際越極登場
14
快手電商推出“鴿王爭霸賽”活動,過億話題曝光量引爆賽鴿季熱度
15
點燃電競觀賽熱潮,2024 PEL秋季賽總決賽直播累計觀眾數(shù)量超4000萬
16
7個第一,11個首發(fā),訊飛星火放大招,大模型規(guī)?;涞乜善?!
17
全球手機市場,小米逼近三星蘋果
18
AI手機看榮耀:榮耀MagicOS 9.0正式發(fā)布,開啟手機自動駕駛新時代
19
推動行業(yè)標(biāo)準(zhǔn)化進程,華寶新能電小二發(fā)布光充戶外電源(SG)企業(yè)標(biāo)準(zhǔn)
20
當(dāng)貝采用極米光機,投影行業(yè)從競爭走向競合,格局打開了
關(guān)于我們

微信掃一掃,加關(guān)注

商務(wù)合作
  • QQ:61149512