【釘科技,北京報(bào)道】“搜狗本來(lái)就是一家做AI(人工智能)的互聯(lián)網(wǎng)公司。”在8月3日的搜狗“知音”語(yǔ)音交互引擎發(fā)布會(huì)上,CTO楊洪濤這樣說(shuō)。當(dāng)天,搜狐網(wǎng)絡(luò)大廈電梯里的LED屏還在播放搜狗十周年生日的一段視頻。
也就是在搜狗輸入法十周年生日慶典上,CEO王小川曾表示:搜狗輸入法用戶規(guī)模已超過(guò)5.2億,無(wú)論在PC端還是移動(dòng)端,都領(lǐng)先其他競(jìng)爭(zhēng)者。搜狗輸入法的下一步是要不斷優(yōu)化自然語(yǔ)言處理技術(shù),向人工智能方向發(fā)展,尤其在涉及語(yǔ)音識(shí)別、語(yǔ)義理解以及人機(jī)交互方面的語(yǔ)音輸入領(lǐng)域。
從12年開(kāi)始研發(fā)智能語(yǔ)音技術(shù),即便同科大訊飛等專精人工智能領(lǐng)域的企業(yè)相比,布局晚了許多,但搜狗依舊可以算是業(yè)內(nèi)老兵了,在搜狗輸入法和搜狗搜索中也都有語(yǔ)音交互的應(yīng)用。
在釘科技看來(lái),這次發(fā)布會(huì)的意義,對(duì)搜狗而言,除了表明技術(shù)更加成熟之外,就是為與各領(lǐng)域伙伴的合作做一個(gè)鋪墊。楊洪濤在當(dāng)天也有類似的表述:知音引擎要具備開(kāi)放的屬性。開(kāi)放,就是在出行等垂直領(lǐng)域的延伸,為相關(guān)合作伙伴提供語(yǔ)音交互支持,向更多的總段入口進(jìn)行布局。
搜狗語(yǔ)音交互技術(shù)中心負(fù)責(zé)人王硯峰介紹,在今年3月份針對(duì)搜狗、訊飛、百度三家的語(yǔ)音引擎的第三方評(píng)測(cè)中,搜狗與訊飛能力持平,整體領(lǐng)先百度。
在現(xiàn)場(chǎng)播放的橫向?qū)Ρ纫曨l和體驗(yàn)中,釘科技的直觀感受是,搜狗知音在相關(guān)內(nèi)容的連續(xù)延伸搜索方面有比較好的表現(xiàn),可以順暢進(jìn)行多輪對(duì)話。能夠處理更復(fù)雜的用戶交互邏輯,用更自然并且用戶更容易接受和理解的方式進(jìn)行交互,更好地感知用戶語(yǔ)音請(qǐng)求背后的真正需求,從而提供更為便捷的人性化服務(wù)。
例如,當(dāng)用戶說(shuō)我要去首都機(jī)場(chǎng),它會(huì)問(wèn)T1還是T2,當(dāng)用戶確定航站樓后,它會(huì)問(wèn)是出發(fā)還是接人。
讓熱印象比較深刻的是,在語(yǔ)音輸入章XX時(shí),首次轉(zhuǎn)換的文字為“張”,當(dāng)使用者說(shuō)改為立早“章”之后,文字得到了糾正,這在一些場(chǎng)景,比如駕駛場(chǎng)景中,是相當(dāng)方便的,也能更好地保證駕駛員的安全。
知音的知也恰恰在這些方面得到了體現(xiàn)。
王硯峰表示,“知音”在語(yǔ)音識(shí)別、語(yǔ)音糾錯(cuò)、知識(shí)圖譜信息整合能力及多輪對(duì)話理解方面具有技術(shù)優(yōu)勢(shì)。而這種優(yōu)勢(shì),在搜狗方面看來(lái),得益于輸入法及搜索積累下來(lái)的大量數(shù)據(jù)對(duì)于其語(yǔ)義理解能力的錘煉。
釘科技認(rèn)為,搜索引擎團(tuán)隊(duì)適合拓展人工智能業(yè)務(wù)的原因之一也正在于可以占有和調(diào)用足夠量的數(shù)據(jù),而且這些數(shù)據(jù)具備相當(dāng)?shù)臅r(shí)效性和活性。
搜狗方面羅列了一組數(shù)據(jù):搜狗在線語(yǔ)音輸入法語(yǔ)音助手請(qǐng)求次數(shù)超過(guò)1.4億次, 用戶每天使用率占8%。依托于深度學(xué)習(xí)的語(yǔ)義理解,搜狗語(yǔ)義引擎較2013年應(yīng)用之初錯(cuò)誤率降低了60%,較2015年降低了30%。
搜狗輸入法用戶每天能產(chǎn)生的預(yù)料規(guī)模達(dá)到11.7萬(wàn)小時(shí),這比當(dāng)前任何語(yǔ)音技術(shù)團(tuán)隊(duì)所使用的預(yù)料規(guī)模都要大。此外,搜狗表示正在通過(guò)端到端的模型、主動(dòng)積累錯(cuò)誤反饋、線上部署GPU加速等手段促進(jìn)機(jī)器語(yǔ)義理解的智能性。在談及要提高語(yǔ)義理解能力需要基于優(yōu)質(zhì)的、大規(guī)模材料時(shí),楊洪濤這樣表述。
語(yǔ)音識(shí)別、語(yǔ)音交互、語(yǔ)義理解,在這些層面,搜狗知音都比之前的語(yǔ)音應(yīng)用更加成熟。當(dāng)然,在釘科技看來(lái),知音距離不僅“能聽(tīng)會(huì)說(shuō)”,還“能理解會(huì)思考”尚有一段距離。
真正的理解和思考,或許正如楊洪濤所說(shuō),就是能夠替代人做出合乎實(shí)際的判斷和選擇,在這個(gè)層面上,知音還需要學(xué)習(xí),足夠成熟的時(shí)候,或許就不需要用戶再通過(guò)額外的交互將“張”改為“章”(當(dāng)然,搜狗方面的用意主要在于出現(xiàn)錯(cuò)誤時(shí)方便修改)。
楊洪濤表示,不久之后,搜狗將會(huì)發(fā)布相關(guān)的語(yǔ)音文字高準(zhǔn)確率轉(zhuǎn)換的小應(yīng)用,目標(biāo)人群主要是媒體記者等文字工作者,或許能夠幫助記者實(shí)現(xiàn)“用嘴寫稿”的夢(mèng)想。
- QQ:61149512