說(shuō)到各大科技公司的語(yǔ)音助手,你最喜歡哪一個(gè)?是Google Assistant,蘋(píng)果Siri,亞馬遜Alexa,還是微軟Cortana?
據(jù)中科院最近的一項(xiàng)研究顯示,谷歌的語(yǔ)音助手Google Assistant的智商為47.28,而 Siri 的分值是 23.94。拋去智商不談,Google Assistant的口碑向來(lái)不錯(cuò),其自然流利的語(yǔ)音對(duì)話更是讓人印象深刻,這一點(diǎn)上更是甩Siri幾條街。
為什么Google Assistant的聲音更加自然?這還要得益于DeepMind。DeepMind是一家谷歌旗下的人工智能公司,為世人熟知的「阿爾法狗」就出自DeepMind。
DeepMind還有一項(xiàng)名叫WaveNet的技術(shù),這項(xiàng)技術(shù)是一種可以生成更加自然的合成語(yǔ)音的神經(jīng)網(wǎng)絡(luò)。WaveNet與傳統(tǒng)的連續(xù)TTS不同,傳統(tǒng)的連續(xù)TTS使用單個(gè)語(yǔ)音演員預(yù)錄制的大量語(yǔ)音,計(jì)算機(jī)每秒可以使用16,000個(gè)樣本創(chuàng)建單個(gè)聲音波形。但是WaveNet使用大量的語(yǔ)音樣本數(shù)據(jù),并且已經(jīng)進(jìn)行超過(guò)12個(gè)月時(shí)間的訓(xùn)練,根據(jù)真實(shí)的語(yǔ)音波形,WaveNet可以對(duì)合成語(yǔ)音進(jìn)行音調(diào)修正。
下面可以看看這個(gè)例子:
使用WaveNet之前
使用WaveNet之后
不知道你有沒(méi)有聽(tīng)出區(qū)別?
非常遺憾的一點(diǎn)是,目前Google Assistant的語(yǔ)音只支持英語(yǔ)和日語(yǔ),如果你手上有臺(tái)Pixel手機(jī),將系統(tǒng)語(yǔ)言調(diào)成英文,你就能用英文和它進(jìn)行對(duì)話了。當(dāng)然,現(xiàn)在Google Assistant在iPhone上也是可以安裝使用的。隨著時(shí)間的推移,Google將這項(xiàng)技術(shù)應(yīng)用在其他語(yǔ)言上,肯定也不是問(wèn)題。
- QQ:61149512