12月6日,大數(shù)據(jù)&機(jī)器學(xué)習(xí)領(lǐng)袖峰會(huì)(Big Data & Machine Learning Leaders Summit Hong Kong 2018)在香港召開。作為全亞洲最受期待的大數(shù)據(jù)&機(jī)器學(xué)習(xí)會(huì)議之一,此次峰會(huì)吸引了包括OPPO AI專家在內(nèi)的全球頂尖科學(xué)家和技術(shù)領(lǐng)袖,聚焦探討數(shù)據(jù)、機(jī)器學(xué)習(xí)、人工智能與技術(shù)的商業(yè)化等前沿話題。
OPPO高級(jí)AI架構(gòu)師何朝文
來(lái)自O(shè)PPO美國(guó)研究所的高級(jí)AI架構(gòu)師何朝文出席此次峰會(huì)并發(fā)表主題演講,著重介紹了OPPO對(duì)計(jì)算機(jī)視覺技術(shù)未來(lái)應(yīng)用的思考。他表示:“AI能力的進(jìn)一步發(fā)展,特別是與即將到來(lái)的5G時(shí)代深度融合,將推動(dòng)視頻成為更普遍的交流媒介。用戶不僅可以更隨心所欲地觀看視頻,也能夠更低成本地創(chuàng)造視頻內(nèi)容。而計(jì)算機(jī)視覺技術(shù)向視頻理解領(lǐng)域的延伸,將是打造這一全新用戶體驗(yàn)場(chǎng)景的關(guān)鍵?!?/span>
推動(dòng)AI從感知到認(rèn)知,打造智慧的視頻管理和創(chuàng)作
視頻已經(jīng)成為霸屏用戶時(shí)間的最主要內(nèi)容。根據(jù)QuestMobile發(fā)布的《2018年半年大報(bào)告》,在線視頻和短視頻是移動(dòng)網(wǎng)民使用時(shí)間占比前三的應(yīng)用類型。而不遠(yuǎn)的將來(lái),5G超高速、低時(shí)延的全新特點(diǎn)也會(huì)讓視頻類應(yīng)用的數(shù)量提升到新的量級(jí)。
何朝文認(rèn)為,視頻將成為未來(lái)移動(dòng)互聯(lián)網(wǎng)主要內(nèi)容形式,這對(duì)終端設(shè)備也提出了更高的要求,為了讓用戶更便捷地管理視頻和創(chuàng)作視頻,手機(jī)需要具備視頻管理器和編輯器的功能。借助AI能力,手機(jī)可以智能地完成分類、搜索、片段搜索和推薦功能。比如用戶搜索“貓”或者“孩子”等關(guān)鍵詞,手機(jī)就可以主動(dòng)呈現(xiàn)出來(lái)所有包含這些關(guān)鍵詞的片段。不僅如此,AI還能夠定位到相應(yīng)的時(shí)間點(diǎn),更加精準(zhǔn)地呈現(xiàn)結(jié)果。
同時(shí),通過(guò)AI編輯功能,手機(jī)可以自動(dòng)完成風(fēng)格轉(zhuǎn)換、解構(gòu)分割、效果增強(qiáng)、亮點(diǎn)摘要和視頻生成。例如用戶可以通過(guò)風(fēng)格轉(zhuǎn)移功能,可以讓一段普通視頻呈現(xiàn)出梵高《星空》的后印象派畫風(fēng)。AI也可以幫助用戶自動(dòng)處理一系列原始視頻素材,剪輯出一段更加有節(jié)奏感和故事性的片段。
挑戰(zhàn)行業(yè)難題,OPPO AI視頻理解已達(dá)業(yè)界領(lǐng)先水平
視頻理解是整個(gè)業(yè)界公認(rèn)的難題,而OPPO已經(jīng)在視頻分類和風(fēng)格轉(zhuǎn)移方面達(dá)到了業(yè)界領(lǐng)先水平。
據(jù)何朝文介紹,OPPO的最快的視頻分類AI模型已經(jīng)可以在公開數(shù)據(jù)集 Kinetics-600 實(shí)現(xiàn)69%的準(zhǔn)確率,并且基于單個(gè)英偉達(dá) V100 GPU 實(shí)現(xiàn)1秒10個(gè)視頻的處理速度。同時(shí),OPPO表現(xiàn)最佳的模型則可以實(shí)現(xiàn)71%的Top-1準(zhǔn)確率,速度是1秒2.7個(gè)視頻。從兩組數(shù)據(jù)表現(xiàn)來(lái)看,OPPO的AI模型性能已經(jīng)與谷歌類似,甚至在處理速度上更勝一籌。
而在編輯方面,何朝文表示OPPO美國(guó)研究所已經(jīng)可以對(duì)視頻進(jìn)行風(fēng)格轉(zhuǎn)換,并且很好地解決了因?yàn)橐曨l前后幀的亮度不一致導(dǎo)致的閃爍問(wèn)題。
完整的閉環(huán)能力,OPPO致力打造卓越的AI體驗(yàn)
對(duì)前沿技術(shù)的探索和追求是為了給用戶帶來(lái)真正的價(jià)值。何朝文在演講中也強(qiáng)調(diào),在OPPO看來(lái)AI是一種能力,也是一種思維,要始終利用這種思維思考AI如何解決和滿足用戶的痛點(diǎn)與需求。
實(shí)際上,OPPO目前已經(jīng)將AI能力廣泛應(yīng)用在手機(jī)產(chǎn)品上,帶來(lái)拍照?qǐng)鼍白R(shí)別、智慧識(shí)物等智能體驗(yàn)。例如OPPO R17系列已經(jīng)能夠識(shí)別21類獨(dú)立場(chǎng)景以及多達(dá)800個(gè)場(chǎng)景組合;同時(shí)也可以通過(guò)相機(jī)對(duì)條碼類、實(shí)體類、文字類的掃描識(shí)別,提供多語(yǔ)種翻譯、內(nèi)容提取、圖像優(yōu)化、場(chǎng)景服務(wù)、信息查詢等多方位萬(wàn)物識(shí)別服務(wù)。
OPPO的閉環(huán)AI架構(gòu)是持續(xù)提升用戶體驗(yàn)的關(guān)鍵。何朝文強(qiáng)調(diào),OPPO的AI架構(gòu)底層為硬件平臺(tái),上面分別是大數(shù)據(jù)平臺(tái)、訓(xùn)練平臺(tái)、智能應(yīng)用和用戶體驗(yàn)。硬件平臺(tái)提供算力支持,大數(shù)據(jù)平臺(tái)則保證數(shù)據(jù)的可靠性和安全性。同時(shí)通過(guò)訓(xùn)練平臺(tái),OPPO可以利用AI算法來(lái)建立模型去支持計(jì)算機(jī)視覺、語(yǔ)音識(shí)別、自然語(yǔ)義處理和個(gè)性化推薦等智能應(yīng)用。當(dāng)然,最終目的還是要用來(lái)提升用戶體驗(yàn)。而用戶在具體使用中的反饋則會(huì)反哺到大數(shù)據(jù)平臺(tái)的訓(xùn)練中,進(jìn)一步驅(qū)動(dòng)用戶體驗(yàn)的優(yōu)化。
在前不久的2018 OPPO科技展期間,OPPO創(chuàng)始人、總裁兼CEO陳明永也特別明確了AI的重要意義,他提到:“手機(jī)作為AI最好的載體之一,還有很大的改善空間。OPPO要積極擁抱人工智能,要密切關(guān)注AI前沿技術(shù)和應(yīng)用成果?!边~入5G時(shí)代,AI技術(shù)帶來(lái)的好處也將獲得真正的釋放。
- QQ:61149512