短短幾個月,ChatGPT的橫空出世點(diǎn)燃了眾人對科技的熱情,賦予千行百業(yè)更多遐想空間。
ChatGPT帶來的風(fēng)也刮到了汽車圈,不少類ChatGPT產(chǎn)品均傳出在不久之后“上車”的消息。2月14日,集度汽車宣布旗下產(chǎn)品將融合百度文心一言的全面能力,支持汽車機(jī)器人實(shí)現(xiàn)自然交流的再進(jìn)階;2月17日,毫末智行也宣布將其自動駕駛認(rèn)知大模型正式升級為DriveGPT,計(jì)劃于2023年4月第八屆HAOMO AI DAY上公布進(jìn)展。
ChatGPT的走俏讓智能網(wǎng)聯(lián)汽車駛向新風(fēng)口。在類ChatGPT等人工智能產(chǎn)品的加持下,智能網(wǎng)聯(lián)汽車有望在車載語音交互和自動駕駛領(lǐng)域?qū)崿F(xiàn)“再進(jìn)化”。
企業(yè)競逐,ChatGPT吹響“上車”號角
當(dāng)前,不少企業(yè)對ChatGPT摩拳擦掌,計(jì)劃面向汽車場景推出類ChatGPT產(chǎn)品,吹響ChatGPT“上車”號角。
集度汽車機(jī)器人
在2月14日舉行的集度“ROBOVERSE三里屯體驗(yàn)中心啟動會上,集度CEO夏一平宣布,集度汽車機(jī)器人將融合百度研發(fā)的“文心一言”的全面能力,支持汽車機(jī)器人實(shí)現(xiàn)自然交流的再進(jìn)階。
眾多關(guān)注人車互動的車企也在“擁抱”ChatGPT及相關(guān)產(chǎn)品。自2月17日起,長城、吉利、紅旗、零跑、東風(fēng)日產(chǎn)啟辰、嵐圖、愛馳等多家汽車品牌紛紛官宣接入“文心一言”。造車新勢力小米汽車則在2月9日舉辦的投資日上談到了ChatGPT。小米汽車表示,ChatGPT基于AI大模型、千億級參數(shù)量、數(shù)據(jù)量、還有人工標(biāo)注支撐,目前小米的汽車業(yè)務(wù)有很多AI大模型落地的場景。
作為一種更自然的語言處理工具,ChatGPT能夠通過學(xué)習(xí)并理解人類的語言來與人對話。在智能汽車場景下,這樣的應(yīng)用也可以改變?nèi)伺c汽車的交互方式,使人與車輛進(jìn)行更深層次、更高效的語音交互,為用戶提供更好的駕駛體驗(yàn)。在夏一平看來,語音交互是車內(nèi)最高效的交互方式,任何交互都沒有語音來得直接。
記者在2月20日探訪集度ROBOVERSE三里屯體驗(yàn)中心時了解到,當(dāng)前車內(nèi)的語音交互更多是指令和機(jī)械命令。文心一言“上車”后,集度的車機(jī)系統(tǒng)能和人進(jìn)行更直接的交流,將更符合人類的思考習(xí)慣,接近人與人之間的交流?;蛟S在未來的汽車上,類ChatGPT產(chǎn)品能通過講笑話給疲勞的駕駛員提神。
黃河科技學(xué)院客座教授張翔同樣認(rèn)為,ChatGPT在以語音交互為代表的車載信息娛樂系統(tǒng)具備很大潛力?,F(xiàn)在很多車企的語音交互產(chǎn)品只能識別比較簡單的指令,ChatGPT“上車”后能夠進(jìn)行更復(fù)雜的語音識別。
從更廣義的生成模型來看,類ChatGPT產(chǎn)品的“上車”也能賦予自動駕駛更多想象空間。中國科學(xué)院院士、清華大學(xué)教授歐陽明高在2月17日舉行的中國電動汽車百人會專家交流會上說:“ChatGPT的火熱將會對今年的自動駕駛行業(yè)產(chǎn)生深遠(yuǎn)影響,解放很多測算門檻,加速這一賽道的全面提速?!?/p>
據(jù)悉,毫末智行推出的“人駕自監(jiān)督認(rèn)知大模型”就借鑒了ChatGPT的實(shí)現(xiàn)思路,采用RLHF(人類反饋強(qiáng)化學(xué)習(xí))技術(shù),通過引入真實(shí)人駕接管數(shù)據(jù),對自動駕駛認(rèn)知決策模型進(jìn)行持續(xù)優(yōu)化。
“ChatGPT是基于自然語言處理的預(yù)訓(xùn)練大模型,所處理的主要是文本語料,基于文本序列來預(yù)測文本序列。而毫末智行的DriveGPT是一個基于大規(guī)模參數(shù)、大規(guī)模數(shù)據(jù)的自動駕駛認(rèn)知大模型,主要用途是不斷學(xué)習(xí)人駕策略,當(dāng)前主要通過云端測評方式來提高車端算法效果?!焙聊┲切袛?shù)據(jù)智能科學(xué)家賀翔對《中國電子報(bào)》記者表示,基于大規(guī)模量產(chǎn)輔助駕駛系統(tǒng),可以從不同道路環(huán)境和不同交通流密度等場景中,積累大量更具多樣性的數(shù)據(jù)。
AI大模型是數(shù)據(jù)推衍和底層邏輯背后推手
在數(shù)據(jù)推衍和底層邏輯方面,ChatGPT和智能汽車身后都有一個共同推手—AI大模型。正如夏一平所言:“真正到ChatGPT時代,依賴的可能不是車,而是背后模型的能力有多強(qiáng)?!?/p>
在大模型技術(shù)超強(qiáng)的學(xué)習(xí)能力支撐下,類ChatGPT產(chǎn)品上車,重點(diǎn)是聚焦車載語音交互這一垂直場景,再進(jìn)行技術(shù)應(yīng)用。思必馳在車載語音交互領(lǐng)域深耕多年,目前在智能汽車領(lǐng)域的客戶已涵蓋上汽、北汽、理想、哪吒、博泰等國內(nèi)頭部主機(jī)廠及Tier1 廠商。
思必馳智能車聯(lián)網(wǎng)方案
“大模型技術(shù)通過強(qiáng)化上下文理解能力、思維鏈推理,以及增強(qiáng)指令學(xué)習(xí)來實(shí)現(xiàn)持續(xù)學(xué)習(xí)。”思必馳汽車事業(yè)部產(chǎn)品總監(jiān)葛付江對《中國電子報(bào)》記者表示,除了完成“導(dǎo)航去公司”這類固定指令的任務(wù)型對話,在進(jìn)行日常知識交流和閑聊對話時,車與人的交流方式也會更高效、更直接,且具備高靈活度。
以ChatGPT為代表的大模型應(yīng)用將人類整合、利用海量數(shù)據(jù)的能力又送上了一個臺階,這一基礎(chǔ)能力對自動駕駛同樣至關(guān)重要。
在賀翔看來,自動駕駛的真正實(shí)現(xiàn),離不開基于數(shù)據(jù)驅(qū)動的AI技術(shù)方式。具體到當(dāng)前,就是以Transformer為代表的大模型所驅(qū)動的感知、認(rèn)知算法不斷進(jìn)化,使得智能駕駛技術(shù)從低階、限定場景的輔助駕駛,邁向高階全場景的輔助駕駛,再升級為全場景完全自動駕駛。
隨著車端設(shè)備算力的提升,以及數(shù)據(jù)越來越豐富,經(jīng)過訓(xùn)練后的AI大模型將具備更強(qiáng)的自動駕駛能力。
“當(dāng)前AI大模型正在廣泛應(yīng)用在自動駕駛領(lǐng)域?!辟R翔告訴記者,基于視覺自監(jiān)督大模型,數(shù)據(jù)處理可以實(shí)現(xiàn)對多模態(tài)感知數(shù)據(jù)的大規(guī)模自動標(biāo)注;基于3D重建大模型,可以實(shí)現(xiàn)數(shù)據(jù)生成,并通過仿真模擬極端場景來提升感知效果;在感知端,基于多模態(tài)互監(jiān)督大模型,可以完成一般障礙物以及通用障礙物的識別,更好地提升感知能力;基于動態(tài)環(huán)境大模型,可以更精準(zhǔn)預(yù)測道路拓?fù)潢P(guān)系,幫助車輛更穩(wěn)定、合理地規(guī)劃行駛路線。
毫末智行宣布推出DriveGPT
賀翔以毫末智行“人駕自監(jiān)督認(rèn)知大模型”DriveGPT為例對記者表示,該大模型在認(rèn)知端引入了數(shù)千萬公里的真實(shí)駕駛行為數(shù)據(jù)做預(yù)訓(xùn)練,使駕駛策略更加擬人化。同時還引入了司機(jī)接管數(shù)據(jù)來不斷修正駕駛策略,提升駕駛水平。
“漣漪效應(yīng)”促進(jìn)迭代,商業(yè)化路徑仍在探索
以智能汽車為代表,一些社會剛需或具備大量活躍用戶的應(yīng)用,可以結(jié)合用戶交互體驗(yàn)數(shù)據(jù),反饋給模型后進(jìn)一步提升模型的能力,在數(shù)據(jù)和模型之間形成正向反饋循環(huán)的“漣漪效應(yīng)”,使迭代更新后的模型越來越強(qiáng)。
“ChatGPT的初步突破帶來的當(dāng)前影響和未來想象空間是巨大的?!笨拼笥嶏w研究院執(zhí)行院長劉聰對記者表示,在技術(shù)演化的基礎(chǔ)上,以自然語言處理為代表的人工智能算法有可能重構(gòu)互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)的產(chǎn)品形態(tài),促進(jìn)教育業(yè)、醫(yī)療業(yè)、汽車業(yè)、金融業(yè)、消費(fèi)業(yè)、媒體業(yè)、服務(wù)業(yè)和制造業(yè)等眾多產(chǎn)業(yè)的升級,最終帶來對應(yīng)商業(yè)模式的變革。
目前來看,類ChatGPT產(chǎn)品在汽車領(lǐng)域的商業(yè)化路徑還處于探索初期。以車載語音交互為例,應(yīng)用ChatGPT的費(fèi)用高昂,至少包括訓(xùn)練費(fèi)用、對話使用費(fèi)、硬件軟件費(fèi)用等。成本也因此成為類ChatGPT產(chǎn)品在車載語音交互領(lǐng)域大規(guī)模商用的阻礙之一。
“成本確實(shí)會成為技術(shù)商業(yè)化落地的影響因素?!备鸶督瓕τ浾弑硎荆珻hatGPT的研究需要巨額的資金投入和人才儲備,包括超算平臺、算法、數(shù)據(jù)等各核心力量支撐。目前來看,頭部平臺公司具備這方面優(yōu)勢。科技企業(yè)可以更多地從場景融合入手,開發(fā)應(yīng)用級產(chǎn)品,尋求創(chuàng)新機(jī)會。
思必馳天琴車載語音助手核心能力
在車載語音交互領(lǐng)域,類ChatGPT產(chǎn)品如何在車內(nèi)有限空間里發(fā)揮最大效用?葛付江認(rèn)為,從商業(yè)化場景看,目前ChatGPT更適合用在基于一定背景知識的創(chuàng)作型產(chǎn)業(yè),以及“剛需”AIGC的場景和SOP(標(biāo)準(zhǔn)作業(yè)程序)行業(yè)。這一方面對算力優(yōu)化、云和端智能融合技術(shù)等方面提出挑戰(zhàn),另一方面也會推動相關(guān)技術(shù)向安全、對人有幫助的智能方向發(fā)展。
總體而言,ChatGPT“上車”后,車載語音交互的發(fā)展形勢仍不明朗。但可預(yù)見的是,在車載場景下,語音交互的形式將更加流暢,內(nèi)容將更有價(jià)值。
“相關(guān)技術(shù)會向統(tǒng)一多模態(tài)交互發(fā)展,強(qiáng)化語音、文本、圖像等深度融合的多模態(tài)交互技術(shù),形成‘汽車大腦’,以應(yīng)對車內(nèi)、公共空間等復(fù)雜場景的交互需求。”葛付江說。
賀翔在談及大模型在自動駕駛行業(yè)的落地時表示,大模型具有參數(shù)規(guī)模大、數(shù)據(jù)訓(xùn)練規(guī)模大,對算力要求大、成本高的特點(diǎn),本身很難在終端設(shè)備上落地。在此背景下,自動駕駛行業(yè)需要解決三個問題:通過建設(shè)智算中心和優(yōu)化訓(xùn)練效率,降低大模型的云端訓(xùn)練成本;通過改進(jìn)車端芯片、定制transformer專用加速芯片來提升計(jì)算效能;通過改進(jìn)車端模型和輕量化模型來提升計(jì)算效率。
搭載毫末智行輔助駕駛產(chǎn)品的汽車行駛在高速路上
盡管面臨一些挑戰(zhàn),但在賀翔看來,大模型在自動駕駛落地的趨勢不會變化,只是需要分階段、分任務(wù)去解決相應(yīng)問題和挑戰(zhàn)。
- QQ:61149512