作者 | 金旺
欄目 | 具身資訊
2024年7月,年僅36歲的印奇開啟了他的第二次創(chuàng)業(yè)。
第一次創(chuàng)業(yè),印奇和自己在清華姚班的兩位同學唐文斌、楊沐一起創(chuàng)立的曠視科技,曠視科技后來成長為國內(nèi)第一批“AI四小龍”,三位創(chuàng)始人也成了中國AI領(lǐng)域關(guān)鍵人物。
第二次創(chuàng)業(yè),印奇在2024年成立江河順遂,江河順遂作價24.3億元受讓吉利旗下公司所持有的力帆科技部分股份后,力帆科技更名為千里科技,印奇于同年任職千里科技董事長。
從人工智能明星企業(yè)轉(zhuǎn)入智能駕駛賽道算不上跨界,但對于印奇而言,這仍是一次新的嘗試,一次憑借AI改變汽車行業(yè)的嘗試。
3月3日,繼在上海GDC 2025上與吉利汽車、階躍星辰聯(lián)合官宣打造汽車全域智能后,在吉利AI智能科技發(fā)布會上,千里科技董事長印奇作為主咖,在發(fā)布會上闡述了他的“AI+車”理念。
01 2025,“AI+車”元年
在汽車圈,吉利是在大模型領(lǐng)域早起的那個人。
早在2021年,吉利就部署了AI技術(shù),并在行業(yè)還不明朗時啟動了基礎(chǔ)大模型的研究。
吉利汽車集團CEO淦家閱在發(fā)布會上指出,“目前吉利已經(jīng)將AI技術(shù)應(yīng)用到了架構(gòu)、動力、座艙、底盤等汽車全域和全價值鏈中,這讓吉利成為了AI造車第一車企。”
要成為AI造車第一車企,只有吉利汽車自己的研發(fā)力量是不夠的,于是,吉利基于星睿智算中心2.0成立了智能汽車算力聯(lián)盟。
作為吉利生態(tài)戰(zhàn)略合作伙伴,以及吉利汽車智駕系統(tǒng)技術(shù)供應(yīng)商,千里科技自然也是這一聯(lián)盟中的一員。
作為千里科技董事長,印奇認為,人工智能技術(shù)進步與汽車產(chǎn)業(yè)發(fā)展有著共振。
關(guān)于人工智能與汽車產(chǎn)業(yè)的共振,印奇特別提到了三個時間節(jié)點:
第一個節(jié)點,2017年,以Transformer為代表的全新AI技術(shù)架構(gòu)正式推出,一年后,Waymo推出了Robotaxi第一個商用服務(wù),接著,特斯拉在2020年上線了FSD Beta版本;
第二個節(jié)點,2021年,吉利發(fā)布“智能吉利2025戰(zhàn)略”、打造了“一網(wǎng)三體系”,一年后,OpenAI發(fā)布了震驚全球的ChatGPT,接著,特斯拉在2023年發(fā)布了首次實現(xiàn)純視覺端到端智駕架構(gòu)的FSD V12;
第三個節(jié)點,2025年,DeepSeek R1全球開源,再次引爆全球人工智能領(lǐng)域,緊隨其后,吉利與階躍星辰聯(lián)合開源兩款多模態(tài)大模型,與此同時,今年也是“智能吉利2025戰(zhàn)略”的收官之年,更多智駕和座艙產(chǎn)品即將涌現(xiàn)。
正是藉由人工智能技術(shù)突破,以及在汽車產(chǎn)業(yè)中的應(yīng)用情況,印奇認為,2025年是“AI+車”的元年。
02 “AI+車”的三個趨勢
2024年,掀起這次人工智能浪潮的OpenAI,就AGI(通用人工智能)技術(shù)提出了五級分級架構(gòu),在這一架構(gòu)中,人工智能技術(shù)被劃分為五個階段,分別為:
L1:聊天機器人(ChatBots),具有對話能力的AI;
L2:推理者(Reasoners),可以像人類一樣解決問題的AI;
L3:智能體(Agents),不僅能思考,還可以采取行動的AI系統(tǒng);
L4:創(chuàng)新者(Innovators),可以協(xié)助發(fā)明創(chuàng)造的AI;
L5:組織者(Organizations),可以完成組織工作的AI。
印奇認為,當前人工智能正在從L2的推理者向L3的智能體本質(zhì)跨越,2025年也會成為智能體爆發(fā)的一年。
實際上,無論是智能語音系統(tǒng),還是多模態(tài)大模型,在過去幾年已經(jīng)逐漸被用到了汽車上,乃至座艙中。
而就現(xiàn)在多模態(tài)智能體發(fā)展趨勢下,印奇提出了他認為的“AI+車”三大趨勢:
第一個趨勢,超自然人機交互的誕生。
從當年P(guān)C上的GUI發(fā)展到移動互聯(lián)網(wǎng)時代的Touch UI,如今我們在汽車,乃至更多場景下,正在邁入一個超自然的Ultra Nature UI交互形態(tài)。
千里科技與吉利正在重新定義的具備超自然對話、AgentOS、跨域協(xié)同的下一代座艙系統(tǒng),預(yù)計將在今年內(nèi)發(fā)布,并在銀河品牌車上上線。
第二個趨勢,自動駕駛及自動執(zhí)行的全面落地。
機器人領(lǐng)域機械臂的VLA模型,以及世界生成模型的高速發(fā)展,未來將會有越來越多機器人應(yīng)用場景和自動執(zhí)行場景迎來爆發(fā), 而汽車將會是最趨向機器人,也是最大規(guī)模的機器人落地場景。
吉利聯(lián)合生態(tài)企業(yè)推出的千里浩瀚,將作為具備L3量產(chǎn)能力的解決方案今年搭載到銀河品牌車型上。
第三個趨勢,車聯(lián)網(wǎng)大模型量級升維。
從模型的數(shù)據(jù)量來看,目前智駕大模型大約會用到1000萬個視頻片段,但是人工智能基礎(chǔ)大模型會用到10億個視頻片段;
從模型的物體識別類別來看智能駕駛識別的障礙物類別在百級,大部不能被識別的障礙物被簡單地歸類為通用可移動/不可移動障礙物,而如今最先進的多模態(tài)大模型能夠識別的物體種類能夠能達十萬級別。
真正的AI大模型實際上比現(xiàn)在車上的AI模型先進1-2代,如果能將大模型應(yīng)用到車上,這將會智能汽車帶來巨大潛力。
印奇認為,汽車將會在未來化身為一個超級智能體,乃至一個“出行智慧生命體”。
這或許正是長于人工智能技術(shù)的印奇,第二次創(chuàng)業(yè)進入智能汽車賽道,看到的那個充滿誘惑力的未來。
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學解題中,為AI訓(xùn)練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學習和數(shù)學優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設(shè)備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學習訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實現(xiàn)大語言模型訓(xùn)練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓(xùn)練效率,已在多個任務(wù)上驗證有效性。
關(guān)注智造、硬件、機器人。