媒體杯電競體驗(yàn)賽。話說VRES已經(jīng)發(fā)展到了第四屆,而今年它又有新玩法——將「VR」和「5G」組合在一起,玩家無須背上沉重的“三級包”,只需VR眼鏡一戴,輕裝上陣。
圖為ChinaJoy2021英特爾展臺。
比如VRES之所以能實(shí)現(xiàn)技術(shù)突破,背后就采用了英特爾的至強(qiáng)處理器、酷睿i9處理器的5G邊緣計(jì)算解決方案。
“英特爾深耕電競生態(tài)近20年,見證了電競游戲市場的激蕩沉浮和華麗轉(zhuǎn)身。”呂冬說道,多年來,英特爾一直在電競領(lǐng)域持續(xù)投入。比如“針對本地非職業(yè)玩家打造的”英特爾大師挑戰(zhàn)賽,“針對全球最頂級職業(yè)玩家打造的”英特爾極限大師賽,近幾年的《英雄聯(lián)盟》全球總決賽,VRES等。此外,英特爾還在與國際奧委會討論,如何把中國消費(fèi)者更喜歡的、更主流的游戲帶入北京冬奧會,甚至變成奧運(yùn)的正式比賽。
圖:英特爾贊助的全球電競賽事
英特爾的大量投入不無道理。根據(jù)分析機(jī)構(gòu)Newzoo數(shù)據(jù)顯示,2021年全球游戲玩家數(shù)量達(dá)14 億,到2023年全球游戲市場的收入將實(shí)現(xiàn)2000億,龐大的數(shù)字意味著游戲不再是小眾產(chǎn)業(yè)。再看今年的ChinaJoy,現(xiàn)場感受到的微妙變化是,參展的非游戲廠商勢頭更勁,這同樣也印證著一種趨勢——游戲產(chǎn)業(yè)正在不斷破圈。
說到底,英特爾究竟如何賦能游戲產(chǎn)業(yè)?英特爾游戲合作技術(shù)經(jīng)理盧卷彬總結(jié)道:優(yōu)化游戲性能。
圖:英特爾游戲合作技術(shù)經(jīng)理盧卷彬在ChinaJoy2021媒體分享會。
這里有一個最簡單的游戲架構(gòu),說是簡單,但卻覆蓋了復(fù)雜的驅(qū)動和硬件、中間件、引擎、游戲內(nèi)容4層架構(gòu),當(dāng)中涉及到的廠商很多、模塊很多、代碼巨大,所以優(yōu)化游戲性能并非易事。不過也有好處,就是當(dāng)一個系統(tǒng)太復(fù)雜的時候,好比人類社會,就存在分工,每個“人”把自己的那一塊做大,然后開放給更多開發(fā)者,大家一起把產(chǎn)業(yè)生態(tài)建好。
那么性能優(yōu)化如何去做呢?一言以蔽之,就像把大象裝冰箱,找到問題,解決問題。相對而言,找到問題更重要,因?yàn)樵诨ヂ?lián)網(wǎng)時代,你遇到任何的問題都不是你獨(dú)有的問題。
通常,游戲性能要看「硬件」和「軟件」,硬件又主要看CPU和GPU。CPU層面,游戲體積越大,對 CPU的要求就越高。在這方面,英特爾經(jīng)常會去收集市面上幾十上百款游戲,分析這些游戲在公司的最新架構(gòu)處理器上的表現(xiàn),以改進(jìn)產(chǎn)品。
比如英特爾幾十年來沉淀了一整套性能分析工具「Vtune」。用盧卷彬的話來說就是,無論是服務(wù)器,還是客戶端,Vtune可以從系統(tǒng)層面到每一個線程,每一個DLL,每一個函數(shù),每一行代碼,再到匯編,都可以給你整的清清楚楚、明明白白。而且它是免費(fèi)的。
圖為英特爾Vtune程序示例1。左邊為該程序的利用情況,右邊為對微架構(gòu)的分析、針對性建議,便于開發(fā)者了解情況。
圖為英特爾Vtune程序示例2。左下角是每個線程的概況,包括線程之間的同步關(guān)系、替代關(guān)系等,便于開發(fā)者了解情況。
GPU層面,英特爾也有一個工具「GPA」。盧卷彬介紹,游戲的總體情況,具體到每一個Pass,每一個Draw call,每一個Shader,每一個參數(shù),都可以通過GPA發(fā)現(xiàn)并定位,以便開發(fā)者知道是什么情況。
圖為英特爾GPA程序示例。
比如游戲突然掉幀的情況,你不知道它是在哪掉的,也根本來不及抓取。英特爾GPA可以抓取一段時間里的每一幀的Frame并顯示出來,這樣你就可以點(diǎn)擊其中最耗時的那一幀看詳細(xì)數(shù)據(jù);此外,它也會對這一幀進(jìn)行3D Pipeline分析,以便開發(fā)者找到問題。
除了工具之外,人也是非常重要的。英特爾在發(fā)布一些新平臺的時候,會把測試版機(jī)器先給到開發(fā)者,讓他們提前進(jìn)行適配;同時英特爾還提供測試服務(wù),幫助開發(fā)者的游戲?qū)Υ蟛糠值钠脚_做性能分析或測試,并反饋給他們,開發(fā)者才會有目的性地優(yōu)化平臺。
上述談到的是如何找問題,接下來就是解決問題。英特爾有四招:
第一,發(fā)現(xiàn)和修正代碼。由于一款游戲的代碼數(shù)量非常大且非常復(fù)雜,尤其是每個游戲團(tuán)隊(duì)中的分工很多,既有程序開發(fā),也有美工,經(jīng)常存在互相之間考慮的問題,而英特爾的工具會優(yōu)化這個問題。
第二,并行優(yōu)化。如果說GPU是處理幾百萬個單獨(dú)的三角形,那么CPU就是處理無數(shù)個相互作用的模塊——前者的三角形之間沒有依賴的, 所以優(yōu)化起來相對簡單,用幾百個或者是幾千個顯卡單元去計(jì)算,都可以得到非常線性的性能提升;但是CPU的模塊之間互相依賴且互有邏輯,優(yōu)化起來非常難。
在這方面,英特爾與合作伙伴合作開發(fā)了很多程序,幫助游戲開發(fā)者解決這些問題。比如和Unity合作做了ECS和Job system,和Unreal做了Unreal Task system,用線程池的方式,把任務(wù)都提交到 Unreal的任務(wù)系統(tǒng)當(dāng)中,去充分應(yīng)用多線程。
第三,算法優(yōu)化。這需要針對具體游戲具體分析,所以需要游戲開發(fā)者與英特爾一起討論并找到優(yōu)化方式。
第四,底層架構(gòu)優(yōu)化。當(dāng)一個游戲開發(fā)者把前面的都做好了,還是覺得性能不 好,如果也有余力、有時間,可以進(jìn)行一些底層架構(gòu)的優(yōu)化,那么英特爾的工程師也會提供建議給他們,讓他們自己評估。
圖:英特爾對游戲性能的優(yōu)化成果。
“游戲開發(fā)者就是我們的客戶,客戶就是上帝,我們會持續(xù)跟他們一起合作,開發(fā)更多有創(chuàng)造性的產(chǎn)品。”盧卷彬說道。
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時顯著提升訓(xùn)練效率,已在多個任務(wù)上驗(yàn)證有效性。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會友,左手硬核科技,右手浪漫主義。