“解好電力行業(yè)的關(guān)鍵問(wèn)題,有可能會(huì)引領(lǐng)下一波AI浪潮。”中國(guó)工程院院士、阿里云創(chuàng)始人王堅(jiān)2月17日在南方電網(wǎng)總部參加第四屆電力調(diào)度AI應(yīng)用大賽時(shí)表示。該大賽由南方電網(wǎng)、中國(guó)電機(jī)工程學(xué)會(huì)電力系統(tǒng)自動(dòng)化專(zhuān)委會(huì)主辦,阿里云承辦、阿里達(dá)摩院協(xié)辦。
圖:中國(guó)工程院院士、阿里云創(chuàng)始人 王堅(jiān)
王堅(jiān)認(rèn)為,縱觀AI的發(fā)展歷程,從Alpha Go、ImageNet到Alpha Fold、ChatGPT,都是通過(guò)對(duì)某一個(gè)問(wèn)題的攻克,從而帶動(dòng)了人工智能的巨大進(jìn)步。相信電力行業(yè)、工業(yè)領(lǐng)域也能找到這樣一個(gè)問(wèn)題,這將對(duì)社會(huì)發(fā)展、人類(lèi)生活帶來(lái)更大、更切實(shí)的影響。
王堅(jiān)介紹,在1950年代,人類(lèi)可以想象AI最了不起的事情就是“下棋”。直到深藍(lán)、AlphaGo的出現(xiàn),AI打敗了國(guó)際象棋大師,人工智能技術(shù)有了很大進(jìn)步。
幾年后,針對(duì)“圖像識(shí)別”這一問(wèn)題,在AI界又出現(xiàn)了基于深度學(xué)習(xí)的ImageNet,使得機(jī)器對(duì)人臉的識(shí)別率超過(guò)了人類(lèi)。這又將人工智能帶到了新的高度。
近年來(lái)出現(xiàn)的Alpha fold,在發(fā)現(xiàn)蛋白質(zhì)結(jié)構(gòu)方面的能力已經(jīng)超過(guò)了一流的科學(xué)家,挑戰(zhàn)著他們畢生的專(zhuān)業(yè)經(jīng)驗(yàn)。ChatGPT則通過(guò)聊天這一場(chǎng)景,為自然語(yǔ)言處理帶來(lái)了全新的變革。
“人工智能的每次跨越,都是圍繞著對(duì)某一個(gè)問(wèn)題的攻堅(jiān),”王堅(jiān)說(shuō),問(wèn)題定義得好,可以反過(guò)來(lái)帶動(dòng)人工智能學(xué)科的發(fā)展。
王堅(jiān)指出,工業(yè)是用新技術(shù)最好的地方。在電力行業(yè)、工業(yè)領(lǐng)域,我們可以找到比“下棋”更有高度的問(wèn)題,引領(lǐng)下一波AI浪潮。如果能找到、解好這樣一個(gè)問(wèn)題,對(duì)推動(dòng)社會(huì)經(jīng)濟(jì)發(fā)展、人類(lèi)生活變化,會(huì)產(chǎn)生更巨大、更積極的影響。
好文章,需要你的鼓勵(lì)
新加坡國(guó)立大學(xué)研究團(tuán)隊(duì)開(kāi)發(fā)了SPIRAL框架,通過(guò)讓AI與自己對(duì)弈零和游戲來(lái)提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡(jiǎn)單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無(wú)需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開(kāi)發(fā)的GIGA-ToF技術(shù)通過(guò)融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問(wèn)題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺(jué)解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過(guò)對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺(jué)語(yǔ)言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無(wú)法有效利用視覺(jué)信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過(guò)動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語(yǔ)言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。