4月7日,阿里云公開“阿里版GPT”通義千問邀測入口,引發(fā)強(qiáng)烈關(guān)注。4月11日,阿里云再放大招。“所有軟件都值得接入大模型升級改造”,阿里云智能CTO周靖人在北京云峰會現(xiàn)場宣布:“我們將開放通義千問的能力,幫助每家企業(yè)打造自己的專屬大模型!”據(jù)悉,阿里所有產(chǎn)品未來將接入通義千問進(jìn)行全面改造,釘釘、天貓精靈率先接入測試,將在評估認(rèn)證后正式發(fā)布新功能。
“通義千問”將全面接入阿里辦公、購物、語音助手等場景
根據(jù)釘釘當(dāng)天預(yù)告的Demo演示,接入通義千問之后的釘釘可實(shí)現(xiàn)近10項新AI功能,全面激發(fā)創(chuàng)意和辦公生產(chǎn)力。通過類似微軟Copilot“副駕駛”的設(shè)定,用戶可隨時隨地喚起AI,開啟全新工作方式。在釘釘文檔中,通義千問可以創(chuàng)作詩歌小說、撰寫郵件、生成營銷策劃方案等,全面輔助辦公。在釘釘會議中,通義千問可以隨時生成會議記錄并自動總結(jié)會議紀(jì)要、生成待辦事項。通義千問還可以幫助自動總結(jié)未讀群聊信息中的要點(diǎn)。最驚艷的是,釘釘展示了拍照生成小程序場景,上傳一張功能草圖,不用寫一行代碼,可立刻生成訂餐輕應(yīng)用。
根據(jù)天貓精靈官方預(yù)告的演示Demo,接入通義千問后,新天貓精靈變得更擬人更聰明,知識、情感、個性、記憶能力大幅躍升。它支持自由對話,可以隨時打斷、切換話題,能根據(jù)用戶需求和場景隨時生成內(nèi)容。比如,用戶可以在跑步時要求天貓精靈“合成1小時歌單,50%穿插搖滾風(fēng)格的歌曲”,也可以和天貓精靈聊文化談人生。新天貓精靈不僅能回答小朋友的各種刁鉆問題,還可以一起創(chuàng)作“宇宙大爆炸”的新故事。
此外,通義千問還將陸續(xù)嵌入阿里電商、搜索、導(dǎo)航、文娛等場景。比如在網(wǎng)購場景,用戶如果想開生日party,通義千問可以幫助生成生日活動方案和購物清單。
以云為基礎(chǔ)設(shè)施幫助每個企業(yè)打造自己的GPT
“未來所有軟件都值得接入大模型升級改造,我們將開放通義千問的能力,為每一家企業(yè)打造自己的專屬GPT,歡迎所有人用阿里云開發(fā)自己的大模型。”周靖人表示,阿里云將提供完備的算力和大模型基礎(chǔ)設(shè)施,讓包括創(chuàng)業(yè)公司在內(nèi)的所有企業(yè)和機(jī)構(gòu)更好地實(shí)現(xiàn)創(chuàng)新,讓中國整體的 AI 能力有全方位的提升。
周靖人介紹,未來每一個企業(yè)在阿里云上既可以調(diào)用通義千問的全部能力,也可以結(jié)合企業(yè)自己的行業(yè)知識和應(yīng)用場景,訓(xùn)練自己的企業(yè)大模型。比如,每個企業(yè)都可以有自己的智能客服、智能導(dǎo)購、智能語音助手、文案助手、AI設(shè)計師、自動駕駛模型等。
發(fā)布會當(dāng)天,阿里云宣布將與OPPO安第斯智能云聯(lián)合打造OPPO大模型基礎(chǔ)設(shè)施,基于通義千問完成大模型的持續(xù)學(xué)習(xí)、精調(diào)及前端提示工程,未來建設(shè)服務(wù)于其海量終端用戶的AI服務(wù)。同時,吉利汽車、智己汽車、奇瑞新能源、毫末智行、太古可口可樂、波司登、掌閱科技等多家企業(yè)表示,將與阿里云在大模型相關(guān)場景展開技術(shù)合作的探索和共創(chuàng)。
除了開放自研的通義千問大模型外,阿里云也在積極建設(shè)開源的AI社區(qū)生態(tài)。去年11月,阿里云正式提出“Model as a Service”理念,并推出國內(nèi)首個AI模型社區(qū)“魔搭”,開發(fā)者可以在魔搭上下載各類開源AI模型,并直接調(diào)用阿里云的算力和一站式的AI大模型訓(xùn)練及推理平臺。發(fā)布不到半年,“魔搭”社區(qū)總用戶量已超100萬,模型總下載量超1600萬次,成為國內(nèi)規(guī)模最大的AI模型社區(qū)。
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團(tuán)隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊通過對比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓(xùn)練效率,已在多個任務(wù)上驗(yàn)證有效性。