在宇樹(shù)人形機(jī)器人登上春晚跳起東北二人轉(zhuǎn)時(shí),仿佛就注定了人形機(jī)器人在2025年仍將繼續(xù)橫掃全球市場(chǎng)。
這不,剛過(guò)完春節(jié),美國(guó)人形機(jī)器人明星企業(yè)Figure AI就官宣要和OpenAI“鬧分手”,緊接著是波士頓動(dòng)力與前CEO成立的研究院再“牽手”。
當(dāng)然,馬斯克也沒(méi)閑著,他則是在加緊為特斯拉招兵買馬,為人形機(jī)器人量產(chǎn)做準(zhǔn)備。
“機(jī)器人公司應(yīng)該自己做模型”
作為美國(guó)最具名氣的人形機(jī)器人公司之一,成立于2022年的Figure AI如今已經(jīng)是估值26億美元(189億元)的準(zhǔn)獨(dú)角獸企業(yè)。
據(jù)公開(kāi)信息顯示,在2024年年初的融資中,OpenAI與微軟、英偉達(dá)等科技巨頭和投資機(jī)構(gòu)一同為Figure AI提供了B輪6.75億美元的融資。
Figure AI在美國(guó)追捧程度由此也可見(jiàn)一斑。
作為Figure AI研發(fā)的人形機(jī)器人產(chǎn)品,F(xiàn)igure 01曾在2024年3月搭載OpenAI大模型對(duì)外進(jìn)行demo演示,彼時(shí)這一可以通過(guò)語(yǔ)音控制收拾杯盤、整理桌面的人形機(jī)器人demo視頻一經(jīng)放出,在全球范圍內(nèi)引起廣泛關(guān)注。
隨后,F(xiàn)igure AI不僅官宣了與寶馬汽車工廠的試點(diǎn)合作,還宣布了第二代人形機(jī)器人Figure 02將使用 OpenAI 模型進(jìn)行自然語(yǔ)言交流。
不過(guò),F(xiàn)igure AI團(tuán)隊(duì)最近有了新的想法。
Figure AI創(chuàng)始人Brett Adcock在接受外媒采訪時(shí)稱,“我們發(fā)現(xiàn),要想在現(xiàn)實(shí)世界中解決人形機(jī)器人的具身智能問(wèn)題,就必須自己做人工智能技術(shù)研發(fā),我們不能外包人工智能就像我們無(wú)法外包硬件一樣。”
為此,Brett Adcock也宣布了與OpenAI的“分手”,宣布放棄使用OpenAI的大模型。
與此同時(shí),Adcock在其社交媒體平臺(tái)上還表示,F(xiàn)igure AI在端到端機(jī)器人AI上已經(jīng)有了重大突破,將會(huì)在接下來(lái)30天里展示一些人們?cè)谌诵螜C(jī)器人上未曾實(shí)現(xiàn)的能力。
這算是Brett Adcock為我們埋下了一個(gè)彩蛋,不過(guò),努力在將人工智能技術(shù)融入人形機(jī)器人的不僅有Figure AI,幾乎所有人形機(jī)器人團(tuán)隊(duì)都在將人工智能作為一個(gè)重要的技術(shù)研發(fā)方向。
這其中自然也包括美國(guó)老牌機(jī)器人明星團(tuán)隊(duì)波士頓動(dòng)力。
波士頓動(dòng)力為機(jī)器人注入AI
波士頓動(dòng)力是美國(guó)老牌機(jī)器人團(tuán)隊(duì),早在1992年由麻省理工學(xué)院脫胎,創(chuàng)始團(tuán)隊(duì)也是由Marc Raibert拉起的一支麻省理工科班團(tuán)隊(duì)。
波士頓動(dòng)力早年間因各種機(jī)器人demo視頻在YouTube上走紅,因而也一直被視為機(jī)器人界的網(wǎng)紅,不過(guò),由于波士頓動(dòng)力的機(jī)器人產(chǎn)品遲遲難以量產(chǎn)商用,在團(tuán)隊(duì)成立后的幾年里被幾經(jīng)轉(zhuǎn)手,先后被谷歌、軟銀、現(xiàn)代汽車收購(gòu)。
在2021年6月正式被現(xiàn)代汽車收購(gòu)時(shí),波士頓動(dòng)力創(chuàng)始人兼CEO Marc Raibert已經(jīng)卸任離職,并在2022年8月創(chuàng)立了波士頓動(dòng)力人工智能研究所,這一研究院后更名為機(jī)器人與人工智能研究所(RAI Institute),這一研究所的目標(biāo)正是為波士頓動(dòng)力機(jī)器人做基礎(chǔ)技術(shù)研究,人工智能自然也是其中的重中之重。
就在被現(xiàn)代汽車收購(gòu)后不久,全球迎來(lái)了人形機(jī)器人浪潮,在這波浪潮中,波士頓動(dòng)力于2024年官宣轉(zhuǎn)向電驅(qū),并發(fā)布了電驅(qū)版的Atlas。
近日,波士頓動(dòng)力官宣了一項(xiàng)與其前CEO Marc Raibert創(chuàng)辦的RAI研究所的合作,這項(xiàng)合作旨在為電驅(qū)版Atlas人形機(jī)器人建立強(qiáng)化學(xué)習(xí)訓(xùn)練的共享機(jī)制,提升電驅(qū)版Atlas在動(dòng)態(tài)環(huán)境中的移動(dòng)操控能力。
Marc Raibert在官方聲明中指出,“RAI的目標(biāo)是開(kāi)發(fā)支持未來(lái)智能機(jī)器的技術(shù),與波士頓動(dòng)力合作開(kāi)發(fā)Atlas使我們能夠在最先進(jìn)的人形機(jī)器人上取得強(qiáng)化學(xué)習(xí)方面的進(jìn)展,這項(xiàng)工作將在提升人形機(jī)器人的能力方面發(fā)揮關(guān)鍵作用,不僅可以擴(kuò)展其技能,還可以簡(jiǎn)化獲得新技能的過(guò)程。”
更關(guān)注機(jī)器人技術(shù)研究的Marc Raibert,正在通過(guò)人工智能技術(shù)支持波士頓動(dòng)力機(jī)器人走向商業(yè)市場(chǎng),不過(guò),要說(shuō)人形機(jī)器人的商業(yè)化,還要看更為激進(jìn)的馬斯克。
特斯拉Optimus年內(nèi)要量產(chǎn)萬(wàn)臺(tái)
馬斯克最近也沒(méi)閑著。
在1月30日的特斯拉2024年Q4業(yè)績(jī)會(huì)上,馬斯克透露,特斯拉人形機(jī)器人Optimus生產(chǎn)線月產(chǎn)能已經(jīng)達(dá)到1000臺(tái),明年將建設(shè)的第二條生產(chǎn)線月產(chǎn)能將會(huì)達(dá)到10000臺(tái)。
他還指出,預(yù)計(jì)今年Optimus將在特斯拉內(nèi)部投入使用,負(fù)責(zé)完成工廠中最無(wú)聊、最討厭的一系列工作,明年下半年將會(huì)面向其他公司交付產(chǎn)品。
為了加緊人形機(jī)器人產(chǎn)品量產(chǎn)并在特斯拉工廠中得以應(yīng)用,特斯拉也在緊急招聘相關(guān)工程師,據(jù)官方掛在招聘網(wǎng)站上的信息顯示,特斯拉目前正在為機(jī)器人團(tuán)隊(duì)招聘工程師、流程主管、產(chǎn)品經(jīng)理等十多個(gè)崗位。
馬斯克是這波人形機(jī)器人浪潮的關(guān)鍵人物,始終對(duì)人形機(jī)器人未來(lái)前景保持著樂(lè)觀的態(tài)度,在Q4的業(yè)績(jī)會(huì)上,他還公開(kāi)了特斯拉2025年10000臺(tái)機(jī)器人量產(chǎn)目標(biāo),并指出,未來(lái)隨著Optimus年產(chǎn)量趨穩(wěn)(年產(chǎn)量達(dá)到100萬(wàn)臺(tái)以上),Optimus生產(chǎn)成本將會(huì)低于2萬(wàn)美元。
好文章,需要你的鼓勵(lì)
這項(xiàng)研究利用大語(yǔ)言模型解決科學(xué)新穎性檢測(cè)難題,南洋理工大學(xué)團(tuán)隊(duì)創(chuàng)新性地構(gòu)建了閉合領(lǐng)域數(shù)據(jù)集并提出知識(shí)蒸餾框架,訓(xùn)練輕量級(jí)檢索器捕捉想法層面相似性而非表面文本相似性。實(shí)驗(yàn)表明,該方法在市場(chǎng)營(yíng)銷和NLP領(lǐng)域顯著優(yōu)于現(xiàn)有技術(shù),為加速科學(xué)創(chuàng)新提供了有力工具。
un?CLIP是一項(xiàng)創(chuàng)新研究,通過(guò)巧妙反轉(zhuǎn)unCLIP生成模型來(lái)增強(qiáng)CLIP的視覺(jué)細(xì)節(jié)捕捉能力。中國(guó)科學(xué)院研究團(tuán)隊(duì)發(fā)現(xiàn),雖然CLIP在全局圖像理解方面表現(xiàn)出色,但在捕捉細(xì)節(jié)時(shí)存在不足。他們的方法利用unCLIP生成模型的視覺(jué)細(xì)節(jié)表示能力,同時(shí)保持與CLIP原始文本編碼器的語(yǔ)義對(duì)齊。實(shí)驗(yàn)結(jié)果表明,un?CLIP在MMVP-VLM基準(zhǔn)、開(kāi)放詞匯語(yǔ)義分割和視覺(jué)中心的多模態(tài)任務(wù)上顯著優(yōu)于原始CLIP和現(xiàn)有改進(jìn)方法,為視覺(jué)-語(yǔ)言模型的發(fā)展提供了新思路。
這項(xiàng)研究介紹了RPEval,一個(gè)專為評(píng)估大語(yǔ)言模型角色扮演能力而設(shè)計(jì)的新基準(zhǔn)。研究團(tuán)隊(duì)從法國(guó)里爾大學(xué)開(kāi)發(fā)的這一工具專注于四個(gè)關(guān)鍵維度:情感理解、決策制定、道德對(duì)齊和角色一致性,通過(guò)單輪交互實(shí)現(xiàn)全自動(dòng)評(píng)估。研究結(jié)果顯示Gemini-1.5-Pro在總體表現(xiàn)上領(lǐng)先,而GPT-4o雖在決策方面表現(xiàn)出色,但在角色一致性上存在明顯不足。這一基準(zhǔn)為研究人員提供了一個(gè)可靠、可重復(fù)的方法來(lái)評(píng)估和改進(jìn)大語(yǔ)言模型的角色扮演能力。
這篇論文介紹了LegalSearchLM,一種創(chuàng)新的法律案例檢索方法,將檢索任務(wù)重新定義為法律要素生成。研究團(tuán)隊(duì)構(gòu)建了LEGAR BENCH數(shù)據(jù)集,涵蓋411種犯罪類型和120萬(wàn)案例,并開(kāi)發(fā)了能直接生成關(guān)鍵法律要素的檢索模型。實(shí)驗(yàn)表明,該模型在準(zhǔn)確率上超越傳統(tǒng)方法6-20%,且在未見(jiàn)犯罪類型上展現(xiàn)出強(qiáng)大泛化能力。這一突破為法律專業(yè)人士提供了更高效、精準(zhǔn)的案例檢索工具。
關(guān)注智造、硬件、機(jī)器人。