作為全球消費(fèi)電子巨頭,蘋果早在去年就被曝出,將進(jìn)入機(jī)器人領(lǐng)域。
當(dāng)時(shí)外媒報(bào)道稱,蘋果正在開發(fā)一款桌面機(jī)器人,該設(shè)備整合了一個(gè)類似iPad的顯示屏和一個(gè)機(jī)械臂,以及蘋果的人工智能技術(shù),顯示屏可以360°旋轉(zhuǎn),并可作為家庭控制中心。
這一項(xiàng)目的負(fù)責(zé)人據(jù)稱是蘋果此前負(fù)責(zé)自動(dòng)駕駛汽車項(xiàng)目的技術(shù)副總裁的Kevin Lynch,它也負(fù)責(zé)過蘋果Apple Watch項(xiàng)目。
如今,這個(gè)桌面機(jī)器人相關(guān)項(xiàng)目資料以研究論文的形式對(duì)外曝光。
臺(tái)燈機(jī)器人,讓皮克斯照進(jìn)現(xiàn)實(shí)
1985年,蘋果傳奇創(chuàng)始人喬布斯被董事會(huì)和他親自請(qǐng)來的CEO斯卡利趕出了自己一手創(chuàng)辦的公司蘋果,不過,在這一年,對(duì)計(jì)算機(jī)圖形學(xué)有濃厚興趣的喬布斯花1000萬美元投資了盧卡斯影業(yè)的電腦部門。
獨(dú)立后的盧卡斯影業(yè)電腦部門有了一個(gè)在后來為眾人熟知的名字,皮克斯(Pixar)。
雖然喬布斯投資皮克斯出于對(duì)于皮克斯的電腦和軟件設(shè)計(jì)能力看好,但同樣有著他對(duì)設(shè)計(jì)藝術(shù)的個(gè)人情懷。
在喬布斯與皮克斯正式達(dá)成投資協(xié)議的1986年,為了展示皮克斯的硬件和軟件,以推動(dòng)電腦和圖像渲染軟件的商業(yè)化,喬布斯和新成立的皮克斯團(tuán)隊(duì)決定制作一部動(dòng)畫短片,參加這一年的SIGGRAPH大會(huì)。
這部短片就是《頑皮跳跳燈》(Luxo Jr.),這部僅有兩分鐘的動(dòng)畫,在1986年SIGGRAPH大會(huì)上火爆全場,并在當(dāng)年獲得了奧斯卡獎(jiǎng)項(xiàng)提名。
時(shí)隔四十年后,當(dāng)蘋果決定進(jìn)入機(jī)器人領(lǐng)域時(shí),第一款闖入大眾視野的,很可能也正是以當(dāng)年這款跳跳燈為原型的機(jī)器人,一款看上去不那么像機(jī)器人的機(jī)器人。
這款機(jī)器人出現(xiàn)在近日蘋果機(jī)器學(xué)習(xí)研究團(tuán)隊(duì)的對(duì)外公開的研究論文中。
在這篇論文中,蘋果機(jī)器學(xué)習(xí)研究團(tuán)隊(duì)展示出的這款臺(tái)燈機(jī)器人,可以通過語音、手勢控制,還富有情感表達(dá)和更多AI功能。
例如,它會(huì)通過點(diǎn)頭、搖頭動(dòng)作表示對(duì)你的觀點(diǎn)的贊同或不贊同,通過不同運(yùn)動(dòng)路徑向你表達(dá)它自己的情感。
又如,它還具備投影功能,通過攝像頭陪伴孩子寫作業(yè),并通過投影的圖像和語音功能,為孩子輔導(dǎo)作業(yè)、批改作業(yè),乃至一起畫畫本。
在你晚上口渴想喝水時(shí),它還會(huì)打開燈,通過自己的照明軌跡告訴你水杯在哪里,喝完水你要把水杯放到桌上,它也會(huì)跟隨你的水杯運(yùn)動(dòng)軌跡,給你提供更好的照明體驗(yàn)。
當(dāng)你問它“今天天氣怎么樣”時(shí),它會(huì)先看向窗外,然后告訴你今天的天氣狀況。
更為神奇的是,當(dāng)你在桌前閱讀時(shí),它還會(huì)通過將水杯推向你面前,提醒你,你該喝水了。
從蘋果機(jī)器學(xué)習(xí)研究團(tuán)隊(duì)公布的4分鐘演示視頻中來看,它已經(jīng)不僅僅是一個(gè)桌面臺(tái)燈,更像是一個(gè)活潑可愛的小精靈,更富有陪伴屬性。
與此同時(shí),我們發(fā)現(xiàn),這次,蘋果也在盡可能多得將大模型技術(shù)應(yīng)用的機(jī)器人中,它甚至可以為你提供一些專業(yè)指導(dǎo)和建議。
例如,當(dāng)你在維修一個(gè)設(shè)備卻一直沒有頭緒時(shí),你的臺(tái)燈可以直接為通過它的投影儀投射出正確的設(shè)備修理教程。
這就是蘋果近日公布的臺(tái)燈機(jī)器人研究項(xiàng)目。
蘋果押注家用機(jī)器人
蘋果上一個(gè)和機(jī)器人稍微沾點(diǎn)邊的產(chǎn)品,還是在WWDC 2017上發(fā)布的智能音箱HomePod,這一年,智能音箱百箱大戰(zhàn),一度被視為人工智能技術(shù)的絕佳載體,也被視為智能家居絕佳的入口級(jí)設(shè)備。
不過,當(dāng)時(shí)的蘋果依舊晚了一步,在亞馬遜和谷歌占據(jù)美國智能音箱主導(dǎo)地位時(shí),蘋果的HomePod在上市后的第一年,2018年,僅僅在美國市場拿下了6%的市場份額。
這次押注機(jī)器人是蘋果繼放棄造車、加碼Vision Pro后的又一個(gè)重大決策,據(jù)外媒透露,由Kevin Lynch領(lǐng)導(dǎo)的機(jī)器人團(tuán)隊(duì)于2025年8月成立,并在全球范圍內(nèi)招聘機(jī)器人領(lǐng)域?qū)<摇?/p>
據(jù)外媒Appleinsider的近日?qǐng)?bào)道,蘋果目前正在招聘更多機(jī)器人專家,旨在推進(jìn)家用機(jī)器人領(lǐng)域的產(chǎn)品研發(fā)。
好文章,需要你的鼓勵(lì)
新加坡國立大學(xué)研究團(tuán)隊(duì)開發(fā)了SPIRAL框架,通過讓AI與自己對(duì)弈零和游戲來提升推理能力。實(shí)驗(yàn)顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟(jì)大學(xué)團(tuán)隊(duì)開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機(jī)噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實(shí)現(xiàn)37.9%的精度提升,并在真實(shí)設(shè)備上展現(xiàn)出色泛化能力,為機(jī)器人、AR和自動(dòng)駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團(tuán)隊(duì)通過對(duì)比實(shí)驗(yàn)發(fā)現(xiàn),經(jīng)過強(qiáng)化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時(shí)刻"現(xiàn)象,但這些自我糾錯(cuò)行為并不能實(shí)際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗(yàn)證差距",即生成答案的能力強(qiáng)于驗(yàn)證答案質(zhì)量的能力,且模型在自我驗(yàn)證時(shí)無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機(jī)構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動(dòng)態(tài)稀疏性實(shí)現(xiàn)大語言模型訓(xùn)練加速1.6倍,計(jì)算成本降低2.2倍。該方法使用SVD稀疏性估計(jì)器智能選擇重要計(jì)算部分,在保持模型性能的同時(shí)顯著提升訓(xùn)練效率,已在多個(gè)任務(wù)上驗(yàn)證有效性。
關(guān)注智造、硬件、機(jī)器人。