沒人敢拍著胸脯預測下一臺機器人什么時候會出現(xiàn)在自己身邊,我們接觸到的機器人往往是直接被運到園區(qū)里。機器人的形態(tài)也是五花八門,有踩著六個輪子的、有像冰柜大小的盒子、有的頭上還插著一桿小黃旗。它們使用攝像頭、雷達和超聲波傳感器在園區(qū)周邊的人行道上行進,為學生們服務、送外賣等等。不談具體效果,至少大家在第一次看到機器人來到身邊時都感到相當驚奇,也因此鬧出不少有趣的小故事。
于是,人們開始樂此不疲地傳播這些小故事,還總要帶上一點表演性質的夸張與演繹。有些人抱怨,覺得這些機器占用了自行車道,絲毫不理解社會規(guī)范:它們不會給行人讓路,在超車道上緩慢前進、嚴重阻礙交通。有天早上,我的一個朋友甚至直接把自行車橫在了機器人面前,想逼著它繞路前進。但它好像根本沒看見,徑直撞了過去。另一個朋友則發(fā)現(xiàn),一臺機器人被無助地困在自行車鎖車桿上。這臺機器很重,她最后叫了路人,才一起幫它脫了困。
,年齡是18歲,職業(yè)是配送小哥,性取向為無X機器人。
大約在同一時期,自動機器人在全國各地快速涌現(xiàn)。雜貨店使用它們巡邏過道、收拾掉在地上的貨品并清理垃圾。沃爾瑪也在超市里使用機器人,持續(xù)掃描哪些貨品需要盡快補充?!都~約時報》的一篇報道提到,不少人類同事會給這些機器人起綽號,甚至貼上名牌。其中一臺機器人還擁有自己的生日聚會。此類報道往往會以戲謔的口吻把這類事例描述成人畜無害的“輕微惡趣味”,但這樣的輿論導向已經在公共政策層面有所顯現(xiàn)。2017年,歐洲議會提議將機器人視為“電子人”,并認為某些形式的人工智能已經足夠復雜、可以被視為具有行為能力的代理者。在嚴肅的法條背景下出現(xiàn)這樣的理解,不禁讓我們回想起古老的“萬物有靈”理論。有些文明認為樹木、巖石、管道甚至是水壺這些無生命的物體,實際上都是具有“非人性質”的“人”。
》:
(越快越好?。?/span>
在一塊電子草地上
哺乳動物和電腦
共同生活在一起
和諧地編程
如水般純凈
觸碰清澈的天空”
Brautigan是在舊金山反主流文化的中心Summer of Love期間創(chuàng)作出這些詩句的,當時他是加州理工學院的常駐詩人。這首詩的后文詳盡描述了這片由“控制論森林”與花朵般的計算機組成的迷人景觀。在這個世界里,數字技術將我們與“我們的哺乳動物家人們”團聚在一起,最終實現(xiàn)了人、獸、機器的真正平等。這部作品喚起了西海岸烏托邦主義的特殊分支,讓人想到回歸土地運動與Stewart Brand的《全球目錄》——其中設想了美國工業(yè)綜合體中的各類工具被重新利用,進而建立起一個更公平、更具生態(tài)可持續(xù)性的世界。它想象技術將我們帶回一個更為原始的時代,一個前現(xiàn)代、甚至是前基督教的歷史時期,人類在這里與自然和諧相處、非生物體沉迷在美妙的生命當中。
技術應可幫助我們恢復那曾經被技術毀滅掉的美妙世界。也許那令我們被從伊甸園中流放出去的力量,有朝一日,會以數字生活的形式助我們重歸樂園。
Jane Bennett等后人類理論家的作品中也有類似的思想延伸,她想象,數字技術會重新配置我們對于“死亡物”的現(xiàn)代式理解,并復興起另外一種更為古老的世界觀,即“其中的物質具有活力、彈性、不可預測性或者頑固性,這本身對我們來說就是一種奇跡的源泉。”
Brautigan詩中的每一節(jié)都以“我常常期盼”起始,而其內容與其說是詩意的表達,不如說是一種訴諸神秘的祈求。這種對未來的愿景,也許只是另一種毫不稀奇的虛無希冀,但從歷史對稱性的角度看,又似乎堪稱令人信服的預判。技術應可幫助我們恢復那曾經被技術毀滅掉的美妙世界,這話說得相當到位。也許那令我們被從伊甸園中流放出去的力量,有朝一日會以數字生活的形式助我們重歸樂園——而通往樂園的道路,正在我們腳下筆直延展。
配圖|AARON DENTON
在機器人來到身邊之前,我就常常想起B(yǎng)rautigan的詩。就在那年初,我受邀參加了一次名為“書寫非人類”的小組討論,談的是“人類世期間,人類、自然與技術之間的關系”。
結果就是,這類機器在最抽象的智力形式上表現(xiàn)出色——微積分、國際象棋紛紛被降服。但在小孩們都能輕松通過的項目中,包括語音、視覺、區(qū)分杯子和鉛筆等,機器卻是一敗涂地。而在嘗試給機器智能加上身體并教導它與周邊環(huán)境互動時,它們的動作極其緩慢、笨拙,每一次行動都需要調用內部構建的、遠遠稱不上完善的那套現(xiàn)實認識模型。
這些簡單的機器人能夠自行建立能力,直至進化與人類智能高度相似的產物。
配圖|AARON DENTON
——由“單細胞生物”發(fā)展為更復雜的“多細胞生物”,Brooks認為這種策略會更有效?!赋橄笏季S」是人類進化后期的發(fā)展產物,也并不像我們想象中那么重要;早在我們能夠求解微分方程之前,我們的祖先就已經學會了在環(huán)境中行走、進食和移動。Brooks很快意識到,他的昆蟲機器人確實能在沒有中央處理系統(tǒng)的前提下完成這些任務,于是他決定著手創(chuàng)造一臺人形機器人。這臺機器是個沒腿的軀干,但整個上半身卻與人類高度相似——包含頭部、頸部、肩膀和手臂。他將這臺機器人命名為Cog,給它配備了20多個驅動關節(jié),再加上用于區(qū)分聲音、顏色和運動的麥克風與傳感器。它的每只眼睛裝有兩個攝像頭,視線可以快速切換以模擬人眼的工作方式。而且與昆蟲機器人一樣,Cog同樣不設中央控制系統(tǒng),而是通過一系列基本驅動條件進行編程。其中的想法是,Cog應該可以通過社交互動在學習算法的幫助下發(fā)展出更復雜的行為,甚至有可能學會說話。
在Brooks及其團隊的多年研究之下,Cog取得了一系列輝煌的戰(zhàn)績。它學會了識別人臉,并與人類進行眼神交流。它可以投球、接球、指向目標,甚至會玩玩具彈簧。
在研究團隊演奏搖滾樂時,Cog還能在軍鼓上敲上不錯的節(jié)奏。有時候,這臺機器人還會表現(xiàn)出一點“急智”——它的新動作似乎確實是從日常行為中自發(fā)進化而來。有一天,Brooks帶的一名在讀研究生Cynthia Breazeal搖晃著一塊白板擦,Cog伸手摸了摸。Breazeal被逗笑了,于是又重復了一遍;而Cog再次去摸板擦,就好像這是一種小游戲。Brooks驚呆了,機器人似乎意識到了輪流行動的含義,而這絕對是人為編程中從未涉及過的。Breazeal也參與了設計工作,所以她也清楚Cog的行為意味著什么。正如Brooks所說,“Cog有時候會做出超出當前狀況的行動。”學生們不對Cog設限,Cog也回報以超出預期的反應。“至少目前來看,Cog確實能夠表現(xiàn)出比其最初設計更高的行為水平。”
正如Brooks所說,“思想和意識無法被編入程序,它們只會自行涌現(xiàn)。”
這聽起來是在胡說八道,但一切創(chuàng)造性的事業(yè)在某種程度上都植根于創(chuàng)造者眼中仍然神秘難測的特定過程。藝術家們早就意識到這是一項難以捉摸的工作,他們也想盡辦法體會那股似乎來自本體之外的宏大力量。哲學家Gillian Rose曾將寫作活動描述為“紀律與奇跡的結合,即使紙上的內容完全來自我們無法掌控的領域,它也應該允許我們掌控一切。”我在自己的工作中也經常遇到這種奇怪的現(xiàn)象。我總是帶著愿景跟計劃坐在辦公桌前,但經常有那么一瞬間,手頭的工作會自己動起來、引導著我為它制定規(guī)則。這些話語、內容似乎有自己的生命,以至于我在完成之后也很難解釋這一切是怎么做到的。作家們也常常帶著驚奇與敬畏來討論這樣的經歷,而我自己更多是對此保持警惕。我不知道對于藝術家或者其他創(chuàng)造者來說,這種具有強烈“越界感”的體驗到底是不是好事。即使其中介入的只是物理定律或者是某些無意識機制,但正如Rose所言,“如果引發(fā)之力來自無法控制的領域”,創(chuàng)造者又如何判斷自己的作品到底是在趨近預設目標、還是在偏航的道路上越走越遠?
。”
一天,我從圖書館出來走上回家的路。當時是傍晚,下午最后一節(jié)課剛剛結束,人行道上擠滿了學生。我和其他幾十個人一起等著穿過主干道——這是一條繁忙的四車道,把整個校園切割了開來。再往前走還有另外一條人行橫道,而且這里沒有燈。這里的十字路口相當危險,特別是在晚上,總會有學生在最后一秒堪堪避過迎面而來的車流。等待的時候,我發(fā)現(xiàn)很多人的注意力都被吸引到了那邊的人行道上。我順著方向望過去,看到拐角處有一臺送貨機器人,可憐、弱小又無助。它總想過馬路,但每次慢慢駛入人行橫道時都會感受到汽車靠近,于是只能退回安全位置。人群里發(fā)出了關切的低語聲。“你能行!”有人在街對面給它加油。這時候,人行道那邊也有人開始駐足關注事態(tài)發(fā)展。
這時候路上沒車了,機器人再次開始向前挪動。已經到了臨門一腳的緊要關頭,機器人卻仍在試探性地移動。學生們開始大喊:“快,快,快!”神奇的是,機器人仿佛響應了人們的鼓勵,飛快穿過了人行橫道。在成功避過下一波車流、抵達街道另一邊時,整個人群爆發(fā)出歡呼聲。有人呼喊著機器人是他的英雄,正道的光也照在了大地上。輪到人們過街時,大家仍然興高采烈、有說有笑。這時候我注意到年輕的人潮中有個跟我年齡相仿的女性,她捂著脖子上的圍巾、神色愕然??吹贸鰜恚軗哪莻€小家伙。
也許機器人做出的最怪異、最令人無法理解的行為,才是它們叩響人類智能大門的真實證據。
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數學推理能力提升8.6%,通用推理提升8.4%,且無需任何數學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉移到數學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術通過融合多幀圖像的"圖結構"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術利用圖像間的不變幾何關系,結合深度學習和數學優(yōu)化方法,在合成數據集上實現(xiàn)37.9%的精度提升,并在真實設備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構聯(lián)合提出SparseLoRA技術,通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務上驗證有效性。