作者:周雅
城頭變幻大王旗,在大模型的領(lǐng)地,AI Agent幾乎是當前最熱的話題。
AI Agent火爆到什么程度?不久前“軟件巨人”微軟創(chuàng)始人比爾·蓋茨在一篇名為《AI將徹底改變你使用計算機的方式》的博文中公開斷言:
「未來5年內(nèi)將進入AI Agent時代,它將改變?nèi)伺c計算機的交互方式,將顛覆軟件行業(yè),引領(lǐng)人類從“鍵入命令”到“點擊圖標”以來計算機領(lǐng)域最大的革命。」
還有一項發(fā)人深省的“AI Agent”實驗來自斯坦福和谷歌,該實驗模擬了一個“西部世界”,在這個世界里,預裝了25個AI Agent,每個智能體的行為方式與人類很像,比如起床后做早餐再去上班,藝術(shù)家作畫,作家寫作。他們參與對話并發(fā)表觀點、建立浪漫關(guān)系、擁有長期記憶、還能規(guī)劃未來。
圖片來自斯坦福和谷歌論文《生成代理:人類行為的交互式模擬(Generative Agents: Interactive Simulacra of Human Behavior)》,根據(jù)斯坦福大學研究人員的說法,用戶可以觀察并干預代理計劃他們的日程、分享新聞、建立關(guān)系和協(xié)調(diào)小組活動。
但什么是AI Agent(人工智能體)?
顧名思義,它是一種智能的實體。普通人會理解為《鋼鐵俠》中的Jarvis,而Open AI應(yīng)用研究主管翁麗蓮(Lilian Weng)在個人博客中下了一個定義:
“AI Agent = LLM(大語言模型)+記憶(Memory)+任務(wù)規(guī)劃(Planning)+工具使用(Tool Use)”。有了后三者的能力,大模型就不再只是一個聊天機器人,而是能在更多廣闊的場景中發(fā)揮價值。
隨著“大模型落地難”的聲音甚囂塵上,AI Agent似乎成為玩家們的一道曙光——業(yè)界將其稱之為“大模型的下半場”。
一時間,無論是不差錢的科技大廠,還是敢于冒險的創(chuàng)業(yè)公司,大家火速開啟AI Agent征戰(zhàn)模式。比如OpenAI的“GPT Store”,字節(jié)跳動旗下的“飛書智能伙伴”,昆侖萬維的“天工SkyAgents”,智譜AI的CogAgent模型等。而瀾碼科技就是其中最早加入AI Agent浪潮的“玩家”之一。
瀾碼科技于2023年2月在上海成立,致力于“讓人人都能夠設(shè)計自己的智能體”。為什么選擇做AI Agent?瀾碼科技創(chuàng)始人兼CEO周健的解釋是:傳統(tǒng)的系統(tǒng)是人適應(yīng)機器,造成人成為數(shù)據(jù)的搬運工;今天有了大模型,我們有機會讓機器去適應(yīng)人,在這方面AI Agent前景廣闊。
周健強調(diào):“2023年是大語言模型的元年,2024年將是AI Agent的爆發(fā)年,AI Agent是大模型優(yōu)先落地的最佳形態(tài)。”
不過我們雖然說瀾碼科技是新入局者,但周健對于AI Agent這一觀察,最早可追溯到他在創(chuàng)辦瀾碼之前的兩段從業(yè)經(jīng)歷,這也是直接促成了他創(chuàng)業(yè)濃墨重彩的兩筆。
第一段經(jīng)歷是在AI 1.0時代,周健加入依圖科技成為第10號員工,在那里,他經(jīng)歷了CV(計算機視覺)技術(shù)從不成熟到成熟的完整階段。
在依圖時期,周健坦言自己深刻了解了AI應(yīng)該如何落地:從技術(shù)側(cè),算法怎么做;從應(yīng)用側(cè),產(chǎn)品怎么能端到端讓用戶使用起來。從技術(shù)到應(yīng)用之間,其實有著一個巨大鴻溝。這為后來周健思考讓Agent學習專家知識并落地,埋下了伏筆。
第二段經(jīng)歷是2019年,他在PRA(機器流程自動化)廠商弘璣擔任CTO,聚焦于從自動化的視角提升生產(chǎn)效率,但正所謂沒有一個超級人能夠處理所有的系統(tǒng),也沒有一個超級系統(tǒng)能處理所有的人,在RPA的實操過程中,由于員工缺少專家經(jīng)驗,導致人和系統(tǒng)之間也存在一個巨大鴻溝。
現(xiàn)在回頭看,彌補兩段鴻溝的關(guān)鍵,正是AI Agent。AI Agent由于有大語言模型這個地基,既有了對業(yè)務(wù)的理解能力,又能自主執(zhí)行任務(wù),還能隨著企業(yè)知識庫的持續(xù)更新而持續(xù)迭代。
站在風口,瀾碼科技火速發(fā)布了自己的AI Agent平臺——AskXBOT,該平臺宣稱要“讓專家知識賦能基層業(yè)務(wù)單元”,周健在交流中告訴我,其實最重要的是——讓3萬-5萬月薪的專家把知識賦能8000塊月薪(這里泛指一線城市大學畢業(yè)生的能力水平所對應(yīng)的平均薪資)的員工,使得他們具備1.5萬月薪員工的能力。而更進一步看,瀾碼科技還有一個宏愿——
「未來一定會出現(xiàn)“一人企業(yè)“,這個“人“是廣義的,可能是一個程序員,可能是一個專家,但無論這個人是什么職位,未來“一人企業(yè)“會解決業(yè)務(wù)擴張的資源瓶頸。」
既然走到公認的下半場,在未來市場格局中,競爭也不會少,甚至是劇烈。不過周健坦言,更看重其中的機遇。他說:
“大語言模型本身是一個通用型技術(shù),它的厲害之處在于,大家都能基于大模型的原料,做出各種應(yīng)用佳肴,也就意味著,大家站在同一起跑線上,市場隨時都在重新洗牌。”
周健又用一個經(jīng)典故事回應(yīng)了競爭問題:
“兩個人在森林里遇到了老虎,其中一個人趕緊從背包取下一雙輕便的運動鞋換上,另一個人嘲笑道:‘你干什么呀,再換鞋也跑不過老虎呀!‘這個人回答:‘我只要跑得比你快就好了。‘”
而瀾碼這個命名意指“波瀾壯闊的代碼”,當浪潮來臨,如何沖浪,才是瀾碼要考慮的事情。
01 不要神化大模型,數(shù)據(jù)是企業(yè)主拿捏大模型的核心
科技行者:ChatGPT出現(xiàn)后,相信會有人與你討論大模型,大家問的最多的問題是什么?
周?。?/strong>最多的問題有兩個——大模型能發(fā)展到什么程度?或者是,大模型的邊界到底在哪里?本質(zhì)上都是圍繞AI這根曲線會怎么走的問題。
我接觸到的人普遍都會焦慮,尤其是企業(yè)主,他們基本認為幾年內(nèi),商業(yè)主戰(zhàn)場會變成AI賦能的業(yè)務(wù),但他們又沒有時間轉(zhuǎn)型或缺乏技術(shù)背景,所以擔心會被AI替代。
科技行者:那你當時的回答是?
周?。?/strong>答案有兩個維度。第一個維度是關(guān)于大模型的邊界,大模型或ChatGPT是取了一個“巧”,它通過對話式的UI,讓大家覺得好像它無所不能,但事實上不是。
我一般都會跟他們舉例,計算機科學發(fā)展了70年,難道今天你給我講,過去所有的技術(shù)都不成立了,只需要大模型這一種技術(shù)?這肯定不靠譜。
我還會再跟他們舉例,比如怎么判斷一個人是不是985、211高校畢業(yè)?怎么去做一個發(fā)工資的軟件?這兩件事都不適合用大模型,大模型被設(shè)計的初衷也不在這里,它明顯是有一條邊界,大家其實還沒完全理解這件事。
第二個維度是關(guān)于企業(yè)如何規(guī)劃大模型,大模型本身需要更多的數(shù)據(jù)去拓展,企業(yè)今天還有很多信息沒有被數(shù)字化。哪些數(shù)據(jù)有可能被數(shù)字化,并且被利用起來,那么這些場景就會慢慢被解鎖。但如果沒有,不管模型牽引的參數(shù)是萬億參數(shù),還是宇宙值參數(shù),都沒用,因為已有的算法離開數(shù)據(jù)是搞不定的。
比如員工的行為就還沒有被數(shù)字化,這里“行為”可能是指泛化的,對企業(yè)來講,它本身有業(yè)務(wù)流程的上下文,或者企業(yè)本身經(jīng)營的上下文,有了上下文,員工的行為數(shù)字化之后,就能夠更好地被利用起來。
至少按照現(xiàn)在已知的AI技術(shù),機器學習、深度學習,它的模式需要大數(shù)據(jù),所以這部分是未來潛力,又是企業(yè)主“能掌控”或是“能意識到大模型發(fā)展的進度條”的核心。
科技行者:如果說有人不完全理解這件事,那么關(guān)于大模型你聽到的最大誤解是什么?
周健:有人或許把大模型等同于AGI。我同意大模型的出現(xiàn)很讓人出于意料的,我自己也有這一認知框架的階段,可以理解,但不要把大模型當成了大腦,當成了神域,拒絕自己思考,必須得問神,在神的指導下才能去做,這就讓我覺得以往的知識是白學了,這是很大的誤解。
科技行者:當然,也有很多企業(yè)走過了認知框架階段,到了實踐階段,大家都發(fā)布了自己的“大模型”,雖然有些是根據(jù)Meta的羊駝模型改的,瀾碼為什么不趕這個潮流?
周?。?/strong>這關(guān)乎我們的定位,我們一開始就知道有兩個定位——技術(shù)和應(yīng)用,但對于創(chuàng)業(yè)公司來講,剛起步時不可能兩個定位都占。
瀾碼作為一家創(chuàng)業(yè)公司,還是遵循需求為王。從需求角度看,我們一開始定位就是貼著人的、貼著業(yè)務(wù)和用戶的。如果未來人機交互被革命掉了,那么整個軟件行業(yè)就沒剩多少軟件能跟人互動,瀾碼雖然現(xiàn)在還是一家創(chuàng)業(yè)公司,但我希望我們拿到“人與AI交互”的機會,所以這是定位問題。
定位拆解完之后,有很多工作要做。我曾經(jīng)也在想,如果預訓練大模型,未來應(yīng)該做一個什么大模型,但從優(yōu)先順序看,起碼不是現(xiàn)在該考慮的事。
其次,無論是從技術(shù)還是資本的角度,大模型本身很重要的是數(shù)據(jù)集,瀾碼還沒有積累一個自己獨特的數(shù)據(jù)集。此時此刻,我去預訓練一個大模型的商業(yè)競爭優(yōu)勢幾乎為零,所以我暫時不愿意分心去做大模型。
02 專家知識的數(shù)字化,是Agent落地的必要條件
科技行者:瀾碼做AI Agent的初衷是什么?
周?。?/strong>是基于客戶需求。我們接觸到的客戶,不管是大型央國企、還是銀行保險、或是中等民企、甚至一些小型企業(yè),都有同樣的困擾——模型怎么那么貴?算力也非常貴。
今天中國100多家大模型公司,一年時間顯卡價格翻了一倍,我們到底要做哪些準備?如何讓大模型在企業(yè)中被用起來,去實際發(fā)揮業(yè)務(wù)價值?這就是瀾碼的業(yè)務(wù)邏輯——幫大家去解決問題。
在這個需求點上,我們發(fā)現(xiàn)國家電網(wǎng)、南方航空、國家管網(wǎng)、長江電力、中廣核等好多“中”字頭企業(yè)都有這個訴求,要入局,希望業(yè)務(wù)中有大模型。
所以我們的定位就是要做“大模型落地的首選廠商”,AI Agent是我們的切入機會。
科技行者:這存在一個先有雞還是先有蛋的問題,是你們先看到央國企的需求,還是先有了AI Agent戰(zhàn)略?
周?。?/strong>我們先有AI Agent的戰(zhàn)略。
科技行者:那就存在教育市場的情況了,另外你們是怎么讓Agent平臺自身更快落地的?
周?。?/strong>首先我們對平臺的能力有預判,一定要找到相應(yīng)的場景,比如教育行業(yè)的評測場景,包括對話式的、政策解答等,也相當于找到了標桿客戶,而且我們本來就有一些顧問是了解這個行業(yè)的。
這樣一來,就會比市場上“聲稱要做AI Agent的廠商”明顯更有穿透力些,從客戶有興趣,到他想要買,有加速轉(zhuǎn)換的過程。隨著標桿客戶的Agent做出來之后,我們的平臺越來越成熟,就會吸引更多客戶,就是這么一個順序。
科技行者:或許在這個過程中會有人質(zhì)疑,AI Agent跟RPA有什么區(qū)別,可能我剛用上RPA還沒完全普及呢,現(xiàn)在又出來了AI Agent,況且還存在一個遷移的問題,導致我會不會淪為技術(shù)的小白鼠了?
周?。?/strong>我先講一個企業(yè)內(nèi)部的常見現(xiàn)象——信息化也好,數(shù)字化也好,企業(yè)發(fā)展過程中造成了大量的煙囪式系統(tǒng),生產(chǎn)力受到了嚴重束縛。
RPA(機器人流程自動化),是通過UI自動化的辦法去操作各種系統(tǒng),它能夠通過低代碼把那些組件“拖、拉、拽”,把對不同系統(tǒng)的操作連接起來,形成一個可以被自動化的操作流程,其實更多是在做操作流程的自動化。
但RPA最大的問題是,對于所操作的數(shù)據(jù)或內(nèi)容,是無感知的、不理解的、也無法推理。舉個例子,一個財報,它在配置時說“第五行是收入”,如果說“第六行轉(zhuǎn)成收入”,即使你寫了“第五行換成第六行”,它還是不能理解。
AI Agent疊加上去的就是大模型的語言理解和推理能力,有了大模型,使得系統(tǒng)可以應(yīng)用大量知識和真實世界的環(huán)境數(shù)據(jù),如政策網(wǎng)站、股票實時信息、天氣信息等,我們可以更好的把這些能力封裝起來。
能力疊加之后,AI Agent可以作為一個連接器,連接管理者和基礎(chǔ)員工、專家和基礎(chǔ)員工、員工和員工,而且只要加算力,它就能夠復制,它一天不止24小時,有30塊顯卡,它就有720小時,多一個維度來填充企業(yè)想做數(shù)字化轉(zhuǎn)型時所面臨的人和系統(tǒng)之間的空白,從而使整個企業(yè)的數(shù)字化系統(tǒng)變得更加智能,能夠發(fā)揮出「新質(zhì)生產(chǎn)力」的作用。
科技行者:其實相當于是從自動化到智能化的一個躍遷。
周?。?/strong>是的沒錯。
科技行者:具體到瀾碼的AI Agent產(chǎn)品AskXBOT,它的產(chǎn)品邏輯是怎樣的?
周?。?/strong>從瀾碼的AskXBOT平臺的理念來講,我們分成三步走:第一步,專家知識的數(shù)字化;第二步,基于CUI的柔性交互;第三步,領(lǐng)域知識的循環(huán)沉淀。
第一步「專家知識的數(shù)字化」。其實很多企業(yè)在這部分并沒有做好,比如我們某個客戶,我們想要協(xié)助他的表格實現(xiàn)類似于Office Copilot的功能,客戶拿出來5000個API,我們一調(diào),準確率只有10%,但是仔細一看,原來是程序員寫的對于API的描述有錯誤。AI Agent拿著一個錯誤的描述,當然不可能正確表達。
同樣,我們幫一些銀行去做數(shù)據(jù)中臺的落地,想讓業(yè)務(wù)人員直接通過對話生成BI報表,但經(jīng)常發(fā)現(xiàn)它內(nèi)部的知識中,不同的領(lǐng)域里,同樣一個單詞有著不同的意思。那么AI Agent遇到這個情況,就需要反問一句,它到底是“個人金融的單詞”還是“公司金融的單詞”?
就像信息化是數(shù)字化的前提,數(shù)字化是智能化的前提,沒有彎道超車的可能性。所以,如果我們沒有把專家知識數(shù)字化下來,AI Agent的發(fā)展會面臨很大挑戰(zhàn)。
我們認為,專家知識會分成兩種,一種是更偏自然語言、可被編碼的知識;另一種是經(jīng)驗性的知識。比如我一直舉例:“工作穩(wěn)定”,估計沒有一個招聘專員能夠用自然語言描述清楚“什么叫做工作穩(wěn)定”,它肯定是經(jīng)驗之談,所以自然語言編碼+大數(shù)據(jù),才是一個完整的「專家知識」。
第二步是「基于CUI的柔性交互」。業(yè)界有一個共識,GUI(圖形界面系統(tǒng))已經(jīng)是上一代的界面,而CUI(對話式界面系統(tǒng))會作為一個新的交互形態(tài)。如何讓機器去適應(yīng)人?一方面是需要機器去澄清、去反問,另一方面要根據(jù)用戶的習慣去進行調(diào)整。
有了這個環(huán)節(jié),新一代的AI平臺軟件,被使用起來的門檻就大大降低了。否則,就像過去的傳統(tǒng)軟件,比如一些ERP、CRM都做的很好,但是當時由于缺乏自然語言理解能力,所以無法應(yīng)對在各種上下文、各種場景之下的用戶各種各樣的問題,這其實也是我們在實際落地當中,客戶會對我們提出的要求。
第三步叫「領(lǐng)域知識的循環(huán)沉淀」。當我們的AI Agent作為連接器,能夠把專家知識和一線業(yè)務(wù)人員連接起來之后,專家知識實際上就有了更大的用武之地。
比如我們有一個客戶是做零售企業(yè)的咨詢,過去他的專家ETN咨詢一個客戶,那現(xiàn)在有可能同時有100家、1000家、甚至1萬家店長問它問題,那么專家知識就得到了1萬個人的實踐,然后由于問題被記錄下來,專家可以進一步去分析、總結(jié),并提出新的洞見。
這三個步驟就是瀾碼構(gòu)建AI進程的法則。
如果要再具體拆解,瀾碼科技“AskXBOT”由四大模塊構(gòu)成:設(shè)計器、知識中心、使用端、管理平臺,是基于LLM的Agent與工作流設(shè)計、開發(fā)、使用、管理、知識沉淀的一站式平臺。
03 公司擁有自己的大模型,是未來在競爭中的立身之命
科技行者:剛才您提到一個宏愿,瀾碼想成為大模型落地的首選廠商,怎么簡單的理解落地的價值?
周健:就是基于大模型,通過人機協(xié)作,把專家知識教會AI Agent,然后去賦能高級新手。直白而言,是讓3-5萬月薪的專家能夠把知識賦能給8000塊月薪的員工,使他們變成月薪1.5萬,這是我們此刻能實現(xiàn)、能落地的。
如下圖,著名的“德雷福斯模型”研究人類掌握技能的5個階段依次為——「新手-高級新手-勝任者-精通者-專家」。
高級新手跟勝任者最大的區(qū)別就在于,高級新手可能記住了公司的培訓技能,但他因為不如勝任者有經(jīng)驗,所以他不知道在什么場景、用什么知識,而這恰恰是專家擅長的,他的知識能夠通過AI Agent輔助高級新手,從而使高級新手實現(xiàn)加快勝任任務(wù)的過程。這是今后的趨勢和需求。
我相信企業(yè)不難找到一個專家,難的是怎么讓專家培訓內(nèi)部的業(yè)務(wù)人員,比如零售業(yè)導購、營業(yè)廳話務(wù)員等,企業(yè)要擴張,很多時候是靠增加人,但它沒辦法用可控的成本去雇到足夠好的人,而我們能夠?qū)崿F(xiàn)專家知識的數(shù)字化,能夠賦能到基層的業(yè)務(wù)單元,這是瀾碼在三年之內(nèi)想要解決的問題。
我們幫企業(yè)賦能基層業(yè)務(wù)單元,能帶來直接的好處——「增收」。企業(yè)內(nèi)部、特別是大企業(yè),一定會有大量基層業(yè)務(wù)員工在重復做著各種事情,沒記錯的話,中國全行業(yè)應(yīng)該有2000萬零售人員、有1000萬保險代理、有幾百萬銀行理財經(jīng)理、有幾十萬獵頭、有幾百萬程序員,其實都可以通過AI Agent專家知識去賦能。所以,算力的增加就帶來生產(chǎn)力的提價。
科技行者:這就涉及到另外一個問題,企業(yè)的專家可能是核心競爭力,是寶藏,如果把專家知識或數(shù)據(jù)全部數(shù)字化,如何保障企業(yè)數(shù)據(jù)安全?或許有些企業(yè)一邊想擁抱AI,但又怕自己的數(shù)據(jù)在大模型里被拿走了,從而導致束手束腳?
周?。?/strong>我能理解,但我也認為不必擔心。其實大模型最重要的是知識,專家知識的數(shù)字化是AI Agent落地的必要條件,所以知識比數(shù)據(jù)更重要。
有些「知識」可以通過編碼變成自然語言,但有些「經(jīng)驗性知識」是編碼不出來的,所以今天擺在每個傳統(tǒng)企業(yè)面前的,是怎樣把知識管理好,怎樣保證企業(yè)不被單個專家綁架,有能力把它沉淀到自己的IT系統(tǒng)里,或者能夠被復用,能夠去傳承,這才是今天最大的命題。
傳統(tǒng)企業(yè)可以要求你數(shù)據(jù)庫里的數(shù)據(jù)不被大模型拿走,但關(guān)鍵是你有哪些數(shù)據(jù)能夠拿出來,讓瀾碼AskXBOT去使用其中的知識,從而能夠放大企業(yè)的優(yōu)勢?當然,有些敏感場景,比如報價信息、薪酬信息、交易數(shù)據(jù),這些數(shù)據(jù)不能交出來,但其實外圍的系統(tǒng)也用不起來這些數(shù)據(jù)。
我曾經(jīng)回答過一個問題,問的是3、5年后,每個企業(yè)都要做一個自己的大模型嗎?我的觀點是,獨角獸(10億美金估值)以上的公司都得有一個自己的模型,這是企業(yè)的競爭優(yōu)勢,是它在市場競爭中的立身之命。
另外,傳統(tǒng)企業(yè)今天要擁抱AI,最重要是把知識沉淀下來,戰(zhàn)略是把核心的差異化優(yōu)勢,通過大模型的「智力基礎(chǔ)設(shè)施」放大,并且迭代閉環(huán),至少能立于不敗之地。這部分一定得私有化部署,肯定要找像瀾碼這樣的廠商幫助你去做。
科技行者:換句話說,我們之前跟一些創(chuàng)業(yè)公司聊,他們普遍覺得AI技術(shù)是一方面,更重要的是行業(yè)的know how,各行業(yè)專家的知識數(shù)據(jù),各種senior員工的經(jīng)驗之談,對于這家公司,或者對于公司數(shù)據(jù)來說,都是一個差異化優(yōu)勢,瀾碼相當于把企業(yè)的差異化優(yōu)勢封裝到平臺里。
周?。?/strong>是的。
04 硅谷是一個熱帶雨林,國內(nèi)大模型創(chuàng)業(yè)有機會重塑局面
科技行者:咱們有對標的公司嗎?競爭開始了嗎?
周?。?/strong>在國內(nèi)較少,在國外有一些,比如Fixie.ai公司,還有Relevance AI公司最近融了1000萬美金,他們就是在做AI的低代碼平臺,跟我們接近。
科技行者:那咱們跟他們的區(qū)別是什么?
周?。?/strong>硅谷跟國內(nèi)有很大區(qū)別,硅谷本身是一個“熱帶雨林”,上下游關(guān)系很容易配合起來,他們會在某個專精的點上做很深。
但是在國內(nèi),這個生態(tài)還不太成立,很多企業(yè)老想自己做(尤其是軟件企業(yè)),所以為了把AI Agent生態(tài)構(gòu)建起來,我們一開始必須把所有事情都做,然后再慢慢把不該做的事情讓出來,退回到自己有核心競爭優(yōu)勢的地方,這也是今天國內(nèi)做To B企業(yè)服務(wù)創(chuàng)業(yè)較難的事。
科技行者:意思是從大環(huán)境來看,其實在國內(nèi)做To B企業(yè)服務(wù)創(chuàng)業(yè)比國外更難?
周健:這得分開來看。一方面,國外的SaaS已經(jīng)很成熟了,國內(nèi)所謂的IT預算,更多是在央國企或政府,民營企業(yè)的IT預算相對于整個大盤子來講是少的,生態(tài)還不完善,原因就在這里。
另一方面,國內(nèi)企業(yè)管理的科學化方面,央國企還是更強一些,民營企業(yè)還差的很遠,那么在沒有管理科學化的前提下,就很難去談“我們再做一個軟件信息系統(tǒng)把它給固化下來”,這是國內(nèi)相比較硅谷去做這件事情更難的點。
不過,問題也是機遇。在海外,像微軟、Salesforce這些大廠,已經(jīng)把大的場景或數(shù)據(jù)都拿到手了,這就跟國內(nèi)的C端已經(jīng)被互聯(lián)網(wǎng)大廠守住的情況一樣;但是在國內(nèi),金蝶、用友、金山辦公等,它仍然還只是一個單一場景,這也是今天出現(xiàn)顛覆性機會的原因,創(chuàng)業(yè)公司有可能去重塑局面,今天隨著AI大模型的能力不斷指數(shù)級上升,是有機會重塑企業(yè)流程的。
科技行者:正好說說中美AI創(chuàng)業(yè)的差異吧,你正好兩邊都看過、做過。
周健:這可能要談?wù)剷r代背景了,有人說未來中美一定會有兩套操作系統(tǒng),或者說是兩個生態(tài)。不過現(xiàn)在看,一個區(qū)別是中國一定更強的是應(yīng)用,因為無論在哪個時代,市場需求都是很重要的,現(xiàn)在的市場環(huán)境下更是如此。
如果比較技術(shù)方面,我們可以先看一下大模型本身的特點。它是一個技術(shù)突破,技術(shù)突破本身會有極大的不確定性,即使像谷歌和微軟砸了那么多錢,最后技術(shù)突破竟然還是OpenAI帶來的,所以它有很強的不確定性。
在這方面,美國市場或許因為所處階段,導致了它能夠不計得失且不計短期利益的去投入。而中國最大的好處是,它是能統(tǒng)一大市場,今天在應(yīng)用側(cè),硅谷跟中國創(chuàng)業(yè)的水平其實沒差多少,這挺難得,過去在企業(yè)服務(wù)里,中國平均落后美國兩三年,但現(xiàn)在當?shù)讓又匦掳l(fā)生非線性增長時,中國是很可以的,因為我們的場景、需求、數(shù)據(jù)都在那。
AI領(lǐng)域還有一個有意思的點是“普惠主義”,真的在AI Agent確實有機會實現(xiàn)“普惠”,這個過程代表社會技能的轉(zhuǎn)移,所以我其實很看好在中國相關(guān)創(chuàng)業(yè)機會。
科技行者:所以咱們暫時是不會考慮出海?
周?。?/strong>對,我覺得肯定不是大力去出海。
科技行者:突然想到,瀾碼的底層大模型用的是哪一個?
周健:我們有一個框架,保證什么模型都能用,用的最多的肯定是OpenAI,因為它目前是最好的。當私有化部署的時候,你需要去換一個,挑一個測試出來相對較好的模型就好了。
科技行者:有看到與OpenAI相媲美的嗎?
周健:有快要追平GPT 3.5的,但我覺得離GPT 4都還有距離。
科技行者:對于任何一家公司來說,PMF都是很重要的,你是怎么考慮瀾碼的PMF的?
周?。?/strong>PMF很重要的是要找到足夠好的客群,并且通過迭代,找到最小成本去迅速復制的路徑,它脫離不了一個背景,就是所謂的技術(shù)采納曲線,或者是以前所謂的跨越鴻溝。
今天的大模型創(chuàng)業(yè),有所謂的趨勢性周期,過去任何一個單點的創(chuàng)業(yè),不管是技術(shù)、客戶、行業(yè),整個環(huán)境是穩(wěn)定的,所以創(chuàng)業(yè)者只要有想法,或有解決方案,都可以聚焦去做。但今天情況變了,因為底層的大模型技術(shù)一直在快速演進,某種程度上這對我們是一個大挑戰(zhàn)。
另外,整個市場對于大模型的認知也在變,這是一次新的社會實驗,每個行業(yè)、部門、角色,對大模型的看法都會隨著時間而發(fā)生變化。
當前瀾碼所處的階段屬于Solution fit(解決方案適配階段),是在做加法,就是客戶要啥、缺啥,我就補啥、就去做啥,這個階段相對容易。但是之后到了PMF階段,如果要跨越鴻溝,關(guān)鍵是要做減法,從客戶角度去研究我們的產(chǎn)品處于哪個階段。要做解決方案,要加大市場口碑,要做減法,還要降成本,才能普及讓用戶用起來,其中有很多細節(jié)的地方。
科技行者:咱們PMF整個過程需要多長時間,才能迎接下一個海浪?
周?。?/strong>我們已經(jīng)有十個標桿客戶,陸續(xù)都在交付了,所以整體已經(jīng)完成了PMF。
下個階段我們需要打磨的是,到底如何用客戶聽得懂的一個賣點,擊中他的心窩子。好在目前整個市場培育不需要我們操心,很多央國企是有硬性要求的,包括很多CIO已經(jīng)成立了專門的大模型組,有KPI規(guī)定是一定要落地的。
所以接下來,如何找到那個直擊市場痛點的抓手,而且是普適性的、規(guī)?;瘡椭频?、可以標準化的,是我們在打磨的一個重點。
比如最近有個項目,我們跟客戶領(lǐng)導聊細節(jié),客戶提了一個很簡單的訴求,但中間經(jīng)過了很多輪溝通,最后客戶直接說,你別跟我扯那么多技術(shù),我是小白用戶,你直接告訴我,什么能做,什么不能做,三句話不能再多了。
我覺得很合理,所以我就想把我的產(chǎn)品打造成小白用戶就知道怎么做,今天大模型最大的好處是,它使得機器可以適應(yīng)人,不需要人去適應(yīng)機器。
05 創(chuàng)業(yè)一邊要重視它,一邊要把它看輕一點
科技行者:你之前在依圖和弘璣是頂級的技術(shù)專家,現(xiàn)在又是創(chuàng)業(yè)公司的領(lǐng)導者,怎么看待角色的轉(zhuǎn)變?
周?。?/strong>首先我覺得自己還沒有到“家”的地步。再者回答角色轉(zhuǎn)變的問題,第一,視角很不一樣,CTO或技術(shù)人很多時候是更高質(zhì)量的做事,而對于CEO來講很重要的是選對人和方向。
我剛創(chuàng)業(yè)時,覺得啥都能干,但顯然我不能啥都干,“怎么選擇”就是一個很大的問題,選擇就一定有價值的標尺。什么叫做好?什么叫做壞?過去作為技術(shù)人員的“好”和“壞”,跟現(xiàn)在商業(yè)世界里的“好”和“壞”,完全不是一回事。
技術(shù)的好壞可能是世界級、領(lǐng)先性,而商業(yè)的本質(zhì)是生意,你要給客戶提供價值,要有競爭優(yōu)勢,要有壁壘。所以技術(shù)是向內(nèi)的,CEO是向外的,我現(xiàn)在基本70%以上的時間在外面,只有30%的時間在公司里。
科技行者:既然選擇正確的方向很重要,也就是說創(chuàng)業(yè)者的預判、視野、格局都很重要,咱們怎么去塑造自己的這些能力?
周?。?/strong>對。我越來越覺得,去考核一個CEO看兩方面:
其一,認知是一個最大的障礙或瓶頸,所以創(chuàng)業(yè)者一定要有快速學習的能力。其二,心態(tài)也很重要。
這里有三個階段,第一個階段是缺知識,你要補知識;第二個階段是方法論,你知道怎么學習(這兩個階段基本上能創(chuàng)業(yè)的CEO肯定都經(jīng)歷過了);第三個階段也是很難的,就是把自己的認知,不斷的去審視,把錯誤的假設(shè),不斷的修整掉,本質(zhì)上這要保持一種“空桶心態(tài)”。
怎么跟自己和解,是心態(tài)上的第一步。第二步則是要更積極的發(fā)現(xiàn)自己假設(shè)錯誤的地方并修正,特別是在今天的新摩爾定律時代,大模型相關(guān)的創(chuàng)業(yè)領(lǐng)域變化太快。
我開玩笑說,知識或觀點的半衰期可能只有一個月,我沉淀出來的假設(shè)可能很快就會被修正,但是反過來看也正是因為如此,創(chuàng)業(yè)公司才能跑得快,才能跟大廠巨頭在同一起跑線上。
作為CEO,上面提及的這兩件事情,是蠻本質(zhì)的問題,如果不解決,就會成為瓶頸。
科技行者:說到心態(tài),現(xiàn)在特別是技術(shù)人員,程序員或開發(fā)者群體里,特別流行一個詞叫35歲恐慌,這可能是一個魔咒,你認為這些人群的職業(yè)成長應(yīng)該何解?
周?。?/strong>我理解“35歲魔咒”,本質(zhì)上是大家一直在重復自己的工作,導致當?shù)讓迎h(huán)境發(fā)生變化,你不知道該怎么辦了。
我當年在谷歌,很快就做到了一個模塊的負責人,管理十幾個C++代碼,大概三、五千行代碼,全谷歌的人如果要改這些,都得通過我的同意才能提交,但當時的我仍然很恐慌,擔心如果代碼被換了,我該怎么辦呢。
所謂的“35歲魔咒”,從宏觀角度來講,就是不同層級的人,當他到達某個局部高峰,又不愿意往外走,或者說他不知道應(yīng)該怎么往外走,怎么去突破他原有的瓶頸,發(fā)現(xiàn)外面的世界,那么他永遠無法到達另一個高峰。
我有個習慣,是看自己能否把某個參數(shù)乘以10。假設(shè)你現(xiàn)在的系統(tǒng)是高并發(fā)的,你原本每天要發(fā)一個版本,但如果要你每天發(fā)十個版本,你應(yīng)該怎么辦?類似這種假設(shè)性的問題,很容易幫你發(fā)現(xiàn)自己思維當中的“黑盒”。
這個方法叫做遷移學習,如果你有能力把你已有的經(jīng)驗換到其他的環(huán)境里面去,這時候你是不怕“35歲魔咒”的。
科技行者:你35歲的時候是在谷歌嗎?
周?。?/strong>我1999級入學上海交大,2002年拿了ACM世界冠軍,2006年碩士畢業(yè),當時我拿了三個offer:一個是微軟亞洲研究院,一個是谷歌,還有一個是在上海的MSN。
那時候谷歌剛進入中國市場,因為我有亞洲首個ACM冠軍團隊成員的背景,對谷歌有吸引人才的宣傳效果,當時微軟亞洲研究院的沈向洋打電話給我,我去北京和沈向洋當面One&One,但那時我覺得谷歌更有互聯(lián)網(wǎng)思維,所以選了谷歌。
我畢業(yè)后頭三年在谷歌,后來三年在阿里,我在2011年離開阿里的時候是P8,基本上已經(jīng)過了所謂的35歲,所以很清楚怎么應(yīng)對“35歲魔咒”了。
科技行者:那么作為連續(xù)創(chuàng)業(yè)者,對于其他創(chuàng)業(yè)者,有什么過來人的經(jīng)驗之談?
周?。?/strong>從歲數(shù)上來講,我已經(jīng)40幾歲了,可能稍微年長一些,可以總結(jié)一下,我覺得創(chuàng)業(yè)要有底線思維。
創(chuàng)業(yè)很有意思,但要把生活跟工作分開,創(chuàng)業(yè)本身只是一個手段而已。今天瀾碼所遇到的機遇是我的人生機遇,如果錯過了這個機會,我可能這輩子也拿不到更好的機會了,但我仍然覺得這只是人生過程中的一段經(jīng)歷而已,千萬不要因為某些事情,而出現(xiàn)這樣那樣的執(zhí)念,就孤注一擲,因為風險隨時存在。
我十年前創(chuàng)業(yè)過,當時最后把公司關(guān)了,關(guān)閉公司的過程很痛苦,好在當時沒有什么其他后果,但是心態(tài)要放平和,創(chuàng)業(yè)一邊要重視它,一邊要把它看輕一點,得掌握一個度。
雖然我十幾年前創(chuàng)業(yè)失敗了,但有點像喬布斯講的——可能在那一刻,覺得它是一個curse(詛咒),但是當你邁過去了,就是一個bless(感恩)。
科技行者:今天我們一直在談大模型,最后再總結(jié)一下對大模型的判斷吧。
周?。?/strong>AI Agent今天最大的問題不在應(yīng)用層,而是大模型本身算力的要求太高,但現(xiàn)在大模型公司對于算力的小型化已經(jīng)做了很多,2024年基本可以過平均線,2025年可能就普遍可用了,到那時,誰在“裸泳”就很明顯了。
好文章,需要你的鼓勵
新加坡國立大學研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓練AI玩簡單撲克游戲就能讓其數(shù)學推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學題目作為訓練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學解題中,為AI訓練提供了新思路。
同濟大學團隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學習和數(shù)學優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設(shè)備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學習訓練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實現(xiàn)大語言模型訓練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓練效率,已在多個任務(wù)上驗證有效性。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會友,左手硬核科技,右手浪漫主義。