深圳新聞網(wǎng)2026年4月23日訊(記者 劉惠敏)今年4月,特斯拉公開了5項(xiàng)圍繞Optimus 第三代靈巧手的核心硬件專利,推動(dòng)機(jī)器人“身體”的標(biāo)準(zhǔn)化。幾乎同一時(shí)間,深圳具身智能企業(yè)智平方聯(lián)合港科大(廣州)熊輝團(tuán)隊(duì),發(fā)布了一站式具身智能模型開源社區(qū)——AlphaBrain Platform。


AlphaBrain Platform截圖。
與硬件開放不同,這一平臺(tái)直接面向機(jī)器人的“大腦”,開放了一整套讓機(jī)器人理解世界、做出決策并持續(xù)進(jìn)化的體系。如果說特斯拉在回答“機(jī)器人如何被制造”的問題,那么這家深圳企業(yè)正在試圖回答的是:機(jī)器人如何變得真正聰明。
開源模型不少,但“好用”的不多
過去幾年,具身智能領(lǐng)域涌現(xiàn)了大量開源模型和論文,但開發(fā)者普遍面臨一個(gè)現(xiàn)實(shí)問題,那就是開源模型能跑通,真正“好用”的很少。不同項(xiàng)目之間數(shù)據(jù)格式不統(tǒng)一、接口不兼容、評(píng)測(cè)標(biāo)準(zhǔn)缺失等等問題,導(dǎo)致開發(fā)者大量時(shí)間消耗在重復(fù)的工程搭建上。開發(fā)者想做真正的創(chuàng)新,往往要從數(shù)據(jù)處理開始,一路搭建訓(xùn)練流程、對(duì)接不同模型、手動(dòng)完成評(píng)測(cè)驗(yàn)證。
AlphaBrain Platform嘗試解決這一問題,將“數(shù)據(jù)—訓(xùn)練—模型—評(píng)測(cè)”整條鏈路打通,一次性開源了當(dāng)前具身智能領(lǐng)域最前沿的三條技術(shù)路線。
三大“全球首創(chuàng)”技術(shù)路線集中開源
·全球首個(gè)開源類腦VLA模型(NeuroVLA)
傳統(tǒng)VLA模型訓(xùn)練完成后即固定,無法在部署后繼續(xù)學(xué)習(xí)。智平方首次在類腦控制任務(wù)上達(dá)到前沿水平,開源了NeuroVLA,一種可以在真實(shí)環(huán)境中持續(xù)適應(yīng)的類腦系統(tǒng)。NeuroVLA引入脈沖神經(jīng)網(wǎng)絡(luò)動(dòng)作頭與R-STDP訓(xùn)練算法,支持機(jī)器人在真實(shí)環(huán)境中持續(xù)適應(yīng)。
這類類腦模型也被公認(rèn)為VLA(Vision-Language-Action)的未來方向,讓機(jī)器人可以在執(zhí)行任務(wù)的過程中不斷進(jìn)化,接近人類的學(xué)習(xí)方式,推動(dòng)具身智能向生物腦學(xué)習(xí)機(jī)制邁進(jìn)。
類腦模型NeuroVLA。
·全球首個(gè)基于RL Token的開源VLA訓(xùn)練架構(gòu)
該架構(gòu)將大模型的通用認(rèn)知與強(qiáng)化學(xué)習(xí)的特定場(chǎng)景優(yōu)化能力相結(jié)合,形成了一種既能理解復(fù)雜意圖,又能通過與環(huán)境交互持續(xù)精進(jìn)執(zhí)行策略的智能體架構(gòu),從而讓大模型真正成為能在工廠、家庭、倉庫等具體場(chǎng)景中完成實(shí)際物理任務(wù)的自主系統(tǒng)。智平方提出的優(yōu)化方案使VLA主體在微調(diào)過程中完全凍結(jié),訓(xùn)練參數(shù)從3.9B降至約137M,僅占VLA訓(xùn)練參數(shù)的3.5%,大幅降低訓(xùn)練計(jì)算成本的同時(shí),避免了傳統(tǒng)方法中“災(zāi)難性遺忘”的問題。
這意味著模型可以像人類一樣在已有經(jīng)驗(yàn)基礎(chǔ)上精進(jìn),而不是反復(fù)推翻重來。這種“穩(wěn)定進(jìn)化”的路徑,為通用具身智能提供了真正可持續(xù)的訓(xùn)練方式。
·世界首個(gè)可插拔世界模型架構(gòu)(WA)
世界模型是當(dāng)前最火的“想象力引擎”——讓機(jī)器人在行動(dòng)前預(yù)演未來,做出更優(yōu)決策。然而,世界模型的研究長(zhǎng)期停留在論文階段,不同模型之間難以對(duì)比、難以集成。
平臺(tái)原生集成了NVIDIA Cosmos Policy等世界基礎(chǔ)模型,支持Cosmos、Wan、V-JEPA三大世界模型一鍵切換。開發(fā)者可以在同一任務(wù)中直接對(duì)比不同世界模型的表現(xiàn),讓機(jī)器人能夠在行動(dòng)前預(yù)演多種可能路徑。
除了上述三大技術(shù)路線,AlphaBrain Platform還提供了首個(gè)面向跨架構(gòu) VLA 的開源持續(xù)學(xué)習(xí)算法。
從開放能力到構(gòu)建生態(tài)
過去,具身智能的競(jìng)爭(zhēng)主要集中在“模型能力誰更強(qiáng)”。但隨著技術(shù)演進(jìn),這種競(jìng)爭(zhēng)正在快速演變?yōu)椤罢l能構(gòu)建更強(qiáng)的生態(tài)”。模型可以被追趕,而生態(tài)一旦形成,就會(huì)產(chǎn)生持續(xù)的積累與放大效應(yīng)。
AlphaBrain Platform還提供了統(tǒng)一的評(píng)測(cè)標(biāo)準(zhǔn),覆蓋LIBERO、RoboCasa、CALVIN等8個(gè)主流Benchmark。開發(fā)者可以自由組合不同架構(gòu)和訓(xùn)練范式,跨領(lǐng)域的嘗試只需修改幾行配置。AlphaBrain Platform不僅開放能力,還主動(dòng)構(gòu)建整個(gè)行業(yè)的“基礎(chǔ)設(shè)施”,定義了能力如何被使用、如何被比較、如何被持續(xù)優(yōu)化。
如果說特斯拉通過開源硬件推動(dòng)機(jī)器人“身體”的標(biāo)準(zhǔn)化,那么AlphaBrain Platform則在嘗試為機(jī)器人“智能”建立開放的開發(fā)基礎(chǔ)。前者解決“如何制造”,后者決定“如何進(jìn)化”。前者推動(dòng)產(chǎn)業(yè)的起點(diǎn),后者決定產(chǎn)業(yè)的上限。當(dāng)最前沿的能力向開發(fā)者開放,創(chuàng)新門檻被降低,技術(shù)進(jìn)步的速度也可能隨之改變。當(dāng)越來越多公司能夠造出機(jī)器人之后,誰能讓機(jī)器人更快學(xué)習(xí)、更好理解世界、更穩(wěn)定地完成任務(wù),誰就能在未來占據(jù)主導(dǎo)位置。
(本文圖片由受訪單位提供)