ICC訊 工業(yè)和信息化部近日批準發(fā)布《YD/T 6770—2026 人工智能 關鍵基礎技術 具身智能基準測試方法》,為具身智能領域首份行業(yè)標準,將于6月1日正式實施,標志著具身智能評測邁入“有標可依”的新階段。
該標準為具身智能領域構建了統(tǒng)一基準測試框架,規(guī)范了在仿真環(huán)境和真實環(huán)境下,開展具身智能基準測試的環(huán)境設置、任務庫構建、測試過程和指標計算方法。目前該標準已同步推進國際標準立項。
中國信通院有關專家表示,可信的評測體系是連接技術研究與大規(guī)模產(chǎn)業(yè)應用的橋梁和標尺,該標準將為行業(yè)提供統(tǒng)一的技術規(guī)范框架、建立互信基礎。在技術研發(fā)層面,為具身智能的能力評估提供統(tǒng)一的度量依據(jù),指引技術迭代方向,幫助行業(yè)及早識別并收斂于高價值技術路線,減少研發(fā)資源的無效投入;在應用落地層面,為行業(yè)用戶開展產(chǎn)品選型與應用驗證提供標準規(guī)范支撐,避免市場出現(xiàn)“劣幣驅(qū)逐良幣”現(xiàn)象;在產(chǎn)業(yè)發(fā)展層面,將加速具身智能從實驗室走向真實場景,促進具身智能技術成果的工程化落地和產(chǎn)業(yè)化應用。
圖1 《YD/T 6770-2026 人工智能 關鍵基礎技術 具身智能基準測試方法》
《YD/T 6770-2026 人工智能 關鍵基礎技術 具身智能基準測試方法》概述如圖1,描述了在仿真環(huán)境和真實環(huán)境下面向具身智能系統(tǒng)的基準測試框架、指標和方法,包括基準測試的環(huán)境設置、任務庫構建、測試過程和指標計算方法,適用于單個具身智能系統(tǒng)“感知-決策-執(zhí)行”全鏈路能力的基準測試。
該標準構建了統(tǒng)一的具身智能基準測試框架(如圖2所示),包括環(huán)境設置、測試任務庫、測試過程和指標計算四部分。測試環(huán)境方面,規(guī)定了仿真測試環(huán)境和真實測試環(huán)境的構建要求,確保環(huán)境設置能反映現(xiàn)實環(huán)境的復雜性。測試任務方面,提出了測試任務庫構建方法和泛化評估基準,支撐評估被測對象在不同任務復雜性、不同能力維度上的性能表現(xiàn)和泛化性。測試過程方面,主要面向模型和部署模型的整機系統(tǒng)兩類測試對象開展測試,測試方法包括靜態(tài)仿真測試、動態(tài)仿真測試、真實環(huán)境測試和組合式測試等。測試指標方面,主要包括任務執(zhí)行效率、任務成功率、人工干預率、場景擾動衰減率和平均任務能耗等五個指標。
圖 2 具身智能基準測試框架圖
該份行業(yè)標準的制定,對具身智能產(chǎn)業(yè)各方推動技術進步、產(chǎn)業(yè)應用和標準化建設具有重要意義。對研發(fā)側,為具身智能的能力評估提供了統(tǒng)一的度量依據(jù),指引技術迭代方向,幫助行業(yè)及早識別并收斂于高價值技術路線,減少研發(fā)資源的無效投入。對應用側,為行業(yè)用戶開展產(chǎn)品選型與應用驗證提供標準規(guī)范支撐,避免市場出現(xiàn)“劣幣驅(qū)逐良幣”的現(xiàn)象。對產(chǎn)業(yè)側,加速具身智能從實驗室走向真實場景,促進具身智能技術成果的工程化落地和產(chǎn)業(yè)化應用。
-END-
*AI主題在線研討會,直播預約
4月22-24日,特別邀請微軟、Meta、AMD、戴爾、博通等國際頂尖企業(yè)的十余位技術專家與高層領袖,聯(lián)合Heavy Reading資深分析師、是德科技核心技術團隊共話AI基礎設施技術。精彩內(nèi)容歡迎識別下方二維碼預約免費預約觀看或點擊鏈接 進入會議,并抽取精美獎品。
4月22日 趨勢洞察:AI基礎設施及相關產(chǎn)業(yè)的未來之路》》點擊報名
4月23日 3.2T核心技術篇:3.2T高速互連與SDN技術突破》》點擊報名
4月24日 前沿技術應用篇:Agentic AI,UEC,Scale In, Scale Up, Scale Out前沿技術探討》》點擊報名
掃碼報名