隨著“具身智能”“智能機器人”于2025年首次寫入政府工作報告,具身智能、智能機器人、人形機器人等諸多新概念、新名詞越來越多地出現在大眾面前。這些看起來晦澀難懂的科技熱詞,或許很快就將走入商業場景,甚至我們的家庭。它們的定義是什么,相互之間有怎樣的關聯,未來發展前景如何?中國信息通信研究院(簡稱“中國信通院”)《專家談》欄目開辟“機器人”系列專題,邀請多位業界資深專家多視角探討我國人工智能+機器人的發展形勢。本期邀請到中國信通院人工智能研究所安全與具身智能部副主任張蔚敏,圍繞如何理解具身智能、具身智能賦能新型工業化的核心價值、具身智能的智能水平所處階段以及在邁向大規模應用中的技術瓶頸和破解路徑等展開深度解讀。
一、如何理解具身智能?
具身智能是一種智能理論和范式,強調智能行為依賴于身體和環境的互動,具有鮮明的身體性和情境性。而機器人則是這一理論在工程實踐中的載體和試驗田。智能機器人和人形機器人都是具身智能的分支。
二、具身智能如何重塑制造業核心環節?
先前,機器人已經借助人工智能技術逐漸擺脫固定機械操作的束縛,提升了自動化作業能力。但主要適用于結構化、確定性的場景,在面對復雜、變化多的生產環境時,柔性不足、適應性差的問題依然突出。具身智能的發展,讓機器人等物理實體能夠自主感知、計劃和執行任務,具備了多功能、多任務的靈活作業能力。可以說,具身智能為解決工業生產中“柔性不足、頻繁換線”兩大難題,提供了新的解決方案,也契合我國制造業小批量、多品種的新制造形態發展需求。
三、具身智能的智能水平處于什么階段?
智能水平主要由模型能力決定。端到端視覺語言動作模型(VLA)是作為大家重點探索的方向,還處于“幼兒園”階段。拆解來看VLA的三個重要能力,一是用視覺看世界的能力,僅能識別有什么物品,但無法理解何處施力,施多大的力。二是用語言和人類溝通的能力,更支持明確、具體、結構化的任務指令,例如能理解“拿起一個蘋果”,但很難理解“給我一個水果”。三是用動作執行任務的能力,現在會做的是移動、抓取和放置等簡單技能的組合,且操作對象以剛性物品為主。本體性能、網絡通信等決定了智能在實際任務表現的上限。一方面,本體技術還需進一步收斂。以人形機器人為例,目前的技術成熟度還處于早期,完賽率30%的人形機器人馬拉松暴露出了電機發熱、關節可靠性、本體結構穩定性等硬件限制。另一方面,從執行固定程序到自適應場景執行任務,需要綜合機器人的算力、網絡、成本、能耗等各因素。構建分布式、可泛化具身智能,需要均衡硬件、網絡、算力三要素供給代價,才能有望破繭工業線,進入百姓家。
四、具身智能機器人在邁向大規模應用時,面臨的技術瓶頸是什么?
一是模型Scalability面臨不確定性。目前還沒有足夠證據能證明,擴展數據對提升模型的泛化性絕對有用。而且,要讓模型具備泛化性,又足夠可靠,是系統性工程,涉及數據、訓練方法、模型架構等。二是實際可用的動作數據還遠遠不夠。現有具身智能數據集無論是開源的、合成的還是真機采集的,都很難規模化使用。數據和本體強綁定、和生產環境強相關,存在嚴重的數據孤島現象。在一個數據集上訓練好的模型部署到不同的本體型號時,性能表現會大打折扣,即使同一型號本體,在不同實驗室或搭建環境下的性能表現也完全不同。三是要解決全身運動控制問題。全身關節的協同控制需要在幾十毫秒內完成高維動作空間的復雜計算,對關節電機控制性能、運動控制模型的精度和實時性都有較高的要求。另外目前在處理需要精確力控、豐富接觸的操作任務時,如整理線束、塑料袋打包等,仍有較大挑戰。
五、如何破解具身智能產業化問題?
具身智能的發展特別是人形機器人更需要對其進行有耐心的長期投入和關鍵布局,建議:
一是注重多學科交叉研究,包括計算機科學、控制科學、認知科學、機器人學等。只有加強多學科之間的交流與合作、整合各學科的優勢資源,才能共同攻克具身智能領域的關鍵科學問題和技術難題。中國人工智能產業發展聯盟(AIIA)已成立具身智能工作組,以搭建各方合作交流平臺為目標,圍繞評估規范、產業生態建設、應用推廣供需對接、以賽促用等工作任務,推動具身智能產業生態各方協作,加速我國具身智能產業化進程。
二是重視標準研制和評估反饋機制明確智能能力升級方向。通過科學、高效、準確的標準化研究,可以有效推動產業技術升級和規模應用。MIIT TC1(工業和信息化部全智能標準化技術委員會) WG6具身智能工作組,從系統研發支撐、系統智能技術、系統集成和系統應用四方面統籌推進國內具身智能產業標準體系建設工作,圍繞具身智能智能化分級、數據集質量、接口、訓練場、基準測試和重點產品如人形機器人等體系化推進標準化工作。
三是與產業鏈上下游協同。一是推動實現“數據—模型—本體”的閉環,通過本體沉淀數據,驅動模型迭代升級,進一步強化本體性能躍遷。二是形成“需求牽引—應用驗證—反饋迭代”的閉環,面向制造、物流、醫療、家庭等重點行業半結構化場景,推動具身智能試點示范。三是加深生態協作機制,構建“基礎設施—技術服務—產品服務—行業應用”閉環,通過行業聯盟、標準化組織等,建立產業鏈協作機制,推動技術、標準、應用的同步演進。
