熱情尚未停歇⋯⋯然而,在熱度之下,一個有些“冰冷”的問題始終存在——對于一個尚在持續發展的技術而言,這種熱情是否會帶來泡沫?而當泡沫破裂,人形機器人行業又當何去何從?
京城機電旗下配天機器人CTO郭濤在接受
配天機器人CTO郭濤
“完全泛化”無解?通用具身智能面臨“三角制約”
人形機器人接近于人的外觀讓人們期待它們能夠真的像人類一樣解決通用泛化問題,但這一暢想的背后可能面臨一個“既要、又要、還要”的問題:一個通用具身智能意味著具備龐大的訓練數據、優秀的模型性能以及足夠的泛化能力,才能真正自主應對現實場景的復雜任務與各種變化。
但,這可能嗎?配天機器人認為具身智能發展中存在“三角制約”,即任務自主性、任務復雜度、變化適應性等三大能力要求難以兼顧。
例如,傳統工業機器人無需人工介入,也可以處理復雜任務,但需針對特定環境與特定任務;自主移動機器人有較強的自主能力與變化適應能力,但只能處理搬運、清掃、檢測等簡單任務;遙操作類機器人能在多種復雜環境下執行復雜任務,但需要專業人員全程手動操作。
市場對人形機器人與通用具身智能的興奮,在很大程度上源于AI大模型所帶來的應用想象,當人工智能與機器人技術結合,大模型將賦予機器人更高的智能水平與適應能力,以及更流暢的交互體驗。然而,靠大語言模型足以擊破具身智能的“三角制約”嗎?
郭濤提醒道,大語言模型與通用具身智能對變化適應性的要求截然不同。郭濤舉了個例子——讓人形機器人洗盤子,機體可能要應對水溫變化、洗潔精不夠用等各種環境與任務的動態變化,但對大語言模型來說,在用戶發布任務后,模型響應外部環境變化的能力變得非常薄弱。
配天機器人產品 此外,相比于大語言模型,通用具身智能的訓練數據也要少得多。
郭濤表示,大語言模型動輒便需要萬億級tokens的數據進行訓練,而全世界的互聯網用戶通過聊天、發或者,都是在為大語言模型自發貢獻數據量,但沒有人自發貢獻機器人的行為數據。尤其在工業領域,數據是私有的而非公開的,要獲取這類數據首先要獲取工業用戶的信任。
如何解決泛化能力與商業價值的矛盾是具身人工智能從技術展示走向商業落地的關鍵。郭濤認為,在缺乏訓練數據還要追求模型高性能的前提下,“現階段不可能出現泛化的具身人工智能”,但這并不意味著具身智能不是正確的方向。在人形機器人賽道再度沸騰之際,郭濤將目光投向更現實的“戰場”,“完全的泛化沒戲,但我們可以通過局部泛化,現階段就能實現商業化落地”,而這也是配天機器人一直以來的思路。
工業場景不只大規模生產,傳統機器人有“盲區”
如何實現局部泛化?配天機器人在這個領域已有業務實踐。
配天機器人是國內最早從事工業機器人研發的企業之一,產品可應用于焊接、打磨拋光、分揀、切割、裝配等多種工業場景。但隨著業務發展,工業機器人面對的應用場景已從大規模工業生產轉向多品種小批量生產,而后者的需求依靠傳統的工業機器人難以解決。
傳統的工業機器人采取預編程方式,大規模生產模式下,一次性完成設備安裝及算法編程后,工業機器人便可針對生產中的某些環節連續運行多年。但還有很多行業并非如此,例如造船業,一些船舶的生產節奏以個位數計,但用到的部件與工藝十分復雜,傳統的工業機器人模式需針對條件的變化逐一編程,但這樣一來,用機器替代人工的性價比也就大大降低。
除此之外,復雜裝配以及柔性物體的操作也是傳統工業機器人的應用“盲區”。郭濤總結道:“凡是預編程解決不了的問題,傳統的機器人都做不了。”這一業務痛點促使配天機器人必須向具身智能探索。
配天機器人在今年年初提出,加快具身智能項目落地。郭濤強調,公司發展具身智能,現階段以實現單一任務泛化為目標,因為在工業領域,單一任務泛化即可為客戶提供巨大價值。而公司主打的項目落地方向是焊接,這也是目前機器人的第一大應用場景。“不需要啥都能干,我們就專注焊接這一類工藝,但什么都能焊,把這個做起來市場巨大。”
在郭濤看來,發展具身智能是一個逐步蠶食的過程,從具體的場景、具體的工藝入手,一點一點鋪大應用領域,“只要工具集建立起來,推進的速度會很快”。同時,也只有先通過具體場景的實踐證明,才能逐步獲取工業領域客戶的信任,進而獲得更多工業數據,形成良性循環。
不過,在具身智能點燃的新一輪市場躁動中,除了郭濤主張的漸進式聚焦創新,押注“原生顛覆”的也不在少數。談及當前行業的熱度,郭濤坦言,任何行業都會經歷從無人知曉到泡沫式增長、突然下跌再緩慢爬起來的過程。
郭濤指出,相比于大語言模型,具身智能目前不存在相對統一的模型底座和行業共識,因此業內仍在各自領域里“各顯神通”。Transformer的出世成為大語言模型突破的起點,那具身智能何時會迎來統一的理論體系?對此,郭濤搖了搖頭,但他對此抱有信心:“因為這么多人都在努力,說不定哪天技術奇點就突破了。”