“用多大力氣可以打開一個柜子?”“撿起一個玩具從哪個角度可以放進筐里?”這些我們日?雌饋砥狡綗o奇的操作,對機器人而言,卻是一件難事。機器人往往需要在數字世界的虛擬場景中,一次次操作和訓練,才能在真實的現實世界中完成這些動作。
作為新興的未來產業,機器人產業鏈發展迎來了一輪新機遇。但技術快速迭代背后,人形機器人行業目前仍有一大痛點:缺乏可交互三維數據。
生成式語言大模型豐富了人形機器人的大腦,但當人形機器人走進物理世界,對力量的感知、對溫度和氣味的識別,生成式語言大模型仍難以解決,對空間智能需求應運而生。斯坦福教授李飛飛提出,空間智能是機器人和AI的未來基石。
創業14年,杭州群核信息技術有限公司積累了3.62億個3D模型,空間設計平臺“酷家樂”為群核科技的空間智能沉淀了大量的三維可交互數據,當時代的風口來到具身智能時,給人形機器人做數字道場的群核科技,也開啟了空間智能的賽道角逐。
第一期實地探訪群核科技,近距離了解機器人的數字道場是如何誕生的。
杭州群核信息技術有限公司已創業14年,積累了3.62億個3D模型。2月初,英偉達和卡耐基梅隆大學研究團隊研發的ASAP新框架運用在宇樹機器人上,成功模仿了科比投籃的動作,令網友驚奇。但細看ASAP新框架,要復現科比的經典投籃動作,離不開機器人在模擬環境中的訓練:第一階段,研究團隊使用經過調整的人類運動數據在模擬環境中預訓練運動跟蹤策略;第二階段,將這些策略應用到真實世界,并收集真實數據來訓練一個“殘差”動作模型,用來彌補模型與真實世界物理動態之間的差距。
“目前的人形機器人運動控制和小腦技術,基本處于領先地位,但機器人智能化開發過程中,數據往往是瓶頸,所以需要利用海量可交互三維數據集做機器人的訓練道場,提升機器人的大腦能力。”群核科技首席科學家唐睿向人形機器人的大腦主導上層的邏輯推理、決策、規劃,以及用自然語言來和其他智能體、環境進行交流。“小腦”更多關注機器人的運動控制和平衡調節。人工智能技術的突破,讓人形機器人擁有了更“聰明”的大腦。
然而,光有數據還遠遠不夠,機器人還需要在數字世界里訓練,進行學習強化。唐睿提到要做好機器人數字世界的訓練道場,有兩個非常核心的要素:首先,虛擬世界的數據是不是足夠物理正確;其次,仿真的虛擬空間,是否足夠接近真實世界。“譬如我們做光線追蹤,在虛擬世界中要模擬真實世界的光線傳播,而在虛擬世界里,通過物理仿真引擎,要盡可能計算還原光線的仿真表現。”在唐?磥,要在數字世界中還原真實的物理世界,如何保障數據的高精度和高準確性是空間智能的關鍵。
群核空間智能平臺是唐睿帶領團隊構建的一套空間智能解決方案,專為通過逼真的虛擬模擬訓練復雜模型而設計,由于全球范圍內具備物理正確屬性的室內空間數據非常稀少,群核空間智能平臺的合成虛擬數據生成能力吸引了全球科技巨頭的主動合作。
根據群核科技招股書,截至2024年年底,群核科技已經擁有超過3.62億個3D模型,其平臺上平均每月有8630萬活躍訪問者。公司是全球最大的空間設計平臺,平臺合作客戶超4.5萬家,服務覆蓋200多個國家和地區。
這份數據的積累,和空間設計平臺“酷家樂”密不可分。群核科技創始人黃曉煌等人最開始的創業方向是“用GPU做云端的圖形圖像快速渲染”,最終的一大技術應用場景是在空間設計軟件“酷家樂”上。
從53秒減少至1.2秒,這是“酷家樂”處理一張典型2K圖像GPU渲染的最新速度。不少買房裝修的業主體驗過“酷家樂”的空間設計功能,但其實空間設計的概念并不新鮮。當創新敘事追逐賽博霓虹,隨著時間和實踐的積累,留存下來的物理正確的三維數據,在現實的反復捶打中,又再次為機器人注入靈魂覺醒的生存韌性。
3.62億個3D模型及空間設計元素,是“酷家樂”積累下來的數據,正是得益于家裝場景空間設計的大量實踐和應用數據,群核科技才從空間設計平臺邁向空間智能賽道。
2017年,群核科技的科研團隊一直在批判性反思,為什么群核積累的大量高逼真三維交互數據僅能應用于家裝場景中,還有沒有其他應用價值?
還有沒有其他可能?這個問題一直在群核科技的科研團隊中反復出現,在還沒有想到更多可能性之前,他們聯合國外知名高校進行了一次科研合作。
2018年,群核科技和帝國理工學院、南加利福尼亞大學展開了一項科研合作:發布全球最大的室內場景認知深度學習數據集InteriorNet。
誰也沒想到,這份在家裝領域積累的室內設計數據,因為一封陌生郵件,為群核打開了一個全新的賽道。
2019年的一天,公司某位算法工程師打開郵箱時,一度懷疑自己收到了詐騙郵件。在這封全英文的郵件里,硅谷某家家喻戶曉的萬億級硬件巨頭主動向當時名不見經傳的群核科技發出了合作邀約。彼時,該巨頭正苦于缺乏大量物理正確的合成數據做機器人訓練,而當他們在尋找這方面數據時,群核科技此前聯合發布的InteriorNet數據集吸引了他們的目光,因此發來郵件尋求合作。
盡管一度被認為是詐騙郵件,但再三確認后,雙方很快達成合作,群核科技的數據集也第一次應用在了空間智能訓練上。
唐睿發現,這一次國內企業和國外企業并不存在認知代差。有了第一次合作之后,國外和國內的不少機器人企業也紛紛找來尋求合作。“AI行業的出海,我們和國外不存在認知代差。以往國外用戶可能會存在認知屏障,譬如談及汽車產業,海外用戶會對德國制造和日本汽車有強認知,但AI是全新的技術,用戶的刻板成見還未形成,國內在AI領域甚至具備領先優勢。”唐睿表示。
在“GTC2025全球大會”上,群核科技宣布開源其自主研發的空間理解模型SpatialLM。該模型僅通過一段即可生成物理正確的3D場景布局。據了解,SpatialLM突破了傳統大語言模型對物理世界幾何與空間關系的理解局限,讓機器具備空間認知與推理能力,將為具身智能等相關領域提供空間理解基礎訓練框架。據悉,該模型接下來還將迭代自然語言和場景交互功能。
當前,群核科技的三大核心技術能力主要在于專門構建的GPU高性能計算集群、以多模態CAD大模型為代表的空間認知理解技術以及結構化合成虛擬數據生成。
在空間智能領域,群核科技希望搭建數字仿真與物理現實之間的橋梁,但要架起這樣一座橋梁,有許多看不見、摸不著的難點。“比如說空氣流體力學的仿真,我們現在在數字世界還做不到。”但AI的技術變革正在以非線性的速度推進,唐睿發現他很難預判未來幾年空間智能的發展速度。“GPT、和圖像等多模態人工智能技術的發展,顛覆了我對科技發展以往的認知。保守估計的線年內,空間智能會快速落地到泛娛樂或者消費級的應用中去。未來10年內,空間智能有望在工業領域獲得巨大的成就。在具身智能領域,空間智能數據能夠幫助機器人加速智能化。”
近50%的研發投入占比、80%左右的毛利率,“酷家樂”成為群核科技最主要的營收投資未來,是群核科技目前重倉的一件事情。
科技的競爭,核心還在于人才的競爭,所以群核科技加大了人才儲備力度。
2月底,群核科技發布“星核人才計劃”,招募崗位覆蓋多模態大模型與AIGC研究、Sim2Real與具身智能研究、AI驅動的圖形渲染引擎研究方向、三維幾何算法與造型平臺研究、智能空間設計領域研究等。
最高百萬元級別的薪酬待遇,加之“杭州六小龍”的曝光效應,招聘信息發布后,群核科技迅速吸引了眾多優質高校的畢業生。公司擁有615名研發人員,占員工總數的44.3%。創始團隊中,群核科技多位高管畢業于名校。
獨木難成林,在杭州創業的群核科技,也成為杭州全力打造人工智能全產業鏈的代表企業之一。從生態體系來看,梁文峰創辦的DeepSeek大模型,打開了“用算法換算力”的新路徑,帶來了國內開源生態的大繁榮;宇樹科技、云深處等機器人企業受益于大模型技術的進步,迭代速度加快;群核科技的空間智能則在一定程度上彌補了機器人三維數據的匱乏。在杭州的城市物理空間上,這些企業構筑了一個彼此咬合的生態系統。
流量和高曝光,帶來了耀眼的光環。對群核科技來說,它需要用更多的能力證明自身價值。
公司爆紅之后,唐睿既高興又倍感壓力:“這個世界變化得太快了。所以進一步地堅定了我們的團隊理念:和有批判視角、有活力的小伙伴們一起工作,一起創新。”
他覺得群核還遠遠不能滿足于現狀,科研團隊更需要具備批判性的思維進行自我批判,發揮創造性思維改變自己、改變行業。
唐睿說:“我們希望擊敗我們的,是我們自己,而不是其他人。”