我們擅長商業(yè)策略與用戶體驗(yàn)的完美結(jié)合。
歡迎瀏覽我們的案例。
IT之家 8 月 15 日消息,智元機(jī)器人昨天通過公眾號宣布,推出行業(yè)首個(gè)面向真實(shí)世界機(jī)器人操控的統(tǒng)一世界模型平臺 --- Genie Envisioner(GE)。
根據(jù)官方介紹,不同于傳統(tǒng)“數(shù)據(jù) — 訓(xùn)練 — 評估”割裂的流水線模式,GE 將未來幀預(yù)測、策略學(xué)習(xí)與仿真評估首次整合進(jìn)以視頻生成為核心的閉環(huán)架構(gòu),使機(jī)器人在同一世界模型中完成從“看”到“想”再到“動(dòng)”的端到端推理與執(zhí)行?;?3000 小時(shí)真機(jī)數(shù)據(jù),GE-Act 不僅在跨平臺泛化和長時(shí)序任務(wù)執(zhí)行上顯著超越現(xiàn)有 SOTA,更為具身智能打開了從視覺理解到動(dòng)作執(zhí)行的全新技術(shù)路徑。
IT之家附開源有關(guān)鏈接:
Project page:https://genie-envisioner.github.io/
Arxiv:https://arxiv.org/abs/2508.05635
Github:https://github.com/AgibotTech/Genie-Envisioner
GE 平臺通過構(gòu)建統(tǒng)一的視頻生成世界模型,將這些分散的環(huán)節(jié)集成到一個(gè)閉環(huán)系統(tǒng)中。基于約 3000 小時(shí)的真實(shí)機(jī)器人操控視頻數(shù)據(jù),GE 建立了從語言指令到視覺空間的直接映射,保留了機(jī)器人與環(huán)境交互的完整時(shí)空信息。
基于強(qiáng)大的視覺空間預(yù)訓(xùn)練,GE-Act 僅需極少量數(shù)據(jù)即可實(shí)現(xiàn)跨平臺遷移。在 Agilex Cobot Magic 和 Dual Franka 等全新機(jī)器人平臺上,GE-Act 僅使用 1 小時(shí)(約 250 個(gè)演示)的遙操作數(shù)據(jù)就實(shí)現(xiàn)了高質(zhì)量的任務(wù)執(zhí)行。
智元方面表示,團(tuán)隊(duì)將開源全部代碼、預(yù)訓(xùn)練模型和評測工具。GE 通過視覺中心的世界建模,為機(jī)器人學(xué)習(xí)開辟了新的技術(shù)路徑。GE 的發(fā)布,標(biāo)志著機(jī)器人從被動(dòng)執(zhí)行向主動(dòng)‘想象 — 驗(yàn)證 — 行動(dòng)’的轉(zhuǎn)變。未來,將擴(kuò)展更多傳感器模態(tài),支持全身移動(dòng)與人機(jī)協(xié)作,持續(xù)推動(dòng)智能制造與服務(wù)機(jī)器人的落地應(yīng)用。
智元推出行業(yè)首個(gè)機(jī)器人世界模型開源平臺 Genie Envisioner 09:16:25
人形機(jī)器人運(yùn)動(dòng)會 首程機(jī)器人科技體驗(yàn)館展示200+款機(jī)器人及智能產(chǎn)品 09:12:32
“陽光+海水”破解白色污染,這位上??茖W(xué)家海邊就地取材,讓塑料重生 09:29:54
輔助駕駛不能當(dāng)自動(dòng)駕駛 09:27:42
南山少年化身“AI醫(yī)生”問診汽車 09:26:22
本土創(chuàng)新提升效率,中國民航發(fā)動(dòng)機(jī)如何實(shí)現(xiàn)“提質(zhì)延壽”? 09:22:55