炒股就看,权威,专业,及时,全面,助您挖掘潜力主题机会!
文/新浪财经上海站 陈秀颖
6月28日于上海智能工业中心开幕的“具赋新能 智驱未来”青年科学家成果转化暨具身智能高质量发展研修会上,百余位全球青年科学家与逾130位上市公司企业家云集。
北京大学助理教授、银河通用创始人及CTO、智源学者王鹤的演讲——合成数据赋能的具身大模型开启工商业场景规模化落地。

2023年5月,银河通用成立之初,便迅速拿下种子轮融资。此后,头部机构持续加入,旗下几乎汇聚了各类型顶级投资机构,由此走到聚光灯下。
具身智能,作为让机器人具备理解物理世界并与之交互能力的尖端领域,近年来风头正劲。尤其在多模态大模型加持下,“端到端”的技术路线被普遍视为通向“通用”的曙光。
王鹤在演讲伊始,便将具身智能与已取得长足进步的自动驾驶领域进行了量体裁衣的对比。他指出,自动驾驶历经十年发展,其辅助驾驶功能如今能在国内城市普及,核心正是端到端模型。相比之下,具身智能的任务范畴更广、所需数据量级更大、技术复杂度更高,但“端到端”之路依然值得坚持,否则规则驱动的旧范式将在可扩展性上举步维艰。
然而,最大痛点旋即浮出水面:数据。自动驾驶数据能依托海量行驶车辆(头部车企单日可回流高达1亿条片段)自然采集。但具身智能,尤其是人形机器人领域,却深陷数据泥潭。“卖未成熟产品给用户,他们不会买单;没有用户,数据就无法自然回流。”王鹤直言。
当前全球最大具身智能数据集仅达百万条级别,与自动驾驶的单日数据量相比相差数个量级。即使如银河通用等头部人形机器人公司,今年量产目标也仅定在“超过1000台”,离“一万台”仍有距离,与汽车百万级保有量更是相差两个数量级。更严峻的是,机器人的自由度(单臂6-7个,全身50-100个)远超汽车,意味着对数据的需求成倍增长,采集成本高昂(单人单日约采1000条)。
面对这近乎无米之炊的困局,王鹤团队独辟蹊径,找到了关键突破口:大规模合成仿真数据。“真实数据长期看固然重要,但产业发展初期不能坐等功能成熟后才闭环数据采集。”王鹤强调,唯有以合成数据为主力,辅以少量高质量采集的真实数据,才能实现高效破局。
银河通用通过构建庞大的仿真合成数据集,生成海量虚拟操作轨迹与标签,同时攻克“仿真-真实”差距难题,最终打造出了其核心技术——基于合成大数据预训练的端到端具身大模型。

其代表作“GraspVLA”模型便是明证:这是全球首个完全依靠合成数据(10亿帧)预训练的视觉-语言-动作(VLA)大模型。它在仿真环境中模拟了桌面场景下对近百万种物体的抓取,每个场景均配有语言任务描述,并在光照、物体材质、类别等方面进行了充分随机化。
其结果令人惊叹:模型能在完全未见过的真实环境与物体(如购物车、挖掘机模型、游泳眼镜、测电笔)中,仅凭语言指令(如“抓取测电笔”)就游刃有余地完成精准抓取,且具备闭环实时动态调整能力,且具备强抗干扰性。
理论模型的高效,最终指向了商业化的成功。

王鹤展示了合成数据方案带来的革命性效率提升:仅需极少量的真实数据微调(例如,“按顺序抓取箱子中的矿泉水”技能仅需每人约2小时采集的200条数据),模型即可精确理解人类意图,并能零样本泛化到同类新物品(如从训练用的怡宝水到农夫山泉、东方树叶)。更令市场瞩目的是其在零售场景的突破性应用——基于99%合成数据+<1%真实数据训练出的“GroceryVLA零售端到端大模型”。

该模型能驾驭真实货架环境的极致复杂:密集摆放的可乐瓶间也能准确抓取(传统避障规划难以实现);面对膨化食品、巧克力、果粒爽、散装卤蛋等千姿百态的商品,都能应对自如。现场视频展示了其强大的抗干扰能力:即使人为交换商品位置或添加干扰物,模型仍能精准完成任务。

王鹤总结,除了工商业场景,我们还为家用环境制造了大量合成数据资产,银河通用合成了涵盖长袖、短袖、帽衫、卫衣、短裤、长裤等多种衣物的高精度操作数据。这是全球首个完全基于合成大数据训练的衣服操作大模型,仅需RGB输入即可实现精准操作,特别值得注意的是,该模型在真实世界未见过的衣物类型上依然展现出优异的泛化能力。
凭借在各个方面的突破,银河通用近期正式落地全球首个人形机器人智慧零售解决方案,由银河通用具身大模型机器人Galbot在实体门店中执行包括取货、送货、打包、库存管理等任务在内的无人值守工作。据悉,新门店部署仅需两天,无需数据采集,展现出广阔的市场潜力。
王鹤透露,北京已有10家类似药店成功运行,并获100家药店订单,计划在北上广深快速部署至百家。此外,其饮品店、咖啡店也已投入运营,单日约400多单,失败率控制在极低的单日≤1单。
工业领域同样捷报频传。在某国际车厂北京工厂,银河通用机器人承担起复杂零部件分拣任务,能自主抓取各式各样形态迥异的零件;在另一车企,通过视频可以看到,银河通用机器人可“一镜到底”地处理3x3x3复杂垛型的料箱搬运工作。
水到渠成地,银河通用正在将上半身操作、下半身导航、人机交互等能力融合为统一的基座大模型,加速在零售、接待、康养、工业等多元场景铺开。
王鹤的演讲掷地有声,不仅清晰勾勒了具身智能规模化落地的关键路径——以合成数据为核心,结合大模型和少量真实数据的“小样本学习”范式,更用实实在在的落地案例与订单(百家药店),展示了银河通用在这一技术路线上的领先地位和商业化潜力。
当同行还在艰难爬升数据规模曲线时,银河通用通过技术创新,“四两拨千斤”地化解了核心瓶颈,为行业提供了极具参考价值的实践样本。其高效的落地模式(2天部署新店)和显著的降本增效能力,预示着一个由具身智能深度参与的零售业、制造业和服务业变革正在悄然加速。
任何跨时代技术的诞生都伴随着争议挑战。具身智能亦如是,唯经巨浪淘洗,方能见证其锋锐。
吉祥起名网 吉祥起名网 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术
还没有评论,来说两句吧...