让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

  • 光轮智能杨海波:合成数据是具身智能的必经之路

    发布日期:2025-09-19 14:17    点击次数:70

    专题:服贸会2025中国AIGC创新期骗论坛

      中国国外行状交易来去会-具身无界:智能机器东说念主创新发展论坛于2025年9月11日在北京举行。主题为“具身智能+大模子:机器东说念主的进化翻新”。光轮智能集聚首创东说念主兼总裁杨海波出席并演讲。

      以下为演讲实录:

      大众好,我是来自光轮智能的杨海波。咱们是一家专注于仿真合成数据工夫的公司。和专注于大模子的企业不同,咱们的中枢观念是匡助AI更好地剖释和插足物理天下。当今主要聚焦于具身智能和自动驾驶两大场景。

      面前,AI已全面插足以数据为中心的期间。大谈话模子、自动驾驶和具身智能齐深广吸收端到端架构,模子性能越来越依赖于数据的限制与质料。尤其在具身智能鸿沟,数据需求远超其他赛说念——咱们以为,其限制将达到自动驾驶或大谈话模子的千倍万倍。

      为什么具身智能对数据的需求如斯宏大?第一,期骗场景高度种种。自动驾驶替代的是司机,而具身智能对准的是千行百业,从工业操作到家庭行状,对泛化智商要求极高。第二,具身智能强调与物理天下的的确交互,不仅需要视觉感知,更触及力反馈、物体形变、复杂重要通顺等物理属性。第三,机器东说念主实质形态异构,双足、轮式、机械臂等不同构型导致数据自然诀别、难以圭臬化。最关键的是,当今尚无大限制机器东说念主落地期骗,预覆按数据稀疏匮乏,严重制约了具身模子的发展。

      面对这一近况,合成数据是鼓动具身智能限制化发展的关键基础范例。在具身智能的数据金字塔中,其根基由海量非结构化汇集数据组成,尖端则由网络本钱崇高的、数目最爱戴的的确数据组成,有益于智能体高效且胜利地进行学问迁徙,而合成数据的加入填补了两者间的空白,在网络本钱、可泛化性与学问迁徙方面领有彰着上风。固然,合成数据仍需克服“Sim2Real Gap”——即仿真与试验的相反。但咱们以为,Sim2Real不长短此即彼的问题,而是可通过工夫阻挡消弱差距。

      高质料的具身合成数据需得志四个关键条款:

      一是物理交互必须的确。具身智能要求模子能“感受”物理反馈,比如拉开雪柜门时的阻尼力、按底下包机按钮的触发反馈,以致包括线缆、衣物等柔体的及时形变模拟,这些在仿真中需高精度收复。

      二是东说念主在环的数据生成。AI的进化永久依赖东说念主类剖释,非论是大谈话模子中吸收人人标注,如故端到端自动驾驶覆按中使用五星司机数据,齐讲明高质料东说念主类人人示范不成或缺。咱们通过仿真环境下的遥操作,网络物流、烹调、分拣等场景中专科东说念主员的操作数据,不错为模子提供可泛化的高阶剖释。

      三是场景鼓胀丰富。鼓胀丰富的场景种种性是极其迫切的,的确数据网络濒临Real2Real Gap——即单一测试场无法遮掩的确环境的种种性。自动驾驶车辆即使在紧闭测试场或专科赛说念发达优异,也难以胜利应酬绽放说念路的挑战,根源在于的确场景丰富度不及,而对具身智能来说,所需场景的种种性和复杂性更是指数级增长。因此需要具身合成数据有时以高效率生成海量相反化场景,构建正常且合理的数据漫步,从而普及模子泛化智商。

      四是通过数据闭环完满存效性考证。咱们不仅生成数据,还通过自研算法对数据遵守进行考证。举例在使用合成数据微调英伟达GR00T模子后,将其部署至的确机器东说念主,考证其在的确工场环境中的发达。

      接下来为大众展示几个具体的Demo案例:

      率先是咱们的厨房仿真场景。与频频仅堤防外不雅的仿真不同,咱们这个厨房中的许多对象齐是柔体或刚柔搀和体。举例大众看到的线缆,就同期具备刚体特质和柔体形变成果。咱们通过高保确凿物理引擎,模拟了包括材质反馈、受力形变在内的复杂交互行径。

      另一个展示的是商超场景。咱们通过Real2Sim工夫,对像7-Eleven这么的的确商超环境进行高精度收复和自动泛化,生成无数种种化、可交互的商品布局。比如演示中将零食从挂钩上取下的作为,看似简便,但在仿真中却触及很是复杂的物理碰撞计较。咱们不仅要完满视觉上和物理上的的确感,还需高效收尾算力耗尽,使其具备大限制覆按的期骗价值。

      这恰是咱们责任的中枢——在高度的确的仿真环境中,通过遥操作完成复杂任务的数据网络。该仿真场景咱们还是开源,可用于撑握种种具身智能的覆按需求。咱们撑握多种网络设备,包括鼠标、AR/VR设备以及带力反馈的专科操控装配,以允洽不同复杂度的任务网络。

      当今,光轮智能已构建涵盖数据网络、战略覆按、仿真评测到Sim2Real部署的全经过料理决策。咱们也与英伟达、Figure、DeepMind等国外头部企业结合,撑握包括GR00T N1在内的多个模子研发与落地,在国内行状最头部的车企和大厂。此外,咱们还开源了部分高质料仿真金钱与转化器具,鼓动行业共建圭臬。

      最终,咱们的观念是构建全球最大限制、最高质料、最通用的具身智能数据集——瞻望超100万小时,95%以上为仿真数据,并一说念通及其部客户考证与东说念主工质检。料理合成数据的问题,是具身智能迈向大限制期骗的关键一步。

      合成数据不是简便的模拟的确,而所以更高效率、更大限制为AI提供物理天下的反馈与剖释,是具身智能迈向限制化期骗的必经之路。

      谢谢大众!

      新浪声明:通盘会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之观念,并不料味着赞同其不雅点或阐发其步地。

    海量资讯、精确解读,尽在新浪财经APP

    株连裁剪:王翔