
中国国际服务贸易博览会 - 体现无限的:智能机器人创新和开发论坛于2025年9月11日在北京举行。主题是“刺绣情报 +大型模型:机器人的进化革命”。广伦智能联合创始人兼总裁杨·海博(Yang Haibo)参加并发表了演讲。
以下是语音成绩单:
大家好,我是来自广泛的Yang Haibo智能。我们是一家致力于仿真综合数据技术的公司。与致力于大型模型的公司不同,我们的主要目标是帮助AI更好地理解并进入物理世界。目前,它主要集中在两种基本情况下:赌博的情报和自主驾驶。
目前,AI进入了一段时间。大型语言,自动驱动和具体的智能通常采用了端到端体系结构,模型性能取决于数据的大小和质量。特别是在Embo领域死亡的情报,数据需求比其他曲目更多 - 我们认为其规模将达到数千或十次自动驾驶或大型语言模型的时间。
为什么体现的情报对数据需求如此之多?首先,应用程序方案大不相同。自主驾驶取代了驱动因素,而宝石情报则针对数千个行业,从工业运营到家庭服务,并且需要非常高的整体功能。其次,体现的智力强调与物理世界的真正接触,这不仅是视觉的理解,而且还涉及物理特性,例如力量反馈,对象变形和复杂的关节运动。第三,机器人的身体是异质的,并且各种调整(例如,双皮特,轮胎和机器人臂)导致了自然数据分散和标准化困难。最重要的是当前没有大尺寸的机器人应用程序,并且预训练数据极为差异邪教,严重阻止了体现模型的发展。
面对这种情况,合成数据是促进体现智能和规模发展的主要基础设施。在体现智能的金字塔数据中,它的基础由大量的空地网络数据组成,顶部由昂贵和最受欢迎的真实数据组成,对应于优秀和直接的传输代理商的知识。添加综合数据填补了两者之间的空白,并且对收集成本,概括和知识转移有明显的好处。当然,合成数据仍然需要克服“ SIM2REAL GAP”之间的差异 - 即模拟与现实之间的差异。但是我们认为,sim2real并不是一个或另一个问题的问题,而是可以通过技术来缩小差距。
高质量的体现合成数据必须满足四个基本条件:
首先,身体接触应该是正确的。具体的智力要求该模型可以“感觉到”物理评论,例如打开冰箱门时的阻尼力,强迫下面的包机按钮时的触发反馈,甚至可以实时仿真柔软的身体(例如电缆和衣服)。这些需要在模拟中恢复高精度。
第二个是环中的数据产生。人工智能进化总是依靠人类的认可。无论是在大语言模型中使用专家注释,还是在端到端自动驾驶培训中使用五星级驱动程序数据,它表明该人专家的高质量演示是必不可少的。通过模拟环境中的遥远手术,我们收集了专业人员在物流,烹饪,分类和其他情况下的运营,该模型可以提供更高的认知。
第三,场景足够丰富。充足的丰富差异 - 一个场景非常重要,而真实的数据提取正面临在Real2Real间隔(即,一个测试站点无法涵盖实际环境的差异)。尽管自动驾驶汽车在封闭的试验场或专业轨道上表现良好,但他们会发现很难直接应对开放道路的挑战。根源的原因是,真实场景的财富不足,对于体现的智力,所需情况的差异和复杂性急剧增加。因此,有必要包括合成数据,以产生高效率的巨大不同情况,并产生广泛合理的数据分布,从而增强整体 - 模型的整体技能。
第四,通过数据闭环实现有效性验证。我们不仅生成数据,而且还验证了数据实用程序,这是自我开发的算法。例如,在使用合成数据调整NVIDIA GR00T模型后,将其部署到真实的机器人中以验证其性能Ory环境。
接下来,向您展示一些特定的演示案例:
首先是我们在厨房模拟中的场景。与通常仅关注外观的模拟不同,我们厨房中的许多东西都是柔软的身体或硬柔软的混合物。例如,您看到的电缆具有相同的身体特性和身体变形的灵活效果。通过高保真物理引擎,我们模仿复杂的互动行为,包括材料响应和应力变形。
要展示的另一件事是超市场景。通过Real2SIM技术,我们正在恢复高katumapakan,并自动宽敞的真实超市环境(例如7-11),以产生大量多元化和交互式产品布局。例如,在演示中清除零食的作用似乎很简单,但它涉及与模拟物理碰撞非常复杂的计算。我们不仅需要实现视觉和pHysical现实,但也有必要控制计算强度的消耗,以使其具有出色的培训的价值。
这是我们工作的主要部分 - 复杂任务的数据通过在高度逼真的模拟环境中通过遥远的操作完成。我们已经为这种模拟情况提供了来源,可用于支持不同的EMB培训所需的智能。我们支持各种采集设备,包括鼠标,AR/VR设备以及具有强度反馈的专业控制设备,以适应各种复杂性的任务。
目前,Guanang Intelligent建立了一个完整的解决方案,涵盖了SIM2REAL扩展的数据提取,进近培训和模拟检查。我们还与NVIDIA,Figure和DeepMind等领先的国际公司合作,以支持包括GR00T N1在内的许多模型的研发和实施,并为领先的汽车公司和M服务中国的Ajor制造商。此外,我们还开设了一些高质量的仿真资产和转换工具,以促进行业标准的联合建设。
最终,我们的目标是构成最大,最高质量和最通用的数据集 - 预期超过100万小时,超过95%的仿真数据,所有数据集都通过了领先的客户验证和人工检查质量。解决合成数据的问题是大型应用中体现智能的主要步骤。
合成数据不仅模仿了真相,而且AI提供了更高效率和更大尺寸的物理世界的反馈和理解。这是体现智能朝向大型应用的唯一途径。
谢谢你的一切!
金融的官方帐户
24小时广播滚动滚动最新的财务和视频信息,并扫描QR码以供更多粉丝遵循(Sinafinance)