以数据为中心的具身场景落地与部署平台

投中网 | 投中网

2026-04-01 11:05:19

要实现具身规模化部署的需求，光轮通过具身全产业链基建平台，一共是五层。

大家下午好！刚才如朱老师所说，这两年中关村论坛关于具身智能探讨发生很大的变化，去年大家关注是能不能动起来的问题，今年大家探讨的是能否规模化部署的问题。我今天跟大家分享的是以数据为中心，在具身场景里面落地与部署的平台。

先说一个观点，2026年是一个数据规模化的元年，为什么这么说？从过去两年demo或者单一任务具身智能的能力，已经开始向各场景落地的趋势出现，工业制造在一些场景率先落地，仓储物流高频刚需场景不断探索。当然，零售是一个大规模应用的场景，也是一个很快可以进入的一些机会。未来可能是一个家庭康养，这是一个最难的事情，走进千家万户，因为它的场景更加的复杂，它的数据也更加多样。

从规模化进入场景过程中，数据是一个重要的支撑要素，单一任务可能是一个千小时级的机会，复杂任务可能更多。在这样一个基础上，我们看到了以数据为中心推动规模化部署方案机会。这个方案首先是一个数据驱动和评测回环和规模部署全链路的方案。从数据、评测和部署过去都有存在，为什么没有实现一个大规模的实践呢？最主要的是没有一个系统化的集成、系统化的解决方案。

首先讲数据，如何构建一个稳定的数据来源，是真正走向规模化部署的一个前提。我们采取的方案，一是和场景方合作，我们和大量的场景方，把我们的数据产线进入他们的场景里面，回环最鲜活、最真实的数据，这些数据要在仿真里面同时构建出一个数字平行世界，在仿真里面进一步泛化加速训练。二是评测，评测可以告诉模型不仅是哪里会了，更重要的是告诉哪里不会，我们可复现、可量化地评价一个模型，真正发现可以提升的地方，以这种评测促进训练的实现。三是规模部署，重点强调是规模，过去，单一能力的部署所需时间相对可接受，但如果大规模部署，这些场景方不在意模型能力有多强，在意的是多长时间能够部署，成本怎么样，对场景里的干扰有多大，我们采取的方案是在仿真下实现99%的部署，最终1%在真实环境下进行实现，这是我们构建从Data到Eval到Deploy闭环系统，它是全链路打通的。

在这样一个系统里面，我们多次提到一个关键词——“场景”。我们最近在融资，最近的合资公司和深度的战略合作关系中，都加入了很多产业场景方的合作，比如说我们这一轮融资当中，和新希望集团、奥克斯、三安光电等等合作，为什么这么做？其实底层也看到了这块的机会。因为这些场景里面有鲜活的数据，是一个待开采的数据金矿，这些传统厂商非常希望能够参与到具身数据的链路上来，但是它没有这个能力，我们和他们合作在他们场景里面开采人类视频数据，同时把人类视频数据在仿真下平行地数字化构建出来，可以实现一个数据的生成，这个数据可以共享、共用，可以共同supply到市场当中去，这是我们在挖掘传统场景的数据金矿的工作。再就是这些场景方非常希望具身能够进入他们的场景，我们基于这样一个平台，可以在数据以及评测回环的链路上，可以加速具身进入场景和工厂中，能够提升它的智能化水平，我觉得场景是这样一个平台非常重要的一点。

要实现具身规模化部署的需求，光轮通过具身全产业链基建平台，一共是五层。

第一，我们进入场景方的场景里面，真正采集人类视频数据，同时回环它，这里面有很多算法、自动化标注等能力。

第二，我们在仿真去构建环境，通过全栈自研三位一体仿真解决方案，我们的目标是构建一个数字平行世界，和过去的仿真最大的区别就是物理真实，比如互联网上可以获取冰箱的体积、重量、外观尺寸等信息。如果服务的是过去的视觉模型，这类数据已经足够；但如果服务的是具身的物理模型，仅有几何信息是不够的。我们首先有一个全自动化物理测量工厂，去测量世界物理信息，包括材质，它的力的大小，比如说我用自动化手臂去测拉开微波炉的力，不同角度的，包括线缆不同的刚度，对应不同的曲度，这些都是物理信息。世界上存在大量物理信息需要被测量出来，把它构建到仿真去，这个过程形成了物理准确的仿真世界，比如说按下这个遥控器的键之后，这个力是有反馈的，现在大家都关注这个力，我们都在测量力，未来核、磁、光、电我觉得都是需要这样一个更多的测量去构建到仿真中去的。在这个基础上，我们自研的solver（物理求解器）是最底层的解析算法，去支持这样一个仿真能力的实现。

第三，有了这样一个仿真数字平行的世界之后，我们进入了一个仿真数据生成。我们有很多链路，首先是AutoDataGen，我们自动化去生成规模化的数据，量大、多样性也足，但是它缺乏一个具体操作点上的高质量。这个高质量怎么实现？我们通过人的遥操实现，比如说我用100个人去仿真下遥操一个动作，比如说拿起水杯，每个人的角度和方式都不一样。这个多样性是具身最宝贵的一种数据。所以我们在数据生成方面提供的规模化和各种高质量的方式，确保能够生成大规模的数据来源，
第四，模型的能力评测，能够时刻评测它的模型能力在哪儿，我们发布了RoboFinals，这是全球第一个工业级仿真评测平台，里面可以测100项复杂任务。当然我们能力还在不断扩充。

第五，最终在这个行业里面部署，其中仿真是主要的方式，我们在仿真大量的部署、大量测试，然后再到真实环境下进行少量调优，进行实践。

大家关注光轮，问我们是不是数据公司，仿真公司，我们自己的定义是物理AI基础设施公司。我们是一个提供一个基于仿真去做数据生成，也做数据评测，最终加速落地部署的这样一个基础设施公司。我们在仿真技术发展可以用一个最近在GTC宣布的，光轮加入了NewtonTSC技术委员会，前三家是英伟达、谷歌和迪士尼，我们是第四家，而且只有四家。我们参与到这种国际开源的物理仿真引擎的这一动作，也代表我们在这块技术上有足够的钻研和领先。

要做好这一点，需要一个开放的生态。首先，是要和场景方合作，比如我们和1000家场景方合作产生1000万小时的数据，去挖掘数据金矿，去落地部署；同时，我觉得要和上下游合作，这点在海淀是有最大优势的。海淀经常提，比如说政府工作报告，包括“十五五”规划，提到有组织的协同创新，这个事情只有在海淀，也只能在海淀去实现，这里有模型的能力，有硬件，有我们这样一个数据和仿真平台，来支撑这样一个落地部署。这是两方面的这样一种开放的生态。

最终我们要给真正落地部署提供实际的价值，即降本、增效提效，来确保长久的、真正的商业化落地。2026年，我希望通过这样平台的建设，通过广泛的生态合作，能够从demo到真正落地部署，从实验室走向规模化的部署。谢谢大家。

网站编辑：郭靖