大家下午好!刚才如朱老师所说,这两年中关村论坛关于具身智能探讨发生很大的变化,去年大家关注是能不能动起来的问题,今年大家探讨的是能否规模化部署的问题。我今天跟大家分享的是以数据为中心,在具身场景里面落地与部署的平台。
先说一个观点,2026年是一个数据规模化的元年,为什么这么说?从过去两年demo或者单一任务具身智能的能力,已经开始向各场景落地的趋势出现,工业制造在一些场景率先落地,仓储物流高频刚需场景不断探索。当然,零售是一个大规模应用的场景,也是一个很快可以进入的一些机会。未来可能是一个家庭康养,这是一个最难的事情,走进千家万户,因为它的场景更加的复杂,它的数据也更加多样。
从规模化进入场景过程中,数据是一个重要的支撑要素,单一任务可能是一个千小时级的机会,复杂任务可能更多。在这样一个基础上,我们看到了以数据为中心推动规模化部署方案机会。这个方案首先是一个数据驱动和评测回环和规模部署全链路的方案。从数据、评测和部署过去都有存在,为什么没有实现一个大规模的实践呢?最主要的是没有一个系统化的集成、系统化的解决方案。
首先讲数据,如何构建一个稳定的数据来源,是真正走向规模化部署的一个前提。我们采取的方案,一是和场景方合作,我们和大量的场景方,把我们的数据产线进入他们的场景里面,回环最鲜活、最真实的数据,这些数据要在仿真里面同时构建出一个数字平行世界,在仿真里面进一步泛化加速训练。二是评测,评测可以告诉模型不仅是哪里会了,更重要的是告诉哪里不会,我们可复现、可量化地评价一个模型,真正发现可以提升的地方,以这种评测促进训练的实现。三是规模部署,重点强调是规模,过去,单一能力的部署所需时间相对可接受,但如果大规模部署,这些场景方不在意模型能力有多强,在意的是多长时间能够部署,成本怎么样,对场景里的干扰有多大,我们采取的方案是在仿真下实现99%的部署,最终1%在真实环境下进行实现,这是我们构建从Data到Eval到Deploy闭环系统,它是全链路打通的。
在这样一个系统里面,我们多次提到一个关键词——“场景”。我们最近在融资,最近的合资公司和深度的战略合作关系中,都加入了很多产业场景方的合作,比如说我们这一轮融资当中,和新希望集团、奥克斯、三安光电等等合作,为什么这么做?其实底层也看到了这块的机会。因为这些场景里面有鲜活的数据,是一个待开采的数据金矿,这些传统厂商非常希望能够参与到具身数据的链路上来,但是它没有这个能力,我们和他们合作在他们场景里面开采人类视频数据,同时把人类视频数据在仿真下平行地数字化构建出来,可以实现一个数据的生成,这个数据可以共享、共用,可以共同supply到市场当中去,这是我们在挖掘传统场景的数据金矿的工作。再就是这些场景方非常希望具身能够进入他们的场景,我们基于这样一个平台,可以在数据以及评测回环的链路上,可以加速具身进入场景和工厂中,能够提升它的智能化水平,我觉得场景是这样一个平台非常重要的一点。
要实现具身规模化部署的需求,光轮通过具身全产业链基建平台,一共是五层。
第一,我们进入场景方的场景里面,真正采集人类视频数据,同时回环它,这里面有很多算法、自动化标注等能力。
第二,我们在仿真去构建环境,通过全栈自研三位一体仿真解决方案,我们的目标是构建一个数字平行世界,和过去的仿真最大的区别就是物理真实,比如互联网上可以获取冰箱的体积、重量、外观尺寸等信息。如果服务的是过去的视觉模型,这类数据已经足够;但如果服务的是具身的物理模型,仅有几何信息是不够的。我们首先有一个全自动化物理测量工厂,去测量世界物理信息,包括材质,它的力的大小,比如说我用自动化手臂去测拉开微波炉的力,不同角度的,包括线缆不同的刚度,对应不同的曲度,这些都是物理信息。世界上存在大量物理信息需要被测量出来,把它构建到仿真去,这个过程形成了物理准确的仿真世界,比如说按下这个遥控器的键之后,这个力是有反馈的,现在大家都关注这个力,我们都在测量力,未来核、磁、光、电我觉得都是需要这样一个更多的测量去构建到仿真中去的。在这个基础上,我们自研的solver(物理求解器)是最底层的解析算法,去支持这样一个仿真能力的实现。
第三,有了这样一个仿真数字平行的世界之后,我们进入了一个仿真数据生成。我们有很多链路,首先是AutoDataGen,我们自动化去生成规模化的数据,量大、多样性也足,但是它缺乏一个具体操作点上的高质量。这个高质量怎么实现?我们通过人的遥操实现,比如说我用100个人去仿真下遥操一个动作,比如说拿起水杯,每个人的角度和方式都不一样。这个多样性是具身最宝贵的一种数据。所以我们在数据生成方面提供的规模化和各种高质量的方式,确保能够生成大规模的数据来源,
第四,模型的能力评测,能够时刻评测它的模型能力在哪儿,我们发布了RoboFinals,这是全球第一个工业级仿真评测平台,里面可以测100项复杂任务。当然我们能力还在不断扩充。
第五,最终在这个行业里面部署,其中仿真是主要的方式,我们在仿真大量的部署、大量测试,然后再到真实环境下进行少量调优,进行实践。
大家关注光轮,问我们是不是数据公司,仿真公司,我们自己的定义是物理AI基础设施公司。我们是一个提供一个基于仿真去做数据生成,也做数据评测,最终加速落地部署的这样一个基础设施公司。我们在仿真技术发展可以用一个最近在GTC宣布的,光轮加入了NewtonTSC技术委员会,前三家是英伟达、谷歌和迪士尼,我们是第四家,而且只有四家。我们参与到这种国际开源的物理仿真引擎的这一动作,也代表我们在这块技术上有足够的钻研和领先。
要做好这一点,需要一个开放的生态。首先,是要和场景方合作,比如我们和1000家场景方合作产生1000万小时的数据,去挖掘数据金矿,去落地部署;同时,我觉得要和上下游合作,这点在海淀是有最大优势的。海淀经常提,比如说政府工作报告,包括“十五五”规划,提到有组织的协同创新,这个事情只有在海淀,也只能在海淀去实现,这里有模型的能力,有硬件,有我们这样一个数据和仿真平台,来支撑这样一个落地部署。这是两方面的这样一种开放的生态。
最终我们要给真正落地部署提供实际的价值,即降本、增效提效,来确保长久的、真正的商业化落地。2026年,我希望通过这样平台的建设,通过广泛的生态合作,能够从demo到真正落地部署,从实验室走向规模化的部署。谢谢大家。
以数据为中心的具身场景落地与部署平台
要实现具身规模化部署的需求,光轮通过具身全产业链基建平台,一共是五层。
大家下午好!刚才如朱老师所说,这两年中关村论坛关于具身智能探讨发生很大的变化,去年大家关注是能不能动起来的问题,今年大家探讨的是能否规模化部署的问题。我今天跟大家分享的是以数据为中心,在具身场景里面落地与部署的平台。
先说一个观点,2026年是一个数据规模化的元年,为什么这么说?从过去两年demo或者单一任务具身智能的能力,已经开始向各场景落地的趋势出现,工业制造在一些场景率先落地,仓储物流高频刚需场景不断探索。当然,零售是一个大规模应用的场景,也是一个很快可以进入的一些机会。未来可能是一个家庭康养,这是一个最难的事情,走进千家万户,因为它的场景更加的复杂,它的数据也更加多样。
从规模化进入场景过程中,数据是一个重要的支撑要素,单一任务可能是一个千小时级的机会,复杂任务可能更多。在这样一个基础上,我们看到了以数据为中心推动规模化部署方案机会。这个方案首先是一个数据驱动和评测回环和规模部署全链路的方案。从数据、评测和部署过去都有存在,为什么没有实现一个大规模的实践呢?最主要的是没有一个系统化的集成、系统化的解决方案。
首先讲数据,如何构建一个稳定的数据来源,是真正走向规模化部署的一个前提。我们采取的方案,一是和场景方合作,我们和大量的场景方,把我们的数据产线进入他们的场景里面,回环最鲜活、最真实的数据,这些数据要在仿真里面同时构建出一个数字平行世界,在仿真里面进一步泛化加速训练。二是评测,评测可以告诉模型不仅是哪里会了,更重要的是告诉哪里不会,我们可复现、可量化地评价一个模型,真正发现可以提升的地方,以这种评测促进训练的实现。三是规模部署,重点强调是规模,过去,单一能力的部署所需时间相对可接受,但如果大规模部署,这些场景方不在意模型能力有多强,在意的是多长时间能够部署,成本怎么样,对场景里的干扰有多大,我们采取的方案是在仿真下实现99%的部署,最终1%在真实环境下进行实现,这是我们构建从Data到Eval到Deploy闭环系统,它是全链路打通的。
在这样一个系统里面,我们多次提到一个关键词——“场景”。我们最近在融资,最近的合资公司和深度的战略合作关系中,都加入了很多产业场景方的合作,比如说我们这一轮融资当中,和新希望集团、奥克斯、三安光电等等合作,为什么这么做?其实底层也看到了这块的机会。因为这些场景里面有鲜活的数据,是一个待开采的数据金矿,这些传统厂商非常希望能够参与到具身数据的链路上来,但是它没有这个能力,我们和他们合作在他们场景里面开采人类视频数据,同时把人类视频数据在仿真下平行地数字化构建出来,可以实现一个数据的生成,这个数据可以共享、共用,可以共同supply到市场当中去,这是我们在挖掘传统场景的数据金矿的工作。再就是这些场景方非常希望具身能够进入他们的场景,我们基于这样一个平台,可以在数据以及评测回环的链路上,可以加速具身进入场景和工厂中,能够提升它的智能化水平,我觉得场景是这样一个平台非常重要的一点。
要实现具身规模化部署的需求,光轮通过具身全产业链基建平台,一共是五层。
第一,我们进入场景方的场景里面,真正采集人类视频数据,同时回环它,这里面有很多算法、自动化标注等能力。
第二,我们在仿真去构建环境,通过全栈自研三位一体仿真解决方案,我们的目标是构建一个数字平行世界,和过去的仿真最大的区别就是物理真实,比如互联网上可以获取冰箱的体积、重量、外观尺寸等信息。如果服务的是过去的视觉模型,这类数据已经足够;但如果服务的是具身的物理模型,仅有几何信息是不够的。我们首先有一个全自动化物理测量工厂,去测量世界物理信息,包括材质,它的力的大小,比如说我用自动化手臂去测拉开微波炉的力,不同角度的,包括线缆不同的刚度,对应不同的曲度,这些都是物理信息。世界上存在大量物理信息需要被测量出来,把它构建到仿真去,这个过程形成了物理准确的仿真世界,比如说按下这个遥控器的键之后,这个力是有反馈的,现在大家都关注这个力,我们都在测量力,未来核、磁、光、电我觉得都是需要这样一个更多的测量去构建到仿真中去的。在这个基础上,我们自研的solver(物理求解器)是最底层的解析算法,去支持这样一个仿真能力的实现。
第三,有了这样一个仿真数字平行的世界之后,我们进入了一个仿真数据生成。我们有很多链路,首先是AutoDataGen,我们自动化去生成规模化的数据,量大、多样性也足,但是它缺乏一个具体操作点上的高质量。这个高质量怎么实现?我们通过人的遥操实现,比如说我用100个人去仿真下遥操一个动作,比如说拿起水杯,每个人的角度和方式都不一样。这个多样性是具身最宝贵的一种数据。所以我们在数据生成方面提供的规模化和各种高质量的方式,确保能够生成大规模的数据来源,
第四,模型的能力评测,能够时刻评测它的模型能力在哪儿,我们发布了RoboFinals,这是全球第一个工业级仿真评测平台,里面可以测100项复杂任务。当然我们能力还在不断扩充。
第五,最终在这个行业里面部署,其中仿真是主要的方式,我们在仿真大量的部署、大量测试,然后再到真实环境下进行少量调优,进行实践。
大家关注光轮,问我们是不是数据公司,仿真公司,我们自己的定义是物理AI基础设施公司。我们是一个提供一个基于仿真去做数据生成,也做数据评测,最终加速落地部署的这样一个基础设施公司。我们在仿真技术发展可以用一个最近在GTC宣布的,光轮加入了NewtonTSC技术委员会,前三家是英伟达、谷歌和迪士尼,我们是第四家,而且只有四家。我们参与到这种国际开源的物理仿真引擎的这一动作,也代表我们在这块技术上有足够的钻研和领先。
要做好这一点,需要一个开放的生态。首先,是要和场景方合作,比如我们和1000家场景方合作产生1000万小时的数据,去挖掘数据金矿,去落地部署;同时,我觉得要和上下游合作,这点在海淀是有最大优势的。海淀经常提,比如说政府工作报告,包括“十五五”规划,提到有组织的协同创新,这个事情只有在海淀,也只能在海淀去实现,这里有模型的能力,有硬件,有我们这样一个数据和仿真平台,来支撑这样一个落地部署。这是两方面的这样一种开放的生态。
最终我们要给真正落地部署提供实际的价值,即降本、增效提效,来确保长久的、真正的商业化落地。2026年,我希望通过这样平台的建设,通过广泛的生态合作,能够从demo到真正落地部署,从实验室走向规模化的部署。谢谢大家。
0
第一时间获取股权投资行业新鲜资讯和深度商业分析,请在微信公众账号中搜索投中网,或用手机扫描左侧二维码,即可获得投中网每日精华内容推送。
发表评论
全部评论