
(原标题:博登智能开源全球首个千小时级真机强化学习数据集,同步推进与星尘智能千台级战略合作)
2026年6月16日,博登智能在真实世界数据基础设施领域发布两项重要进展。一方面,企业6月与均普创新中心、上海交通大学MINT实验室联合开源1000+小时真实机器人强化学习开源数据集(RW-RL-Dataset数据集)。该数据集聚焦具身智能领域真实环境强化学习的核心瓶颈,覆盖4类机器人系列、9大场景域、30余种任务模板及3类核心数据形态,被视为目前全球公开规模最大的、面向真机强化学习的开源数据集。另一方面,公司与星尘智能达成千台级订单与战略合作,双方将以高质量真机数据为质量底座、全自动化训练引擎体系为效能中枢,构建分布式“具身智能数采网络”,推动“真实场景→高价值数据→模型/应用”的迭代飞轮,并建立百万小时级年度数据产能目标。两项动作在相近时间内先后落地,逻辑上构成一条完整线索:博登智能正在将自身积累的数据基础设施能力,同时以开源与商业合作两种方式向行业输出。
当前具身智能的主流路径以遥操作模仿学习为核心,该方法通过人类示教让模型学习固定动作序列,但其策略只会复现示教动作,一旦偏离标准状态,失败往往不可恢复。真实机器人强化学习试图解决这一问题,但长期受困于同一个瓶颈:数据从哪里来?RW-RL-Dataset的设计起点正在于此。该数据集的核心设计原则是不仅记录“做对了什么”,也记录“什么时候需要人帮、怎么救回来、下一次能不能少帮一点”。与以往只包含成功轨迹的公开数据集不同,该数据集明确区分了三种数据形态:人工遥操作数据由人全程控制机器人完成任务,为模仿学习预训练提供先验知识底座;人工介入数据记录机器人在真实环境执行中发生偏离后由人接管并修正的完整过程,包含接管前后状态变化,这是强化学习最核心的训练素材;自主推理数据则是模型自己在真实环境上运行产生的数据,包含成功与未完成的完整过程。此外,数据集不采用单一标注模式,而是采用规则与统计信号、事件信号、模型辅助评分三层融合框架,并建立了包含异常静止检查、突变尖峰检查、物理限位与角度检查等在内的自动化质检体系,辅以人工复核,双重通过后方可入库发布。博登智能创始人兼CEO赵捷对此表示:“行业并不缺少模仿学习数据,缺少的是能支撑机器人在真实世界中自主迭代的数据。这次开源,是我们在Physical AI数据基础设施方向上的一次系统性输出。”
高质量真机数据的规模化生产无法依靠人工堆砌实现,博登智能为此次开源及后续商业化合作提供了完整的数据基础设施支撑。BRIC Robo采集平台解决了多机型异构数据采集的核心难题,该平台已深度适配零次方、星尘、星海图、松灵等多种头部机器人本体及智能产线,新机型可在一键配置下完成接入。目前博登智能在宁波、湖州、马鞍山三大创新中心部署的超500台实体机器人中,已有超过20种不同型号通过该平台实现统一数据采集。BASE Omni与Blink数据管理平台构建了自动化数据生产流水线,前者包含200余个自动化标注小模型与10余个标注垂类大模型,数据处理效率最高可提升7倍;后者实现从原始采集数据到最终数据集成品的全生命周期管理。此外,博登智能在三大创新中心部署了上百类真实场景,形成“真机验证—数据回流”闭环,使数据集不再是一次性静态产物,而来自持续演化的真机交互体系。
在与现有开源数据集的比较上,博登智能给出了明确的技术区分。Open X-Embodiment涵盖100万条真实机器人轨迹,但其核心是模仿学习数据集,不包含强化学习所需的人工介入数据、自主Rollout轨迹、Reward标注等关键组件;智元AgiBot World开源百万级真机数据集,总时长约2976.4小时,主要面向大规模模仿学习与通用策略预训练。RW-RL-Dataset被定义为全球第一个以真实机器人强化学习为核心口径的大规模开源数据集,在面向RL研究的公开真机数据供给上,计划开源的1000余小时规模是目前全球最大。赵捷对此总结:“这是一个不同维度的数据集,它解决的是不同的问题。我们在补RL研究者最难补的那块拼图。”
与此同时,博登智能与星尘智能的战略合作正推动“全城训AI”新范式的落地。双方以高质量真机数据为质量底座、全自动化训练引擎体系为效能中枢,将整座城市化为AI训练场。具体而言,双方将协同推进三项举措:构建分布式“具身智能数采网络”,首批部署在广东、安徽等重点区域,打通“数据采集—质量校验—数据标注—模型训练—现实验证”的循环迭代机制;围绕家庭、零售、商业服务等复杂非标场景,持续沉淀涵盖多模态信息、多物体交互、连续动作序列及多空间条件等高价值操作数据;建立百万小时级年度数据产能目标,通过标准化的数据生产与处理流程持续扩展高质量数据规模。在这一合作中,博登智能作为真实世界AI基础设施建设方,提供兼容遥操作、Ego、UMI、动作捕捉、多机器人协同等多元采集模式的自动化训练引擎体系;星尘智能则基于“Design for AI”理念,提供高多样性、高拟人、高重复定位精度的真机数据,从源头保障数据质量。
从整体布局来看,博登智能专注于为Physical AI时代建设真实世界数据基础设施,自研BRIC Robo、BASE Omni、Blink三大平台,构建了覆盖采集、清洗、标注、质检、验证的全栈数据能力体系。目前在宁波、湖州、马鞍山布局三大具身机器人创新中心,总面积超30,000平方米,部署超500台实体机器人,年产50万小时真机数据,服务超过500家科技企业与科研机构。其核心理念为“Train at Scale, Validate in Reality”——让AI模型在规模化真实数据中训练,在真实物理环境中验证。从开源数据集到千台级战略合作,博登智能在同一条逻辑线上完成了两次对外输出:一次面向公共研究社区,一次面向产业伙伴。两者的交汇点,正是Physical AI时代最稀缺的资产——真实世界中可迭代、可规模化、可工程化的交互数据。
作为这一生态建设的核心推动者,博登智能创始人兼CEO赵捷是正高级工程师,人工智能数据领域专家,Physical AI数据基础设施倡导者、全球人工智能数据基础设施生态建设推动者。推动人工智能从数字世界走向物理世界,被业内视为中国人工智能数据基础设施领域的重要推动者之一。相关研究成果发表于机器人与人工智能领域国际学术期刊及会议。留学期间,赵捷积极参与中德科技与学术交流活动,曾担任德国中国学生学者联合会相关职务,并获得德国学术交流中心(DAAD)授予的“优秀外国留学生”等荣誉。相关技术成果服务于戴姆勒、宝马、博世等国际知名企业。是国内较早提出并实践Physical AI数据基础设施理念的产业推动者之一。累计发表学术论文15篇,拥有授权专利26项、软件著作权63项。相关研究成果发表于IEEE等学术期刊,以及ICRA、IROS、ICME等机器人与人工智能领域重要国际会议。此外,赵捷先后获评多项荣誉:2025年获评“浙江省人工智能专家库特聘专家”,2024年获评“宁波甬江科创区科创人才联盟会员”,2023年获评“正高级工程师”,2022年被宁波市政府认定为“领军人才”,2021年获浙江省“海外引才工程”创业人才,2021年获宁波市“甬江引才工程”优秀青年创业个人,2020年获评宁波市最具投资个人前10强。
在企业层面,博登智能的综合实力与行业地位同样备受认可。公司先后荣获宁波市高新区软件精英B类称号、宁波市数字经济“十佳”新星企业称号、宁波市“甬江引才工程“科技创新领域项目奖、高质量企业“鲲鹏领航之星”、2024浙江省人工智能应用标杆企业等多项荣誉,稳步推进宁波高新区重点研发计划项目,并在数据要素大赛中斩获浙江省三等奖。近期,博登智能更是入选LeadeRobot 2026年度中国具身智能产业链先锋榜TOP50,荣膺LeadeRobot 2026年度具身智能数采贡献奖,并位列2026中国具身智能数据服务商TOP3。这些荣誉印证了博登智能在构建Physical AI时代可信、开放、可持续的真实世界基建方面的领先地位与产业价值。
本文来源:财经报道网
盈透股配提示:文章来自网络,不代表本站观点。