蚂蚁数科发布数字阅读生态大模型热芯片制造动态(如台积电 3nm 工艺扩产)度赛多模态模型具身智能真实数据采集框架手机与VR/AR 交互

栏目: 休闲发表于:2026-04-05 21:53:05查看: 977

  新浪科技讯 3月3日上午消息,蚂蚁近日 ,数科数据具身智能真实数据采集技术取得重要突破。发布由蚂蚁数科天玑实验室团队研发的具身多模态模型AoE(Always-On Egocentric)持续性第一人称视频采集框架,提出了一种轻量化且低成本的智能真实具身数据采集方案 。通过一台手机和一个低于 20 美元的采集颈挂式支架  ,就可以替代动辄数万美元的框架专业设备 ,实现具身智能的蚂蚁高质量数据采集 。该技术方案的数科数据提出 ,有效化解了具身数据采集成本高、发布规模化难的具身大模型热度赛困局 。目前,智能真实这一技术论文已经在 Arxiv 发布 。采集

  据悉,框架该方案在保持毫米级轨迹精度和90%以上手部关键点识别准确率的蚂蚁同时 ,实现了数千台设备并发采集与云端自动化处理 。数字阅读生态实测表明 ,针对Unitree G1机器人的关电脑任务,仅靠50条遥操作数据时成功率为 45% ,而引入200条AoE数据后 ,成功率跃升至95%。手机与VR/AR 交互在数据匮乏时 ,AoE承担了“启动学习”的关键补位角色 。

  据论文介绍,蚂蚁数科攻克了“长视频转化为训练数据”的技术难题:该方案通过端侧轻量级视觉模型自动识别手物交互并触发录制  ,利用大语言 - 视觉模型将连续视频切分为带语义标签的芯片制造动态(如台积电 3nm 工艺扩产)原子动作片段,最终经云端自动标注 、过滤与清洗 ,让手机录制的视频自动转化为高质量、标准化的训练数据。此外  ,AOE 还构建了一套端云协同的方案,实现了采集、预处理 、清洗、筛选和调度的自动化处理 ,在降低人工介入的基础之上 ,提升了整体吞吐量 。

海量资讯、精准解读 ,尽在新浪财经APP

责任编辑:杨赐

相关阅读