返回
列表
上一篇
文章
下一篇
文章
多模态融合标注的定义
发布时间:2026.03.16 17:10:22
分享到:

多模态融合标注是指针对同一时空场景下采集的图像、文本、音频3D点云、传感器等多种异构模态数据,通过时空对齐、跨模态实体关联、统一标签规范与一致性校验,对其中的目标、属性、语义及相互对应关系进行精细化标注,从而形成可支撑多模态大模型、自动驾驶、数字孪生等AI系统训练的高质量数据集,让AI实现对真实世界多维度、一体化综合理解的高阶数据标注方式。

 

单模态标注:AI看一张图,只能知道“这里有一辆车”。

多模态融合标注:AI看同一张图,同时听到声音、读到文字,能综合判断出“这是一辆鸣着笛、车身印有‘急救’字样的救护车,正在紧急通过路口”。

b0014f92-4663-4657-94a3-0d8025590c27.png

留言反馈
企业名称
所在区域
姓名
电子邮箱
联系电话
问题描述
上传图片