近日,燧光(广东虚拟现实科技有限公司)明星研发团队X-Lab(aka. Ximmerse Research Lab) 的题为“DeepTag:A General Framework for Fiducial Marker Design andDetection”的研究成果被国际顶级学术期刊IEEETransactions on Pattern Analysis and MachineIntelligence(简称TPAMI)接收为长篇论文。
DeepTag是业界第一个统一框架支持任意类型的人工码,跟踪识别的精度和准度都很出色,而且得益于人工码系统无源的特性,能够快速地附着于各式各样的应用场景中,赋予其6-DoF姿态跟踪的能力。这一研究成果,对赋能混合现实、IOT系统、物联网平台建设等具有重要价值。
TPAMI 是IEEE计算机协会主办的最顶级期刊之一,主要收录计算机视觉、图像理解、模式分析和识别、机器学习等领域的优秀研究成果。根据最新的JCR期刊影响因子排名,TPAMI以17.861的高影响因子,位列计算机领域所有IEEE旗下期刊的首位,同时也是全球AI领域最顶级的期刊!
据了解,目前传统的视觉定位技术往往对环境的纹理有一定的要求,例如纹理必须足够丰富,否则定位就会很不准确。而人工标记码对使用环境无特定要求,即使环境内无任何纹理信息,也不会干扰其定位的精准度,而且只需要单张图片就可以精确恢复出人工标记码和拍摄相机之间的6维姿态信息(也就是经常提到的6-DoF信息,包含3维位置信息和3维旋转信息)。
由于人工标记码较高的鲁棒性,最早广泛应用于机器人定位/导航领域,最近几年随着VR/AR/MR及元宇宙概念的兴起,也得到越来越多的应用。虽然学术及工业界已经提出很多种人工码系统(见下图1示例),但现有的人工码系统或多或少均存在以下几个问题:
基于上述研究背景,燧光提出DeepTag(一种通用的人工码系统)(见图2示例),不但解决了现有人工码系统上述列举到的这些问题外,还具有以下特点:
得益于DeepTag通用的特征点定义和框架学习能力,DeepTag在检测识别(见下图3示例)及定位精准度(详见下表1)上均大幅领先于现有人工码系统。
燧光作为全球顶尖的混合现实行业解决方案专家,已将人工码系统广泛应用于旗下各种产品中,包括外部空间理解和定位、头显及外设的自定位、跨设备交互等方面。
燧光研究团队负责人在接受采访时表示,他们将继续探索视觉定位、物体识别、自然物体交互、多传感器融合、场景重建、交互设计等相关领域的前沿技术,并持续挖掘其在VR/AR/MR领域的应用前景。燧光也乐于并将持续和业界以及学术界分享其最新的成果,致力用领先科技推动VR/AR/MR行业快速发展,为各领域赋能,提升效率,创造价值,在空间计算时代为人机交互开启更多可能性!
END