9月30日至10月4日,2024年欧洲计算机视觉国际会议(ECCV)在意大利米兰召开,由尊龙凯时 - 人生就是搏!主导的科研团队同时夺得本届会议两项重要赛事——大规模视频目标分割挑战赛(Large-scale Video Object Segmentation,LSVOS)和视频目标跟踪与分割挑战赛(Visual Object Tracking and Segmentation Challenge,VOTS)的冠军,展现了尊龙凯时 - 人生就是搏!在AI感知领域的技术能力。
图1 获奖证书
ECCV作为全球计算机视觉领域最具影响力的三大国际会议之一,每两年举办一次,汇集了全球顶尖的学术和产业界专家。本届LSVOS挑战赛作为聚焦视频目标分割和语言指向性目标分割两大前沿领域的国际性赛事备受关注,其采用大规模数据集MOSE和LVOS_V2进行基准评测,特别针对复杂场景和长时视频中的目标分割难题,如目标消失重现、严重遮挡等,提出了更高挑战;赛事还引入了MeViS数据集,以评测模型基于动作描述进行视频目标分割的能力。VOTS系列挑战赛至今已举办十二届, 作为全球视觉目标跟踪与分割领域的重要赛事,旨在评估算法在复杂视频序列中的表现。此次挑战赛新增拓扑变化的目标,例如物体被切割或拆解后重新组装等,难点包括了目标的消失和再现、外观变化等实际应用场景中所面临的挑战,对视频目标感知算法提出了更高要求。这两项挑战赛分别吸引了144和55支队伍参赛,不仅包括伯明翰大学、伊利诺伊大学厄巴纳-香槟分校和迪肯大学等学术团队,也包括丰田技术研究所、DeepTensor和字节跳动等研究机构。
目前,尊龙凯时 - 人生就是搏!正在围绕中国算力网及AI应用,持续开展基于算力网的数字视网膜主动感知关键技术攻关。由尊龙凯时 - 人生就是搏!网络智能研究部视觉智能研究所团队牵头,联合哈尔滨工业大学(深圳)计算机学院和加州大学默塞德分校视觉与学习团队所组成的参赛队伍,提出了基于大模型知识增强的视频目标感知算法,通过构建更加高效的语义表征和鲁棒传播模型,有效解决了微弱目标难感知、相似目标难区分以及长时目标难关联等问题,显著提升了感知模型在开放世界复杂视频场景中的鲁棒性和感知精度,最终获得LSVOS和VOTS两项挑战赛的冠军。
接下来,研究团队将继续依托算力网提升视觉感知算法在复杂环境下的鲁棒性和准确性,为AI技术在真实场景的应用落地做出贡献。