【本站讯】计算机视觉(Computer Vision)是人工智能领域的重要分支,旨在让计算机像人一样“看”懂图像和视频,在城市安全、智能驾驶、工业制造等方面具有广泛应用价值。随着移动互联网的快速发展以及各类视频拍摄设备的加速普及,如何“更细、更快、更准”地完成各类视觉任务成为领域发展的重要方向,亟需更高的“算力”来支撑。然而实际应用中,算力始终有限,致使前沿视觉算法难以落地。因此,如何在不损失精度和粒度的前提下,减少视觉任务的算力需求,是攻克领域痛点、加速应用落地的关键,极具研究意义。
鉴于此,我校青岛软件学院、计算机科学与技术学院陈程立诏教授团队以仿生智能为手段,参考视脑交叉、视觉余晖、瞬时记忆等能够使人类在复杂环境中快速、准确地聚焦“重要内容”的生理机制,提出系列仿生视觉显著性方法,大幅改善对复杂环境的感知粒度,提升对重要目标的检测精度,并降低后继高层次视觉任务的算力开销。相关成果已在IEEE Transactions on Pattern Analysis and Machine Intelligence《IEEE模式分析与机器智能汇刊》、IEEE Transactions on Circuits and Systems for Video Technology《IEEE视频技术电路与系统汇刊》、IEEE Transactions on Intelligent Transportation Systems《IEEE智能交通系统汇刊》、IEEE Transactions on Vehicular Technology《IEEE车辆技术汇刊》、IEEE Transactions on Instrumentation and Measurement《IEEE仪器与测量汇刊》、AAAI《人工智能大会》、Science China Information Sciences《中国科学:信息科学》等多个人工智能领域重要刊物和会议发表。相关研究工作得到山东省自然科学基金优秀青年项目、国家自然科学基金面上项目、青年项目、山东省青创团队项目支持。

全景视频导航是类脑视觉研究中的关键应用,旨在通过模拟人类大脑的视觉处理机制,优化沉浸式视频内容的语义表达与导航效率。针对全景视频导航可用监督数据稀缺痛点,团队提出了一种全新的弱监督学习方法,通过模拟人类语义驱动的注意力分配与高阶认知表征过程,精准捕获全景视频内容的语义重要性,构建了能够精准评估和优先排序语义重要性的导航框架,为降低后继高层次虚拟现实应用的算力开销提供了创新理论支持。该研究成果以“Saliency-Free and Aesthetic-Aware Panoramic Video Navigation”为题发表在人工智能领域影响力最高的期刊《IEEE Transactions on Pattern Analysis and Machine Intelligence》。陈程立诏教授是论文第一作者。

在全景视频中,常用的注视收集方式是佩戴头戴式显示器(HMD)自由浏览并记录注视点。但由于用户无法持续旋转头部,采集的数据往往局限于局部视野,难以全面反映整体重要性。为此,团队提出了WinDB(全景视频动态模糊辅助窗口方法),无需HMD即可无盲区采集注视数据,更准确呈现整体重要性。基于WinDB,团队构建了一个全新的大规模数据集,并系统性揭示了频繁且密集的“注视点转移”现象。相关成果以“WinDB: HMD-Free and Distortion-Free Panoptic Video Fixation Learning”为题发表在《IEEE Transactions on Pattern Analysis and Machine Intelligence》上。陈程立诏教授是论文唯一通讯作者。

主流的视觉显著性检测方法常采用弱监督技术来降低学习过程对有标注数据的需求,但面对复杂场景,以人工方式进行像素级标注费时费力,可用于模型训练的数据始终不足。针对这一问题,团队提出了一种轻量级的标注方法——“点”标注——用户仅需要用鼠标在图片上标注几个离散的点,就能达到和传统像素级精细标注近似(98%~99%)的模型训练效果。新方法能够极大地丰富可用监督数据,缓解数据饥渴痛点。相关成果以“Pixel is All You Need: Adversarial Spatio-Temporal Ensemble Active Learning for Salient Object Detection”为题发表在《IEEE Transactions on Pattern Analysis and Machine Intelligence》上。陈程立诏教授是论文唯一通讯作者。

视频异常检测旨在在复杂动态环境中准确识别出异常行为。针对现有方法在处理场景相关异常时普遍存在的泛化能力弱、上下文理解不足的问题,团队提出了一种基于知识图谱的场景-动作解耦与交织模型。该模型通过引入场景与动作解耦机制,分别提取干净的背景场景与人体骨骼动作特征,并构建知识图谱对二者的复杂关系进行显式建模。随后,模型利用特征交织策略融合场景与动作信息,生成更具语义理解的异常评分,同时通过不确定性优化机制,进一步提高了边界样本的检测精度和模型泛化性能。相关成果以“Unveiling Context-Related Anomalies: Knowledge Graph Empowered Decoupling of Scene and Action for Human-Related Video Anomaly Detection”为题发表在《IEEE Transactions on Circuits and Systems for Video Technology》上。陈程立诏教授是论文第一作者。

图像质量评估旨在预测图像在各种失真条件下的感知质量得分。传统研究通常将自然图像与屏幕内容图像分开处理,分别针对其独特的内容与失真特性设计独立模型。然而,由于两类图像在内容组成、失真类型及主观评分标准等方面存在显著差异,现有方法难以实现自然图像与屏幕图像质量评估任务之间的联合提升。针对这一挑战,研究团队提出了一种统一的图像质量评估框架UNI-IQA,通过引入内容感知数据切换模块,首次在自然图像与屏幕图像之间实现了基于内容区域划分的端到端相互促进学习。相关成果以“UNI-IQA: A Unified Approach for Mutual Promotion of Natural and Screen Content Image Quality Assessment”为题发表在《IEEE Transactions on Circuits and Systems for Video Technology》上。陈程立诏教授是论文唯一通讯作者。

RGB-D显著性目标检测(SOD)作为计算机视觉中的重要任务,广泛应用于自动驾驶、交通监控等场景。然而,现有方法模型多基于通用数据集训练,在面对特定交通场景时存在严重的领域偏移问题,导致检测性能显著下降。针对这一挑战,研究团队提出了一种面向交通场景的RGB-D SOD领域自适应方法,通过弱监督方式自动构建高质量的可训练数据集,显著提升模型在特定场景下的检测能力,在常规数据集和实际交通数据集上均取得了优异性能。相关成果以“Adapting Generic RGB-D Salient Object Detection for Specific Traffic Scenarios”为题发表在《IEEE Transactions on Intelligent Transportation Systems》上。陈程立诏教授是论文第一作者。

特征选择是全景导航中的关键步骤,旨在从原始数据中筛选出最相关、最有用的特征,以提升导航性能。团队提出一种任务意识的特征选择模型,该模型利用不同任务倾向特征的类型,构造最优的特征选择方案,并通过分析特征与任务相关性,采用了特征路由机制。此外,根据不同任务和特征的关系,设计了相互自我训练策略,显著提升了模型的性能。相关成果以“SiamTADT: A Task-Aware Drone Tracker for Aerial Autonomous Vehicles”为题发表在《IEEE Transactions on Vehicular Technology》上。陈程立诏教授是论文唯一通讯作者。

全景图像(360°图像)中的物体排序是全景感知与图像检索中的关键问题,旨在对场景中所有物体进行精细化重要性排序。针对现有显著性排序方法仅关注显著物体、忽略非显著重要物体的问题,研究团队提出了一种面向360°场景的“细粒度”重要性排序方法(FOIR-360)。该方法通过局部视角划分与迭代抹除策略生成高质量伪标签,结合局部排名聚合与多标签融合机制,训练出具备端到端预测能力的PanoRank网络,实现全景物体的重要性排序。同时,研究团队制定了新的注释协议,建立了首个细粒度全景排序数据集360Rank,有效促进了任务标准化发展。相关成果以“Fine-Grained Perception in Panoramic Scenes: A Novel Task, Dataset, and Method for Object Importance Ranking”为题发表在《AAAI2025》(国际人工智能大会)上。陈程立诏教授是论文唯一通讯作者。
近年来,陈程立诏教授主要从事仿生视觉显著性方面的研究工作,牵头组建了山东省优秀青年创新团队,承担山东省自然科学基金优秀青年项目,国家自然科学基金面上、青年项目等10余项,以第一或通讯作者发表IEEE/ACM系列汇刊论文45篇、CCFA类(CCF A 类期刊和会议通常代表计算机领域内具有最高学术水平和影响力的出版物)论文29篇,引用3000+,获评第十四届青岛市青年科技奖、山东省人工智能优秀青年奖、山东省人工智能自然科学二等奖、ACM中国新星奖(青岛),连续入选全球前2%顶尖科学家榜单,在仿生智能领域形成了一定的国际影响力。
论文链接:
https://xplorestaging.ieee.org/document/10798616
https://xplorestaging.ieee.org/document/10777547
https://xplorestaging.ieee.org/document/10711208
https://xplorestaging.ieee.org/document/10904424
https://xplorestaging.ieee.org/document/10884860
https://xplorestaging.ieee.org/document/10755105
https://xplorestaging.ieee.org/document/10952378
https://ojs.aaai.org/index.php/AAAI/article/view/32746