近日,我院李华副教授课题组在国际顶级会议International Conference on Machine Learning 2024(简称ICML)上发表最新研究论文,题目为“Diving into Underwater: Segment Anything Model Guided Underwater Salient Instance Segmentation and A Large-scale Dataset”。ICML是中国计算机学会推荐的A类顶级国际学术会议,在全球范围内的人工智能和机器学习领域享有极高的学术声誉。
该论文的第一作者为海南大学计算机科学与技术学院2020级本科生连仕杰,共同第一作者为海南大学计算机科学与技术学院2019级毕业生张紫祎,皆为李华副教授计算机视觉课题组的学生。通讯作者为李华副教授。该论文提出了首个通用水下图像显著性实例分割数据集,同时还首次设计了用于复杂水下环境中的显著性实例分割的算法,具有以下两大创新点:
1. 该论文为水下显著性实例分割任务构建了首个大规模数据集,名为USIS10K。USIS10K数据集中包含了10632幅图像在7个类别上的逐像素级标注,并且同时包含了同一张图像的类不可知显著性实例掩码标签和多类别显著性实例掩码标签。
图一USIS10K数据集示意图
2. 该论文首次尝试将交互式分割模型Segment Anything应用于水下显著性实例分割任务中,并提出了USIS-SAM模型,旨在提高复杂水下场景的分割精度。在USIS-SAM模型中,设计了水下自适应ViT编码器(Underwater Adaptive ViT Encoder),通过嵌入到网络中的Adapter模块为网络动态引入水下视觉知识;并设计了显著性特征提示生成器(Salient Feature Prompt Generator),引导网络定位水下环境中的显著性区域,从而进行端到端的高精度分割。
图二USIS-SAM模型集示意图
多组对比实验结果表明,USIS-SAM模型在USIS10K与SIS10K数据集上与最先进的显著性实例分割方法相比时,在测评指标上处于领先地位,实现了优异的性能。
李华副教授自2021年入职以来人才培养成果显著,此前还指导本科生连仕杰同学发表ICCV(CCF A类会议)论文1篇,指导硕士生发表了ACM MM(CCF A类会议)、IEEE Transactions on Multimedia(中科院SCI一区)论文等。此外,李华副教授由于在海洋视觉计算领域近两年取得的突破进展,于今年受邀担任IEEE旗下海洋工程领域顶级期刊IEEE Journal of Oceanic Engineering副主编(中科院SCI二区),亚太信号与信息处理协会 图像、视频与多媒体(APSIPA IVM)技术委员会委员。该论文成果的录用也标志着我院本科生人才培养取得新突破。