近日,海南大学计算机科学与技术学院2021级本科生肖萃林同学在生物计算团队张子龙副教授、崔菲菲副教授的指导下,在中科院大类一区期刊International Journal of Biological Macromolecules(影响因子7.7)发表论文,题目为“PEL-PVP: Application of Plant Vacuolar Protein Discriminator Based on PEFT ESiM-2 and Bilayer LSTM in an Unbalanced Dataset”。该论文的共同作者为计算机学院2022级本科生周喆誉、佘嘉怡、尹锦芬同学,通讯作者为张子龙副教授。论文目前已公开发表:https://www.sciencedirect.com/science/article/abs/pii/S0141813024051225
图1PEL-PVP 模型框架图
在本研究中,作者首先构建了一个全新的植物液泡蛋白不平衡数据集UB-PVP,在此之上提出了一种新的植物液泡蛋白预测模型PEL-PVP,其利用Transformer结构和self-attention机制计算序列中残基之间的两两联系,捕捉不同位置氨基酸残基之间的相互依赖和作用关系以提取空间特征信息。并且利用双层LSTM独特的记忆单元设计处理远距离依赖,捕捉更复杂的潜在特征。在ESM-2模型的巨量预训练参数之上,对其再进行液泡蛋白的适应性微调,采用LoRa低秩适配技术有效降低了微调过程中的参数量和计算复杂度。模型性能不论在不平衡数据集还是平衡数据集均优于现有的植物液泡蛋白预测器。
张子龙副教授简历(个人主页:http://www.bioai-lab.com/info/zhangzilong)
张子龙,东京大学计算生物学博士,海南大学计算机科学与技术学院副教授、博士生导师,入选2020年博士后国际交流引进项目,入选海南省“南海新星”第一批人才计划,海南省D类高层次人才。主持国家级及省部级科研课题多项,以第一作者或通讯作者在计算生物学顶刊Bioinformatics、Briefings in Bioinformatics、Computers in Biology and Medicine发表论文多篇。