近期,海南大学段会龙团队联合荷兰埃因霍温理工大学研究团队报道了一种基于坐标平面的最优“对齐”计算的算法。海南大学生物医学工程学院燕辉博士为第一作者,南山副教授为通讯作者。本论文由荷兰飞利浦智慧之桥项目资助。在该论文中,团队研究人员针对医疗过程挖掘领域中长期难以兼具“高效性”与“最优性”的挑战,通过将最优匹配的计算问题转化为坐标平面上的最短通路问题,用严密的数学推导证明了两者在理论上的完全等价,实现了兼具最优和最高效的寻找对齐的算法。此项研究成果以“Computing alignments with maximum synchronous moves via replay in coordinate planes”为题发表在《Information Sciences》(IF=8.233)上。
医疗过程挖掘领域是医学信息学的一个重要分支。医疗过程挖掘中的遵从性检测旨在将真实诊疗数据与规范的医疗流程进行对比,发现遵从与偏差及其原因,进而提高医疗服务的质量。长期以来,遵从性检测技术面临难以兼具“高效性”与“最优性”的挑战,即最优的对齐问题是个NP难的计算问题。海南大学段会龙团队将真实诊疗数据看作坐标平面上的横轴,将规范的医疗流程看作坐标平面的纵轴(图1.(a)),二者间的匹配就是沿对角线方向上的移动,二者的偏差就是单一方向(延横轴或延纵轴)上的移动。从原点到终点的一条通路就是一个对齐。一方面,最优的对齐应有数目最多的“沿对角线上的移动”;另一方面,最优的对齐应该具有可高效计算的特点。考虑到经典的最短通路问题已经具有高效的算法(如Dijkstra算法),因此,将最优对齐转换为求最短通路的问题就能解决高效且最优的对齐计算问题。
图1 (a)基于坐标平面的最优对齐算法示意图(横轴为历史事件数据,纵轴为过程模型)。
(b) BPMN语言描述的临床路径案例。
(c) 真实世界数据与临床路径模型的最优对齐的匹配数目。
该研究不仅解决了高效计算最优对齐的问题,还打破了遵从性检测技术长期局限于一种建模语言的困境——将适用范围扩展到几乎所有具有执行语义的流程语言。例如,已广泛应用于医疗领域的BPMN语言。该团队提出的这种适用性广且高效的算法,在回答了真实世界数据中“谁”在“哪里”发生了“什么偏差”的基础上,为进一步 “为什么”的分析提供了基于海量、真实世界数据的可能。
文章信息:
全文链接:https://www.sciencedirect.com/science/article/pii/S0020025522004091?via%3Dihub