医学本体学习框架用于研究失眠障碍的白天功能障碍及其治疗效果

2025年2月28日
来源:Nature
语言:英文,所在国:美国
分类:科技与健康,字数:7906

摘要

背景

在医学本体中,尤其是在广泛使用的分类系统如国际疾病分类(ICD)中定义精神健康障碍时,常常会出现特异性挑战。本研究旨在通过引入疾病特异性医学本体学习(DiSMOL)框架来解决这些挑战,该框架旨在从临床医生笔记中生成精确的疾病表示,重点是失眠障碍中的白天功能障碍。

方法

研究应用了疾病特异性医学本体学习框架来更好地表示白天功能障碍。该框架的性能与失眠专家选择的ICD代码进行了比较。关键统计方法包括敏感性和F1分数的比较,以及使用各种药物(包括苯二氮卓类、非苯二氮卓受体激动剂和曲唑酮)后症状变化的分析。

结果

DiSMOL框架显著提高了对失眠患者白天功能障碍的识别能力。与专家选择的ICD代码相比,敏感性从17%提高到98%,F1分数从28%提高到86%。此外,该框架揭示了使用苯二氮卓类药物后白天功能障碍症状显著增加(18.9%),而传统的ICD代码未检测到任何显著变化。

结论

研究表明,DiSMOL在识别特定疾病方面(如失眠中的白天功能障碍)比传统编码系统更为准确。这些发现突显了专门本体在增强现实世界临床数据的表示和分析方面的潜力,对医疗政策和个性化医学具有重要意义。

通俗语言摘要

本研究介绍了一种改进的方法,用于从医疗记录中识别患有精神健康状况(特别是失眠)的人的具体症状。传统的分类系统往往无法准确捕捉白天功能障碍等问题。这使得正确评估和比较给予患者的治疗方法的有效性变得困难。我们开发了一个计算框架,可以更精确地分析医疗记录以识别这些症状。我们的计算方法优于传统方法,提供了一种更准确的方式来检测失眠患者的白天功能障碍。使用这种方法可以促进对失眠的更准确研究,并可能加速失眠和其他精神健康状况的治疗方法的开发和准确评估,从而改善患者的治疗结果。

引言

在医学中,本体是指通过定义的医学术语来实现清晰无歧义的交流的形式化医学概念表示,通常使用国际疾病分类(ICD)代码。医学本体的发展是严格且漫长的,涉及知识工程师和医生的合作。尽管如此,医学本体往往缺乏特定疾病的特异性,并受到行政过程的影响。最近自然语言处理的进步和大量语义丰富的医学信息的可用性催生了本体学习领域。本体学习涉及从文本中半自动识别和提取关键概念,以构建本体,并可以提高疾病表示的准确性。

现实世界的数据现在被广泛用于评估疾病负担、治疗效果和安全性。与受控临床试验不同,研究人员在现实世界研究中缺乏对数据报告的控制和指导。此外,现实世界证据研究经常缺乏关于所选本体可靠性的透明度,需要对所使用的本体进行更严格的评估。在这里,我们介绍了疾病特异性医学本体学习(DiSMOL)框架,这是一种创新的本体学习方法,其中现有本体通过现实世界数据得到丰富并经过仔细评估。DiSMOL利用医生笔记扩展医学本体,提供了对现实世界报告实践和医疗保健提供者语言使用的直接访问。该方法涉及深度表型,特别是在系统地描述和学习疾病症状方面。然而,重要的是要认识到,我们的工作不仅仅是症状记录。通过将这些症状纳入现有的知识库,我们实际上是在进行一种本体学习,扩展和细化这个已经具有特定结构框架的知识库。

为了展示DiSMOL的潜力,我们应用该框架来检查失眠障碍患者中白天功能障碍的负担,这是全球最常见的睡眠障碍。白天功能障碍是失眠诊断的必要特征,并且是一个非常重要的方面,需要为受影响的个体解决。改善白天功能已被确定为失眠障碍患者最重要的治疗属性。尽管对于失眠患者来说非常重要,但很少有症状被编码为白天功能障碍。因此,DiSMOL旨在尽可能多地识别真实的白天功能障碍症状,同时尽量减少虚假症状的包含,以准确表示失眠障碍的这一关键方面。在本文中,我们表明DiSMOL能够比ICD-10代码更敏感地检测失眠患者的白天功能障碍症状。此外,该框架揭示了使用苯二氮卓类药物后白天功能障碍症状显著增加(18.9%),而传统的ICD代码未检测到任何显著变化。

方法

数据来源和预处理

为了开发疾病特异性语言模型,我们访问了HealthVerity纵向存储库中的190万患者的数据。这包括来自未公开提供商的医疗保险索赔数据,以ICD-10代码表示,以及来自Amazing Charts LLC的自由文本形式的医生笔记。根据HIPAA规定,本研究使用的所有数据都是去标识化的,不包含任何个人身份信息。因此,初始数据库设置和由此产生的研究数据不需要机构审查委员会(IRB)批准,因为去标识化数据的分析不构成人类受试者的研究。同样,由于数据的去标识性质,也不需要知情同意。

在190万患者中,考虑了82,722名被诊断为失眠(补充表1)并且至少有一份医生笔记(总共486,885份就诊笔记)的数据,并将其分为82,672名患者的模型训练集和50名患者的测试集。两个集合按年龄和性别分层。仅考虑主诉、系统回顾、体检、评估和现病史的信息。与既往病史相关的数据被丢弃,因为它可能包含与失眠无关的疾病信息。

使用简单的本体作为模型输入

失眠白天症状和影响问卷(IDSIQ)被用作定义疾病特异性语言模型输入的起点(称为简单本体)。IDSIQ是一种患者报告的结果工具,由14个项目组成,每个项目是一句描述患者感知到的白天功能障碍症状的句子,这些项目由失眠专家(补充方法失眠专家)分为三个领域(认知、情感、身体)。虽然可以考虑不同的工具或知识库,但失眠专家选择了IDSIQ,因为它全面描述了白天功能障碍的症状。为了补充患者报告的症状,两名失眠专家提供了他们在临床实践中常用的白天功能障碍术语,以描述患者报告的症状。虽然“困倦”、“疲倦”、“昏昏欲睡”和“疲劳”等词对患者有不同的含义,但不能假设非失眠专家的临床医生也是如此。为了考虑到非睡眠专家可能使用的异质语言,失眠专家提供的术语以及原始的IDSIQ项目被用作输入(称为简单本体),通过DiSMOL框架找到上下文相似的词(图1,补充数据1)。

图1:疾病特异性医学本体学习(DiSMOL)框架

疾病特异性语言模型在医生笔记上进行训练。已知的症状,由失眠专家或现有工具提供的信息形成简单本体,作为输入到模型中以找到上下文相似的词。生成的丰富本体随后由专家小组验证。然后,经过验证的丰富本体被用来将医生笔记转换为结构化数据,从而能够调查疾病负担。

学习疾病特异性模型

DiSMOL使用了Word2vec和超参数优化。超参数空间(补充表3)限制在推荐范围内,并使用Beam等人启发的指标对模型进行优化。该指标涉及创建一个具有已知关系的失眠症状对列表(补充数据4),为每个标记分配一个语义类型,随机抽取10,000个语义超类型的标记(补充表5),并计算每对标记的余弦相似度。由此产生的余弦相似度分布用于评估模型,指标是95百分位余弦距离分布内已知关系的比例。

八个模型,分别在不同的自助样本上使用最佳性能的超参数配置进行训练,被用来创建一个集成模型。这涉及在八个模型中平均标记之间的距离,以减少由于数据的小变化而导致的近邻变化,并初始化模型权重。为了评估预训练语言模型与疾病特异性模型的适用性,评估了流行的模型,如双向编码器表示法变换器(BERT)以及疾病特异性Word2Vec集成模型。疾病特异性模型(补充表2)在五次独立运行中的中值性能方面比BERT提高了83%(表1),增强了下游任务的性能。

通过疾病特异性模型丰富本体

随后,通过从疾病特异性语言模型中检索附加术语来丰富简单本体。仅检索那些在余弦距离分布中位于0.963百分位的对(x: 项目或相应的失眠专家同义词,y: 检索到的Word2vec术语),并且只有那些语义超类型为白天功能障碍的术语被保留(补充表5)。此外,这些词必须出现在至少0.24%的所有患者中,并且通过medspaCy ConText算法确定具有明确的语义方向性。剩余的425个术语进一步由失眠专家调查,并删除了不描述白天功能障碍的词语,最终得到109个词语(补充数据2)。我们承认这些术语的验证率约为25%。对于最终被丢弃的术语,我们的分析显示,虽然它们不符合纳入最终数据集的标准,但许多与感兴趣领域松散相关,但缺乏必要的特异性或与本研究定义的白天功能障碍的直接相关性。需要澄清的是,该系统并不是为全自动使用而设计的;相反,它是为了帮助专家提供更广泛的潜在术语以供进一步审查而开发的。最后,对白天功能障碍本体进行了词汇一致性检查(即,具有相同词元的词在所有领域或没有领域都存在)。

通过遵循DiSMOL方法,失眠专家的语言得到了丰富,纳入了大量医疗保健提供者和非睡眠专家使用的术语,而无需进行耗时的问卷调查。此外,由于这种方法使用的是在用于研究目的之前由医疗保健提供者撰写的医生笔记,因此不会出现霍桑效应的潜在偏差,从而提供了日常临床实践中语言使用的表示。最后,由于最小的人工干预(图1),该方法突出了可扩展性和应用于其他疾病的可能性。

在文本数据上推断白天功能障碍本体

本体被用来从医生笔记中识别术语,表示患者在特定就诊时存在白天功能障碍。使用medspaCy ConText算法来测量术语的正确语义方向性。只有当一个词具有正确的语义方向性时,才会确认存在白天功能障碍症状。例如,“开心”不会构成障碍,但“不开心”会被识别为障碍。在患者与医疗保健提供者的会面水平上评估是否存在障碍。如果一次会面中存在一个或多个白天功能障碍症状,则认为该会面存在障碍。不考虑特定会面中的障碍数量。

本体评估

通过与基于ICD-10代码的两个基线表示进行比较,评估了丰富后的失眠白天功能障碍本体的准确性。第一个表示(ICD-clin)使用了失眠专家选择的一组ICD-10代码(补充表4)。对于第二个表示(ICD-clin-DiSMOL),失眠专家将ICD-10代码与DiSMOL框架生成的症状相匹配(补充数据3)。为了生成我们的基准数据,失眠专家根据测试集中50名患者的108份医生笔记中标注了医生报告的白天功能障碍症状的存在或缺失情况,涵盖三个领域:认知、情感和身体。使用敏感性、精确度和F1分数评估了ICD-clin、ICD-clin-DiSMOL和DiSMOL与基准数据的匹配能力。

治疗效果估计

为了比较ICD-clin、ICD-clin-DiSMOL和DiSMOL在量化失眠患者中白天功能障碍症状数量方面的能力,确定了三组不同的患者群体,基于所使用的治疗方法:曲唑酮、苯二氮卓类(包括艾司唑仑、氟西泮、劳拉西泮、喹唑泮、替马西泮、三唑仑)和非苯二氮卓受体激动剂(非BzRAs)(包括艾司佐匹克隆、扎来普隆、唑吡坦)。在最初确定的82,722名患者中,仅包括在治疗开始前6个月内被诊断为失眠且基线时年龄≥18岁的患者。排除标准包括失眠诊断日期在治疗开始前超过6个月、姑息治疗、活动性恶性肿瘤或怀孕。患者在首次接受失眠药理治疗前回顾性随访182天(6个月),并在治疗期间平均随访3个月。为了估计治疗效果,测量了接受曲唑酮(n = 1522名患者)、苯二氮卓类(n = 1045名患者)和非BzRAs(n = 2361名患者)治疗前后白天功能障碍症状数量的组内相对差异。在计算治疗效果时,对治疗开始日进行了删失。使用双侧t检验计算了治疗前和治疗后结果差异的统计显著性。应用了Benjamini-Hochberg程序的多重假设检验假发现率(FDR)校正。通过计算每100患者年报告的症状数量减去基线期每100患者年报告的症状数量来计算效应估计。CI <0.05被认为是统计显著的。

尽管三个研究人群的基线特征是可比的,除了精神共病在非BzRA组中较少见(表2),但研究设计不允许在不同治疗方法之间进行比较,因为对混杂因素的控制仅适用于特定人群。

结果

白天功能障碍本体

如方法所述,我们将丰富后的失眠白天功能障碍本体与基于ICD-10代码的两个基线表示进行了比较。丰富后的本体被用来将医生笔记转换为结构化数据,以识别患者就诊期间白天功能障碍症状的存在(见图1)。正如预期的那样,由于人类语言的模糊性,DiSMOL揭示了物理领域与认知和情感领域之间的白天功能障碍症状的重要重叠(图2)。诸如“头晕”、“疲倦”、“虚弱”、“嗜睡”和“困倦”等症状在物理和认知领域之间共享,而“抑郁”、“抑郁症”和“疲劳”等症状则在物理和情感领域之间共享。有趣的是,“疲劳”是唯一与所有三个领域相关的症状,成为情感领域与其他领域症状之间的纽带。

图2:白天功能障碍本体

经过验证的丰富本体的示意图,突出显示了白天功能障碍症状与领域的关系,并用紫色着色。值得注意的是,与物理领域相关的症状用浅蓝色视觉突出,强调了它们与其它领域的显著重叠。认知领域表现出最大的相关症状阵列,其次是物理领域。灰色圆圈:DiSMOL来自认知或情感领域的同义词;紫色圆圈:领域名称;浅蓝色圆圈:DiSMOL来自物理领域的同义词

本体评估

尽管本体的精确度表现相似,但DiSMOL在敏感性方面显示出显著提高,从17%提高到98%,增加了476%,F1分数也显著提高,从28%提高到86%,提高了207%,与ICD-clin相比。当使用ICD-clin-DiSMOL与ICD-clin相比时,敏感性从17%提高到51%,表明失眠专家可以通过纳入DiSMOL指示的更广泛症状来改进他们的代码选择(图3)。ICD基准灵敏度降低表明保险索赔中可能低估了白天功能障碍。在这种情况下,DiSMOL是最准确的衡量白天功能障碍症状的方法。有趣的是,纳入与患者相关的症状并未损害DiSMOL相对于ICD-clin的精确度。这可能表明,对患者重要的症状对临床医生也很重要,这一点值得进一步研究。

图3:本体性能比较

此条形图展示了三种方法——ICD-clin、ICD-clin-DiSMOL和DiSMOL——在三个关键性能指标上的比较:敏感性、精确度和F1分数。DiSMOL在敏感性(98%)和F1分数(86%)方面表现出最高性能,而ICD-clin在精确度(78%)方面略高。ICD-clin-DiSMOL在所有指标上表现中等,敏感性达到51%,精确度达到72%,F1分数达到60%。图3的源数据在补充数据5中。DiSMOL:疾病特异性医学本体学习,ICD:国际疾病分类。

治疗对白天功能障碍的影响

在缺乏随机临床试验的情况下,我们研究并比较了ICD-clin、ICD-clin-DiSMOL和DiSMOL在量化曲唑酮、苯二氮卓类和非苯二氮卓受体激动剂(非BzRAs)对失眠患者白天功能障碍症状数量的影响。这些催眠药被选为最常用的睡眠药物,但也可能导致干扰患者白天功能的不良事件。褪黑素未包括在分析中,因为很难了解具体使用哪种褪黑素产品,并且非处方制剂可能未被报告。在使用苯二氮卓类、曲唑酮和非BzRAs治疗期间与治疗前相比,白天功能障碍症状的数量在DiSMOL和ICD-clin之间有所不同。与治疗前相比,使用苯二氮卓类药物与所有领域(‘总体’)的白天功能障碍症状显著增加(18.9%,P = 0.021),但ICD-clin未观察到显著增加(-3.3%,P = 0.867 [不显著 (ns)])。DiSMOL与ICD-clin在情感(26.3%,P = 0.016 vs -13.2%,P = 0.866 [ns])和物理(20.9%,P = 0.032 vs -11.1%,P = 0.866 [ns])领域观察到了类似的结果,但在认知领域(6.9%,P = 0.793 [ns] vs -3.3%,P = 0.867 [ns])未观察到类似结果(表3)。接受曲唑酮治疗的患者在治疗期间与治疗前相比,总体白天功能障碍症状显著增加(53.5%,P = 0.014),而DiSMOL未观察到显著效果(9.0%,P = 0.094 [ns])(表4)。ICD-clin与DiSMOL在认知(53.5%,P = 0.014 vs 4.4%,P = 0.465 [ns])、情感(49.9%,P = 0.018 vs 12.9%,P = 0.071 [ns])和物理(50.1%,P = 0.018 vs 7.0%,P = 0.237 [ns])领域观察到了类似的结果。与治疗前相比,使用非BzRAs与所有表示中的白天功能障碍症状显著增加相关(DiSMOL:16.0%,P = 0.001;ICD-clin:43.5%,P = 0.002),并在每个领域(认知:16.1%,P = 0.003 vs 43.5%,P = 0.002;情感:21.6%,P = 0.001 vs 43.0%,P = 0.002;物理:11.8%,P = 0.016 vs 43.2%,P = 0.002)(表5)。

讨论

在我们的研究中,DiSMOL框架显示了苯二氮卓类和非BzRAs导致白天功能障碍症状的增加。仅使用ICD-10代码可能会高估非BzRAs相关的白天功能障碍,并记录苯二氮卓类导致的非显著减少的白天功能障碍症状。此外,DiSMOL框架未检测到曲唑酮导致的白天功能障碍症状增加,而使用ICD-10代码则测量到了这种增加。有趣的是,尽管苯二氮卓类主要针对情绪障碍(如焦虑和恐慌发作),但使用DiSMOL并未观察到失眠患者在情感领域有任何改善。值得注意的是,失眠可能会加剧焦虑和恐慌障碍,反之亦然,焦虑和恐慌障碍也可能导致失眠的发展或持续。因此,单独解决一个条件可能不足以完全管理两者之间的相互作用,需要更全面的治疗方法。需要注意的是,本分析中将具有不同半衰期的苯二氮卓类和非BzRAs归为一类,因此整个类别的结果可能因不同药物而异。

本研究介绍了DiSMOL框架,这是一种通过真实世界数据和深度表型丰富医学本体的创新方法。我们的结果表明,从医生笔记中学习的疾病表示比失眠专家选择的ICD-10代码更能区分白天功能障碍患者。DiSMOL框架具有可扩展性,可能适用于各种疾病,并且在精确描绘疾病负担方面表现出色。然而,本研究也存在某些局限性。由失眠专家主导的验证过程可能会引入主观偏见,因为它基于医疗专业人员对患者描述其疾病感知的解释。此外,验证仅在50名患者中进行,这可能会限制模型性能的普遍性。需要注意的是,仅关注失眠障碍限制了框架在其他医疗条件下的转移性,需要进一步验证。依赖医生笔记进行本体丰富也会带来数据质量和完整性方面的挑战。此外,设计限制使我们无法直接对比不同治疗方法。随时间变化的变量和先前治疗的遗留效应可能会影响组内分析的效果估计有效性。缺乏临床研究作为结果锚点也值得一提。

总之,据我们所知,DiSMOL框架提供了一种从医生笔记中学习疾病特异性本体的新方法。DiSMOL在区分白天功能障碍患者方面优于失眠专家选择的ICD-10代码。此外,DiSMOL揭示了治疗后白天功能障碍症状表示的差异,突显了疾病特异性本体的重要性,特别是在睡眠障碍中。采用以真实世界数据驱动的方法,如DiSMOL,有望增强我们对疾病负担和治疗效果的理解。这反过来可能有助于制定基于证据的政策制定,并最终改善患者结果。


(全文结束)

7日热榜
微嵌合现象:最新研究揭示父亲的细胞如何在分娩后留在母亲体内
甘氨酸镁的最佳服用时间以获得最大益处,据科学所说
艾滋病预防新曙光:来那卡帕韦有望2025年上市,100%有效率保护年轻女性
滥用激素眼药水致6岁女童患上青光眼,家长需警惕
50岁大叔戒烟狂吃瓜子胸部变大,戒烟该咋选替代品?
服用多少布洛芬才算过量?
为什么你总是特别容易紧张?科学揭秘背后原因与应对方法
甲流一周内可能发展成病毒性肺炎?这些症状要警惕
洗完头发到底该吹干还是自然干?看完你就懂了!
2025年将改变医学的十项技术
世界新闻
揭示GLP-1药物的全面副作用
不受监管的大规模语言模型产生类似医疗设备的输出
blueBriX推出医疗AI代理市场,以变革医疗自动化
独家采访 | 人工智能是工具而非教师,可以指导但不能替代临床推理:D·纳格什瓦尔·雷迪
新AI模型通过更快、更智能的预测改善医疗决策
坚果与IBD风险;AI筛查肝病;诺如病毒疫苗初显希望
Sheba医学中心与Tethis合作推进直肠癌液体活检的AI技术
微生物组诊断市场关键企业分析-养乐多本社株式会社、AOBiome、Enterome Biosciences SA、Metabiomics Corp.