人工智能在临床推理中的前景与陷阱

2025年1月12日00:00
来源:The Daily Star
语言:英语,所在国:美国
分类:科技与健康,字数:625

大型语言模型(LLMs)如GPT-4和Gemini-1.0-Pro正在革新临床推理,展现出专家级的诊断能力。然而,这些工具并非毫无瑕疵,它们反映了挑战人类决策的认知偏差。最近的研究既揭示了其潜力也指出了其在临床实践中的局限性。

一项研究通过向50位医生展示复杂病例,评估了GPT-4对医生诊断准确性的影响,这些医生被随机分配使用标准工具或标准工具加GPT-4(JAMA Netw Open 2024; 7:e2440969)。结果显示,当独立使用时,GPT-4的表现优于人类组,但与标准工具结合使用时并未提升医生的表现。这强调了培训的重要性,以最大化AI在现实世界中的有效性,因为实际情况比书面案例更为复杂。

另一项研究评估了LLMs是否存在认知偏差,测试了GPT-4和Gemini-1.0-Pro在设计用于暴露缺陷的临床情景中的表现(NEJM AI 2024; 1:AIcs2400639)。结果表明,AI存在诸如“框架效应”的偏差,即治疗建议因生存率或死亡率的表述方式不同而变化。类似的,“首因效应”影响了AI的诊断优先级,而“后见之明偏差”则影响了对过去护理的判断。

有趣的是,有时AI的偏差甚至大于人类医生。专家建议医生应采用批判性提问策略来质疑AI生成的结论,例如要求提供替代假设或反对诊断的证据。

随着LLMs成为医疗保健的重要组成部分,严格的评估和深思熟虑的整合对于减轻风险并利用其潜力改善患者预后至关重要。


(全文结束)

7日热榜
感染甲流后有哪些典型症状如何正确应对
甲流来袭!如何有效预防保护自己和家人
专家提醒:长期不出门也难逃甲流侵袭,如何有效防护
甲流高发期,48小时内用药为何如此重要
连续咳嗽不知是否就医看这些判断因素
甲流全身症状明显,你真的了解吗
咖啡过量饮用危害多,你还敢贪杯吗
冬季洗澡有讲究,这些健康原则你get到了吗
自助餐饱腹剂传闻?饱腹感真相是什么
甲流阳性率攀升,疫苗匹配为何药物紧俏预防攻略来了
世界新闻
科克三姐妹凭借医疗辅助应用程序赢得BT青年科学家和技术展览会最高奖
野生黑猩猩适应不同栖息地的基因变化
AI可能在您的下次医生预约中聆听对话
杜克健康与Abridge合作推出临床环境AI
每天一杯牛奶可将结直肠癌风险降低近五分之一
今年减少超加工食品?专家建议从这三类开始
不规律饮食增加肥胖和糖尿病风险:研究
四十岁和六十岁时衰老加速——如何减缓这一过程