马萨诸塞州总医院(Mass General)MESH孵化器创始人兼执行董事马克·苏奇博士(Marc Succi, MD)进行了一项新研究,该研究发表在《医学人工智能杂志》上,探讨了大型语言模型(LLMs),如GPT-4,作为临床医生有价值的工具的潜力。
研究作者、麻省总医院布里格姆创新战略创新领导者马克·D·苏奇博士(Marc D. Succi, MD)及其团队调查了GPT-4在根据患者症状推荐体格检查指令方面的应用。例如,如果患者出现髋部疼痛,GPT-4会生成一份详细的体格检查步骤清单供临床医生参考。
为了评估这些AI生成的指令的质量,三位主治医师对GPT-4针对各种症状的建议进行了评价。他们从准确性、全面性、可读性和整体质量等方面对LLM进行了评分。令人印象深刻的是,GPT-4在所有症状中均获得了高分,至少达到了可能得分的80%。
尽管存在这些局限性,研究结果表明,LLMs在未来医疗保健中具有巨大的潜力。它们可以成为临床医生的宝贵资源,尤其是那些经验较少或在资源有限环境中工作的医生。通过提供全面且准确的体格检查指令,LLMs可以帮助填补知识空白,提高诊断准确性,最终改善患者预后。
“医疗领域的初学者可能由于经验不足或其他情境因素(如资源有限的环境)而在进行适当的个体化体格检查时面临挑战,”高级作者、麻省总医院布里格姆创新战略创新领导者、企业放射学创新与商业化副主任及医工解决方案(MESH)孵化器执行主任马克·D·苏奇博士(Marc D. Succi, MD)表示,“LLMs有潜力作为桥梁,支持医生和其他医疗专业人员的体格检查技术,增强他们在护理点的诊断能力。”
(全文结束)