OpenAI的模型正确诊断了80%的医疗案例，相比之下人类医生仅为30%

2024年12月30日

来源：officechai.com

语言：英语，所在国：美国

分类：科技，字数：726

数学和编程迅速被AI超越，现在看来医学也可能是下一个被颠覆的领域。据一篇研究报告显示，OpenAI的o1-preview模型在疾病诊断方面大幅超越了人类医生。这篇题为“大型语言模型在医师推理任务中的超人表现”的论文比较了人类医生和OpenAI的o-1模型在临床病例诊断准确性方面的差异，该模型采用链式思维推理。在特定测试中，o1-preview模型成功诊断了大约80%的病例，而GPT-4的准确率为约60%，人类医生的准确率仅为30%。

论文表示：“我们评估了o1-preview模型在五项不同实验中的医学推理能力，并将其与人类基线和GPT-4的历史对照进行了比较。”论文补充道：“正如在非医学研究中所见，o1-preview在大多数任务上表现出显著的性能提升。对于鉴别诊断生成，o1-preview不仅超过了GPT-4和以前的非LLM鉴别诊断生成器，还超越了人类基线。”

该研究使用了多种不同的医疗案例来测试模型的表现。这些病例输入到模型中，模型随后给出诊断结果。诊断结果由人类医生评分，以确定模型的诊断是否准确。研究人员在查看结果后，称AI模型的表现为“超人”。

医学领域似乎很容易受到AI的冲击。现代医生通常通过查看实验室报告和听取患者的症状来进行诊断和治疗方案的选择。所有这些数据都可以输入到大型语言模型（LLM）中，而现代LLM似乎已经能够正确解析这些数据，并利用其丰富的数据库进行诊断。此外，AI系统在解读X光和其他影像报告方面也变得极其熟练，可以兼任放射科医生。目前的结果表明，在不久的将来，大多数医生可能会配备一个LLM来辅助他们的诊断工作。如果这些LLM能够产生良好的结果，它们可能会逐渐取代许多医生的工作。

(全文结束)

7日热榜: 感染甲流后有哪些典型症状如何正确应对; 甲流高发期，48小时内用药为何如此重要; 甲流来袭！如何有效预防保护自己和家人; 连续咳嗽不知是否就医看这些判断因素; 咖啡过量饮用危害多，你还敢贪杯吗; 自助餐饱腹剂传闻？饱腹感真相是什么; 冬季洗澡有讲究，这些健康原则你get到了吗; 甲流全身症状明显，你真的了解吗; 白桦树汁被吹上天，购买是智商税吗; 《中国科学家CAR-T疗法突破，自身免疫病治疗迎新希望》

世界新闻: 含糖饮料与全球数百万糖尿病和心脏病新病例相关，研究发现; 独特的AI通过结合医学图像和文本预测癌症预后和治疗反应; 大脑如何过滤感官噪音以做出更好的决策; Grove利用AI缩短临床试验入组时间; 诺和诺德与Valo Health扩大合作，签署高达46亿美元的人工智能合作协议; 2025年临床试验趋势：投资逆风、可穿戴设备和针对性AI应用; 人工智能技术助力全球抗微生物耐药性努力; CES 2025：迄今为止最令人惊叹的五大发布