AI能否成为你的心理医生？研究显示ChatGPT在关键领域优于专业人士

2025年2月17日

来源：News-Medical

语言：英语，所在国：美国

分类：科技与健康，字数：1402

研究人员探讨了AI辅助心理健康护理的影响及心理治疗的未来。

在最近发表于《PLOS Mental Health》的一项研究中，研究人员调查了人类是否能区分由专家心理医生和ChatGPT-4生成的夫妻治疗回应。

“机器能否思考？”是图灵在二战后提出的一个简单问题。自20世纪中叶以来，技术已经显著进步，越来越多的证据表明生成式人工智能（GenAI）在心理治疗中有帮助。

此外，最近的研究揭示了GenAI在心理治疗中的辅助或独立解决方案中的有希望的效果。最新的报告指出，AI可以以同理心的方式撰写内容，这些内容得到了心理医生的高度评价，并且表现优于专业人士。

在这项研究中，研究人员调查了一个小组参与者是否能区分来自夫妻治疗专家和ChatGPT的回应。

首先，招募了具有咨询心理学、临床心理学、精神病学和婚姻家庭治疗高级学位的专家。专家被随机分配接收两组夫妻治疗案例之一，并在一个月内完成对案例的回应。

完成后，一组专家对另一组专家的三个最有可能成功的回应进行了排名。接下来，ChatGPT-4被要求用单个提示生成回应。该提示定义了专业性、同理心、治疗联盟、疗效和文化胜任力。ChatGPT-4的回应也由作者进行评分。

最好的案例被选出来与人类专家的竞争。然后，最好的回应被汇总并分发给一个多样化的个体小组作为调查。这个样本代表了美国人口。受访者被随机分配接收来自心理医生或ChatGPT-4的消息，并被要求评估其与共同因素的一致性，并猜测作者是ChatGPT还是人类心理医生。

共有13名拥有至少五年经验的心理医生构成了专家小组，其中大多数有夫妻治疗背景。调查受访者包括830名平均年龄为45岁的个人，其中50.6%为女性，47.9%为男性，0.2%为非二元性别。近60%的人处于恋爱关系中，18%的人曾参与过夫妻治疗。

此外，49.4%的受访者是非西班牙裔白人，18.8%是黑人，16.8%是西班牙裔白人，5%是亚裔等。受访者在识别ChatGPT和心理医生的回应方面表现不佳，他们正确识别心理医生的几率仅比识别ChatGPT高出5%。ChatGPT的回应在所有治疗共同因素上的评分都高于心理医生的回应。

此外，ChatGPT的回应更可能被认为是富有同理心、文化胜任力强且更具连贯性的。那些认为回应来自心理医生的参与者对其评分更高，而认为来自ChatGPT的参与者对其评分较低。这促使研究人员进行了额外的事后分析，结果显示明显的归因偏差，即参与者对归因于心理医生的案例反应更为积极。

研究人员还比较了心理医生和ChatGPT回应中的词性差异和情感倾向。ChatGPT生成的回应更长，情感更积极，名词、形容词、动词、代词和副词更多。即使控制了回应长度，ChatGPT的回应中仍包含更多的形容词和名词，但动词、代词和副词的数量相似。

ChatGPT和心理医生的回应准确识别率仅略高于随机猜测，这支持了图灵的预测（即人类无法区分机器和人类的回应）。此外，ChatGPT在所有治疗共同因素上的评分均高于人类回应。

研究的局限性包括有限的案例数量、仅使用一个提示生成GenAI回应以及有限数量的专业心理医生，包括少数几位夫妻治疗师。

鉴于GenAI可能被纳入治疗环境的可能性，心理健康专家需要了解机器学习，提高在该领域的技术素养，并确保对这些模型进行谨慎的培训和监督。

(全文结束)

7日热榜: 甲流一周内可能发展成病毒性肺炎？这些症状要警惕; 想要健康好睡眠？这些调整作息的方法超有用; 掌握这些入睡法，让你轻松告别失眠一觉到天亮！; 想变白？吃对食物+好作息，一起冲！; 甘氨酸镁的最佳服用时间以获得最大益处，据科学所说; 服用多少布洛芬才算过量？; 为什么你总是特别容易紧张？科学揭秘背后原因与应对方法; 2025年流感高峰来袭！如何应对这波感染潮; 身上长出这5种瘊子？可能是HPV感染，早发现早治疗很重要; 跑步减肥最少跑多少公里才有效？一文讲清！

世界新闻: 研究揭示运动如何对抗压力引起的高血压; 研究提出治疗脆性X综合征的新分子策略; Insilico Medicine研究揭示TNIK抑制作为有前景的抗衰老策略; 班塔姆制药宣布在MD安德森癌症中心启动首个1期临床试验点; 研究显示：电刺激医疗设备有助于增强肌肉力量; 研究揭示线粒体DNA缺失综合征的多样化进展; 都柏林内城十年非致命过量用药情况分析报告发布; 怀孕期间感染或接种新冠疫苗不会增加儿童发育健康风险