AI能否成为你的心理医生?研究显示ChatGPT在关键领域优于专业人士

2025年2月17日
来源:News-Medical
语言:英语,所在国:美国
分类:科技与健康,字数:1402

研究人员探讨了AI辅助心理健康护理的影响及心理治疗的未来。

在最近发表于《PLOS Mental Health》的一项研究中,研究人员调查了人类是否能区分由专家心理医生和ChatGPT-4生成的夫妻治疗回应。

“机器能否思考?”是图灵在二战后提出的一个简单问题。自20世纪中叶以来,技术已经显著进步,越来越多的证据表明生成式人工智能(GenAI)在心理治疗中有帮助。

此外,最近的研究揭示了GenAI在心理治疗中的辅助或独立解决方案中的有希望的效果。最新的报告指出,AI可以以同理心的方式撰写内容,这些内容得到了心理医生的高度评价,并且表现优于专业人士。

在这项研究中,研究人员调查了一个小组参与者是否能区分来自夫妻治疗专家和ChatGPT的回应。

首先,招募了具有咨询心理学、临床心理学、精神病学和婚姻家庭治疗高级学位的专家。专家被随机分配接收两组夫妻治疗案例之一,并在一个月内完成对案例的回应。

完成后,一组专家对另一组专家的三个最有可能成功的回应进行了排名。接下来,ChatGPT-4被要求用单个提示生成回应。该提示定义了专业性、同理心、治疗联盟、疗效和文化胜任力。ChatGPT-4的回应也由作者进行评分。

最好的案例被选出来与人类专家的竞争。然后,最好的回应被汇总并分发给一个多样化的个体小组作为调查。这个样本代表了美国人口。受访者被随机分配接收来自心理医生或ChatGPT-4的消息,并被要求评估其与共同因素的一致性,并猜测作者是ChatGPT还是人类心理医生。

共有13名拥有至少五年经验的心理医生构成了专家小组,其中大多数有夫妻治疗背景。调查受访者包括830名平均年龄为45岁的个人,其中50.6%为女性,47.9%为男性,0.2%为非二元性别。近60%的人处于恋爱关系中,18%的人曾参与过夫妻治疗。

此外,49.4%的受访者是非西班牙裔白人,18.8%是黑人,16.8%是西班牙裔白人,5%是亚裔等。受访者在识别ChatGPT和心理医生的回应方面表现不佳,他们正确识别心理医生的几率仅比识别ChatGPT高出5%。ChatGPT的回应在所有治疗共同因素上的评分都高于心理医生的回应。

此外,ChatGPT的回应更可能被认为是富有同理心、文化胜任力强且更具连贯性的。那些认为回应来自心理医生的参与者对其评分更高,而认为来自ChatGPT的参与者对其评分较低。这促使研究人员进行了额外的事后分析,结果显示明显的归因偏差,即参与者对归因于心理医生的案例反应更为积极。

研究人员还比较了心理医生和ChatGPT回应中的词性差异和情感倾向。ChatGPT生成的回应更长,情感更积极,名词、形容词、动词、代词和副词更多。即使控制了回应长度,ChatGPT的回应中仍包含更多的形容词和名词,但动词、代词和副词的数量相似。

ChatGPT和心理医生的回应准确识别率仅略高于随机猜测,这支持了图灵的预测(即人类无法区分机器和人类的回应)。此外,ChatGPT在所有治疗共同因素上的评分均高于人类回应。

研究的局限性包括有限的案例数量、仅使用一个提示生成GenAI回应以及有限数量的专业心理医生,包括少数几位夫妻治疗师。

鉴于GenAI可能被纳入治疗环境的可能性,心理健康专家需要了解机器学习,提高在该领域的技术素养,并确保对这些模型进行谨慎的培训和监督。


(全文结束)

7日热榜
甲流一周内可能发展成病毒性肺炎?这些症状要警惕
想要健康好睡眠?这些调整作息的方法超有用
掌握这些入睡法,让你轻松告别失眠一觉到天亮!
想变白?吃对食物+好作息,一起冲!
甘氨酸镁的最佳服用时间以获得最大益处,据科学所说
服用多少布洛芬才算过量?
为什么你总是特别容易紧张?科学揭秘背后原因与应对方法
2025年流感高峰来袭!如何应对这波感染潮
身上长出这5种瘊子?可能是HPV感染,早发现早治疗很重要
跑步减肥最少跑多少公里才有效?一文讲清!
世界新闻
研究揭示运动如何对抗压力引起的高血压
研究提出治疗脆性X综合征的新分子策略
Insilico Medicine研究揭示TNIK抑制作为有前景的抗衰老策略
班塔姆制药宣布在MD安德森癌症中心启动首个1期临床试验点
研究显示:电刺激医疗设备有助于增强肌肉力量
研究揭示线粒体DNA缺失综合征的多样化进展
都柏林内城十年非致命过量用药情况分析报告发布
怀孕期间感染或接种新冠疫苗不会增加儿童发育健康风险