一项发表在《家庭医学年鉴》上的最新研究表明,一种基于机器学习(ML)的工具在短短25秒内成功识别了超过70%的中度至重度抑郁症语音标记,突显了其在初级护理和虚拟医疗环境中改善心理健康筛查的潜力。
研究人员评估了一种基于人工智能(AI)的语音生物标志物工具,用于检测与中度至重度抑郁症相关的信号。该工具通过分析语音模式来检测抑郁症状,包括结巴、犹豫、较长停顿和语速减慢等特征。这些语音生物标志物可以通过机器学习算法进行分析,从而识别出可能患有抑郁症的人群。
这项研究招募了来自美国和加拿大的14,898名成年人,通过社交媒体进行宣传,特别针对男性和老年人进行了招募,以确保样本的多样性。参与者完成了标准的抑郁症问卷,并使用手机或电脑录制了至少25秒的语音样本。研究人员处理了这些录音,以确保音频质量清晰一致。
机器学习模型将参与者分为三类:具有抑郁症标记、无抑郁症标记以及结果不确定需进一步评估。为了验证准确性,研究人员将模型预测结果与参与者的实际问卷结果进行了比较,并对系统进行了优化以减少错误。
研究结果显示,该模型在3,536个验证样本中实现了71.3%的敏感性(即检测抑郁症的能力)和73.5%的特异性(即排除抑郁症的能力)。大约20%的病例(920个样本)被归类为不确定,需要进一步评估。该模型在不同人口群体中的表现也有所不同,例如,对于西班牙裔/拉丁裔(80.3%)和黑人/非裔美国人(72.4%),模型的敏感性最高;而特异性最高的群体为亚裔/太平洋岛民(77.5%)和黑人/非裔美国人(75.9%)。
女性的敏感性较高(74%),但特异性较低(68.9%),而男性的敏感性较低(59.3%),但特异性较高(83.9%)。年轻参与者(60岁以下)的结果更为一致,而老年参与者(60岁及以上)的敏感性为63.4%,特异性为86.8%。
总体而言,尽管模型在不同年龄、性别和种族群体中的准确性有所差异,但它仍显示出在抑郁症筛查方面的潜力。虽然这种技术不能替代临床诊断,但它可以帮助初级护理医生更高效地筛查更多患者。类似的人工智能工具已应用于检测神经退行性疾病,表明其在医疗保健领域的广泛应用前景。
研究的主要挑战之一是平衡假阴性和假阳性结果,这可以根据临床需求进行调整。模型在男性中的准确性较低,可能是由于训练数据中男性样本较少以及抑郁症症状的差异。老年人的敏感性较低但特异性较高,可能是因为年龄相关的声音变化影响了结果。
尽管如此,这项研究展示了基于人工智能的语音分析在未来抑郁症筛查中的潜在应用,有助于医生更早发现需要帮助的人群,并减少诊断偏差。然而,在广泛使用之前,还需要更多的研究来提高模型在不同人群中的准确性。
(全文结束)