英国伦敦大学学院的研究团队最近在《自然人类行为》杂志上发表了一项研究,揭示了大型语言模型(LLMs)在预测神经科学研究成果方面的卓越能力。这项研究由Xiaoliang (Ken) Luo博士和Bradley Love教授领导,他们与来自全球各地的科研人员合作完成。研究结果显示,在面对复杂的神经科学问题时,这些基于人工智能的语言模型比经验丰富的神经科学家表现得更加出色。
神经科学是一个跨学科领域,它探索大脑及整个神经系统的工作机制,包括从细胞层面到个体行为的广泛范围。随着技术的进步,研究人员能够利用多种工具和技术来观察大脑活动,比如功能性磁共振成像(fMRI)、脑电图(EEG)等。然而,由于该领域的复杂性和快速发展的特性,即便是专业的科学家也难以准确预测新的研究成果。正是在这种背景下,研究者们开始考虑是否可以借助AI的力量来提高预测准确性。
为了验证这一想法,研究人员设计了一个名为BrainBench的测试平台,用以评估不同版本的大型语言模型以及171位经过筛选的人类专家在预测神经科学研究结论上的表现。参与评测的语言模型包括Llama、Galactica、Falcon等多个版本。最终结果显示,所有被测试的语言模型都显著优于人类专家,平均正确率达到了81.4%,而人类专家仅为63.4%。这表明,通过学习海量文献资料后,大型语言模型具备了超越个人知识积累的强大分析能力。
进一步地,研究小组还尝试对现有的Mistral模型进行了专门训练,使其专注于处理过去二十年间发表于各大期刊上的神经科学相关文章。新开发出的模型——BrainGPT,在测试中取得了86%的准确率,再次证明了针对特定领域进行优化后的语言模型具有更强的应用潜力。
对于神经科学界而言,这意味着未来可能依靠这类智能助手来指导实验设计,甚至提前预判研究方向,从而更高效地推进科学研究进程。此外,这样的技术进步也有望加速我们对大脑工作机制的理解,促进医学领域的发展,为治疗各种神经系统疾病开辟新途径。