Google Research Healthcare LLM在关键领域超越医生

459 0 0

谷歌的人工智能系统，经过训练进行医疗访谈，在床边态度和诊断准确性方面超过了人类医生。

由DeepMind和Google Research的团队开发，目前发表于ArXiv这个名为Articulate Medical Intelligence Explorer（AMIE）的聊天机器人在诊断呼吸和心血管疾病等方面表现出色。

它在医学访谈中收集患者信息方面与委员会认证的初级保健医生不相上下，甚至超过了他们的表现，并且在同情心方面得分更高。

很高兴介绍我们关于AMIE的新研究论文（Articulate Medical Intelligence Explorer），这是迈向对话式诊断AI的一步，作者：@ GoogleAI @ GoogleHealth @ GoogleDeepMindhttps：//www.example.com www.example.com

– Mike Schaekermann（@ HardyShakerman）2024年1月12日

开发AMIE的关键挑战之一是缺乏用于培训数据的真实世界医学对话。

为了克服这一问题，谷歌健康的团队，包括人工智能研究科学家Vivek Natarajan，精心设计了一种方法，使聊天机器人能够进行模拟的“对话”。

人工智能被训练为扮演一个病人，一个同情的临床医生和一个评价医生—病人互动的评论家的角色。

在涉及20名演员模拟患者和20名委员会认证的临床医生的测试中，AMIE在六个医学专业中始终匹配或超过医生的诊断准确率。

它在26项谈话质量标准中的24项上优于医生，如礼貌和解释条件和治疗方法。

该研究的作者之一、伦敦谷歌健康的临床研究科学家Alan Karthikesalingam指出：“据我们所知，这是第一次将对话式人工智能系统设计为诊断对话和记录临床病史。

很高兴介绍AMIE（Articulate Medical Intelligence Explorer）我们的研究LLM诊断对话。AMIE在一项“虚拟欧安组织”式随机研究中在会话质量和诊断准确性方面超过了初级保健博士。预印本网站www.example.com（1/7）www.example.com️

–Alan Karthikealingam(@alan_karthi)2024年1月12日

然而，Karthikealingam强调，Amie仍然是实验性的，还没有在真实的患者身上进行测试，只在描绘虚构但看似合理的医疗条件的演员身上进行了测试。

研究如何运作

这项名为“迈向会话诊断AI”的研究介绍了AMIE，这是一个专为医学诊断交互设计的LLM。

以下是关于它如何工作的更多信息：

AMIE的发展Articulate Medical Intelligence Explorer（AMIE）是一个基于Google创建的大型语言模型（LLM）的人工智能系统。它为医学背景下的诊断对话而优化。AMIE旨在模拟复杂的临床病史采集和诊断推理过程。
模拟对话训练研究人员开发了一种新的自我游戏模拟环境，因为缺乏现实世界的医学对话来训练。这使得AMIE能够参与模拟对话，扮演不同的角色（病人、医生、评论家）来增强学习能力。这些对话涵盖了一系列的医疗条件，专业和背景。
指令微调与推理链策略AMIE使用各种真实世界的数据集进行了教学微调，包括医学问答、推理、总结和对话数据。推理链策略涉及分析患者信息，制定反应和行动，并根据当前对话细化反应。
远程客观结构化临床考试(欧安组织)研究研究人员进行了一项随机、双盲交叉研究，比较AMIE和初级保健医生（PCP）。这项研究使用基于文本的咨询与149模拟患者描绘的演员涉及各种临床场景。专科医生和患者行为者都评估了AMIE和PCP的性能。
评价和结果：评估的重点是诊断准确性、管理推理、沟通技能和同理心。与PCP相比，AMIE在几个方面表现出更好的表现，包括诊断准确性和同理心。

研究人员警告说，目前应该对这些结果进行轻描淡写的解释，并指出该研究的局限性，例如使用文本聊天界面和缺乏现实世界的患者互动。

然而，它标志着在开发能够进行医学访谈和诊断对话的人工智能系统方面取得了进展。

医疗保健中的生成人工智能一直是一个巨大成功的领域，模型成功寻找新抗生素，改进结肠镜检查，以及模拟交互作用化合物和生物过程之间的关系。

人工智能模型现在是否也会采用面向患者的角色？

# AI行业新闻