HyperAIHyperAI

Command Palette

Search for a command to run...

MedMobile:具备专家级临床能力的移动端语言模型

Krithik Vishwanath Jaden Stryker Anton Alaykin Daniel Alexander Alber Eric Karl Oermann

摘要

语言模型(LMs)在医学领域已展现出专家级别的推理与记忆能力。然而,计算成本高昂及隐私安全问题正成为其大规模应用的主要障碍。为此,我们提出了一种轻量化的phi-3-mini模型适配方案——MedMobile,这是一个参数量仅为38亿的医学专用语言模型,可直接在移动设备上运行。实验表明,MedMobile在MedQA(USMLE)测试集上的得分为75.7%,超过医生执业考试的及格线(约60%),并接近参数规模为其100倍的大型模型的性能表现。随后,我们开展了一系列严谨的消融实验,结果表明,思维链(chain of thought)、模型集成(ensembling)以及微调(fine-tuning)是提升模型性能的关键因素;而令人意外的是,检索增强生成(retrieval-augmented generation)并未带来显著性能提升。


用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码
开箱即用的 GPU
最优定价

HyperAI Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供