3 个月前

MedMobile:具备专家级临床能力的移动端语言模型

MedMobile:具备专家级临床能力的移动端语言模型

摘要

语言模型(LMs)在医学领域已展现出专家级别的推理与记忆能力。然而,计算成本高昂及隐私安全问题正成为其大规模应用的主要障碍。为此,我们提出了一种轻量化的phi-3-mini模型适配方案——MedMobile,这是一个参数量仅为38亿的医学专用语言模型,可直接在移动设备上运行。实验表明,MedMobile在MedQA(USMLE)测试集上的得分为75.7%,超过医生执业考试的及格线(约60%),并接近参数规模为其100倍的大型模型的性能表现。随后,我们开展了一系列严谨的消融实验,结果表明,思维链(chain of thought)、模型集成(ensembling)以及微调(fine-tuning)是提升模型性能的关键因素;而令人意外的是,检索增强生成(retrieval-augmented generation)并未带来显著性能提升。

代码仓库

nyuolab/MedMobile
官方
GitHub 中提及

基准测试

基准方法指标
question-answering-on-medmcqa-devMedMobile (3.8B)
Accuarcy: 63.2
question-answering-on-medqa-usmleMedMobile (3.8B)
Accuracy: 75.7

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
MedMobile:具备专家级临床能力的移动端语言模型 | 论文 | HyperAI超神经