6 个月前

检索增强生成

监督式微调

Krithik Vishwanath Jaden Stryker Anton Alaykin Daniel Alexander Alber Eric Karl Oermann

摘要

语言模型（LMs）在医学领域已展现出专家级别的推理与记忆能力。然而，计算成本高昂及隐私安全问题正成为其大规模应用的主要障碍。为此，我们提出了一种轻量化的phi-3-mini模型适配方案——MedMobile，这是一个参数量仅为38亿的医学专用语言模型，可直接在移动设备上运行。实验表明，MedMobile在MedQA（USMLE）测试集上的得分为75.7%，超过医生执业考试的及格线（约60%），并接近参数规模为其100倍的大型模型的性能表现。随后，我们开展了一系列严谨的消融实验，结果表明，思维链（chain of thought）、模型集成（ensembling）以及微调（fine-tuning）是提升模型性能的关键因素；而令人意外的是，检索增强生成（retrieval-augmented generation）并未带来显著性能提升。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

检索增强生成

监督式微调

Krithik Vishwanath Jaden Stryker Anton Alaykin Daniel Alexander Alber Eric Karl Oermann

摘要

语言模型（LMs）在医学领域已展现出专家级别的推理与记忆能力。然而，计算成本高昂及隐私安全问题正成为其大规模应用的主要障碍。为此，我们提出了一种轻量化的phi-3-mini模型适配方案——MedMobile，这是一个参数量仅为38亿的医学专用语言模型，可直接在移动设备上运行。实验表明，MedMobile在MedQA（USMLE）测试集上的得分为75.7%，超过医生执业考试的及格线（约60%），并接近参数规模为其100倍的大型模型的性能表现。随后，我们开展了一系列严谨的消融实验，结果表明，思维链（chain of thought）、模型集成（ensembling）以及微调（fine-tuning）是提升模型性能的关键因素；而令人意外的是，检索增强生成（retrieval-augmented generation）并未带来显著性能提升。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供