3 个月前

Claude 3.5 Sonnet 模型卡片补充说明

Claude 3.5 Sonnet 模型卡片补充说明

摘要

本补充文件为Claude 3模型卡片的增补内容,介绍Claude 3.5 Sonnet这一新模型。该模型在性能上超越了我们此前最强大的模型Claude 3 Opus,同时具备更快的运行速度和更低的使用成本。Claude 3.5 Sonnet在多项能力上实现提升,尤其在代码生成与视觉处理方面表现更优。由于其属于Claude 3模型系列的演进版本,因此我们以补充文件形式发布,而非发布全新的模型卡片。文中提供了更新后的关键评估结果及安全测试数据。

基准测试

基准方法指标
code-generation-on-humanevalGPT-4o (0-shot)
Pass@1: 90.2
mmr-total-on-mrr-benchmarkClaude 3.5 Sonnet
Total Column Score: 463
multi-task-language-understanding-on-mmluClaude 3.5 Sonnet (5-shot)
Average (%): 88.7
question-answering-on-newsqaAnthropic/claude-3-5-sonnet
EM: 74.23
F1: 82.3
visual-question-answering-on-mm-vetClaude 3.5 Sonnet (claude-3-5-sonnet-20240620)
GPT-4 score: 74.2±0.2
visual-question-answering-on-mm-vet-v2Claude 3.5 Sonnet (claude-3-5-sonnet-20240620)
GPT-4 score: 71.8±0.2

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
Claude 3.5 Sonnet 模型卡片补充说明 | 论文 | HyperAI超神经