7 个月前

Anthropic

摘要

我们推出Claude 3系列大型多模态模型——包括性能最强的Claude 3 Opus、在能力与速度之间实现良好平衡的Claude 3 Sonnet，以及速度最快、成本最低的Claude 3 Haiku。所有新模型均具备视觉处理能力，可对图像数据进行分析与理解。Claude 3系列在多项基准测试中表现出色，在推理、数学和编程等关键指标上树立了新的行业标准。其中，Claude 3 Opus在GPQA [1]、MMLU [2]、MMMU [3]等多项权威评估中取得了领先水平的成果。Claude 3 Haiku在多数纯文本任务上的表现与Claude 2 [4]相当或更优，而Sonnet和Opus则显著超越后者。此外，这些模型在非英语语言上的表达流畅性也得到显著提升，使其在全球范围内的适用性更强。本报告将深入分析我们的评估结果，重点聚焦核心能力、安全性、社会影响，以及我们在《负责任扩展政策》中承诺开展的灾难性风险评估。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

7 个月前

Anthropic

摘要

我们推出Claude 3系列大型多模态模型——包括性能最强的Claude 3 Opus、在能力与速度之间实现良好平衡的Claude 3 Sonnet，以及速度最快、成本最低的Claude 3 Haiku。所有新模型均具备视觉处理能力，可对图像数据进行分析与理解。Claude 3系列在多项基准测试中表现出色，在推理、数学和编程等关键指标上树立了新的行业标准。其中，Claude 3 Opus在GPQA [1]、MMLU [2]、MMMU [3]等多项权威评估中取得了领先水平的成果。Claude 3 Haiku在多数纯文本任务上的表现与Claude 2 [4]相当或更优，而Sonnet和Opus则显著超越后者。此外，这些模型在非英语语言上的表达流畅性也得到显著提升，使其在全球范围内的适用性更强。本报告将深入分析我们的评估结果，重点聚焦核心能力、安全性、社会影响，以及我们在《负责任扩展政策》中承诺开展的灾难性风险评估。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Claude 3 模型家族：Opus、Sonnet、Haiku | 论文 | HyperAI超神经