4 个月前

o3-mini 与 DeepSeek-R1:哪一种更安全?

o3-mini 与 DeepSeek-R1:哪一种更安全?

摘要

DeepSeek-R1 的出现标志着人工智能行业,尤其是大语言模型(LLMs)的一个转折点。其在多项任务中的表现展示了卓越的能力,包括创造性思维、代码生成、数学运算和自动化程序修复,且似乎以较低的执行成本实现了这些性能。然而,大语言模型必须具备一个重要的定性属性,即它们需要与安全性和人类价值观保持一致。DeepSeek-R1 的一个明显竞争对手是美国的同类产品——OpenAI 的 o3-mini 模型,该模型预计将在性能、安全性和成本方面设定高标准。本文对 DeepSeek-R1(700亿参数版本)和 OpenAI 的 o3-mini(测试版)的安全水平进行了系统评估。为此,我们使用了最近发布的自动化安全测试工具 ASTRAL。通过利用这一工具,我们自动且系统地为两个模型生成并执行了总计 1260 个不安全的测试输入。在对两个大语言模型提供的结果进行半自动评估后,结果显示 DeepSeek-R1 相比于 OpenAI 的 o3-mini 存在较高的安全隐患。根据我们的评估,DeepSeek-R1 对 11.98% 的测试提示做出了不安全的回答,而 o3-mini 则仅为 1.19%。

代码仓库

基准测试

基准方法指标
question-answering-on-newsqaOpenAI/o3-mini-2025-01-31-high
EM: 96.52
F1: 92.13

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
o3-mini 与 DeepSeek-R1:哪一种更安全? | 论文 | HyperAI超神经