Command Palette
Search for a command to run...
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

LIBERO-Para:针对 VLA 模型改写鲁棒性的诊断性 benchmark 与评估指标

TriAttention:基于三角函数 KV Compression 的高效长文本 Reasoning































LIBERO-Para:针对 VLA 模型改写鲁棒性的诊断性 benchmark 与评估指标

TriAttention:基于三角函数 KV Compression 的高效长文本 Reasoning






























MinerU2.5-Pro:挑战大规模数据中心化文档解析的极限
Adam's Law:Large Language Models 上的文本频率定律
OpenWorldLib:一种统一的代码库与高级 World Models 的定义
WAXAL:大规模多语言非洲语言语音语料库
DRACO:一个面向深度研究准确性、完整性与客观性的跨领域基准
HuatuoGPT-o1:迈向基于 LLM 的医学复杂推理
AgentSocialBench:评估以人为本的 Agent 社交网络中的隐私风险
InCoder-32B-Thinking:面向推理的工业级代码世界模型
Agentic-MME:Agentic 能力究竟为多模态智能带来了什么?
Token Warping 助力多模态大语言模型(MLLMs)从邻近视角进行观测
自蒸馏的 RLVR
面向流式视频理解的简单基线
CORAL:迈向面向开放发现的多智能体自主进化
可操控视觉表示
SKILL0:用于技能内化的上下文智能体强化学习
生成式世界渲染器
潜空间:基础、演进、机制、能力与展望
DataFlex:面向大语言模型数据中心动态训练的统一框架
QuitoBench:一个高质量开源时间序列预测基准
Vision2Web:面向智能体验证的视觉网站开发分层基准测试
ViGoR-Bench:视觉生成模型距离零样本视觉推理器还有多远?
MiroEval:多模态深度研究 Agent 的过程与结果基准测试
终端 Agent 足以胜任企业自动化任务
ClawKeeper:通过技能、插件与监视器实现 OpenClaw Agents 的全面安全防护
用于随机梯度下降快速不确定性量化的廉价 Bootstrap 方法
生成式人工智能通过对称扩散学习实现基于功能磁共振成像的脑结构网络构建
面向边缘智能的早期退出预测编码神经网络
二次梯度:一种通过综合 Hessian 矩阵与梯度来桥接梯度下降法与牛顿类方法的统一框架
乘积广播信道类的容量区域
Colon-Bench:一种用于全周期结肠镜视频中可扩展致密病灶标注的智能体工作流
MinerU2.5-Pro:挑战大规模数据中心化文档解析的极限
Adam's Law:Large Language Models 上的文本频率定律
OpenWorldLib:一种统一的代码库与高级 World Models 的定义
WAXAL:大规模多语言非洲语言语音语料库
DRACO:一个面向深度研究准确性、完整性与客观性的跨领域基准
HuatuoGPT-o1:迈向基于 LLM 的医学复杂推理
AgentSocialBench:评估以人为本的 Agent 社交网络中的隐私风险
InCoder-32B-Thinking:面向推理的工业级代码世界模型
Agentic-MME:Agentic 能力究竟为多模态智能带来了什么?
Token Warping 助力多模态大语言模型(MLLMs)从邻近视角进行观测
自蒸馏的 RLVR
面向流式视频理解的简单基线
CORAL:迈向面向开放发现的多智能体自主进化
可操控视觉表示
SKILL0:用于技能内化的上下文智能体强化学习
生成式世界渲染器
潜空间:基础、演进、机制、能力与展望
DataFlex:面向大语言模型数据中心动态训练的统一框架
QuitoBench:一个高质量开源时间序列预测基准
Vision2Web:面向智能体验证的视觉网站开发分层基准测试
ViGoR-Bench:视觉生成模型距离零样本视觉推理器还有多远?
MiroEval:多模态深度研究 Agent 的过程与结果基准测试
终端 Agent 足以胜任企业自动化任务
ClawKeeper:通过技能、插件与监视器实现 OpenClaw Agents 的全面安全防护
用于随机梯度下降快速不确定性量化的廉价 Bootstrap 方法
生成式人工智能通过对称扩散学习实现基于功能磁共振成像的脑结构网络构建
面向边缘智能的早期退出预测编码神经网络
二次梯度:一种通过综合 Hessian 矩阵与梯度来桥接梯度下降法与牛顿类方法的统一框架
乘积广播信道类的容量区域
Colon-Bench:一种用于全周期结肠镜视频中可扩展致密病灶标注的智能体工作流