Command Palette
Search for a command to run...
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

视频生成模型是优秀的潜在奖励模型

DeepSeekMath-V2:迈向自验证的数学推理































视频生成模型是优秀的潜在奖励模型

DeepSeekMath-V2:迈向自验证的数学推理






























ToolOrchestra:通过高效的模型与工具编排提升智能
视觉思考,文本推理:ARC中的视觉-语言协同作用
和谐:通过跨任务协同实现音频与视频生成的协同统一
Inferix:一种基于块扩散的下一代推理引擎,用于世界模拟
多智能体系统中的潜在协作
多模态评估俄语语言架构
ROOT:用于神经网络训练的鲁棒正交化优化器
叠加效应带来稳健的神经缩放
直接在线学习的最优错误界
强化学习是否真的能够激励LLM在基础模型之外提升推理能力?
扩散模型为何不会记忆:训练中隐式动力学正则化的作用
用于自监督强化学习的1000层网络:增加深度可实现新的目标达成能力
用于大型语言模型的门控注意力:非线性、稀疏性与无注意力陷阱
人工蜂群智能:语言模型(及更广泛领域)的开放性同质性
超大规模下的进化策略
理解是否推动统一多模态模型中的生成?从分析到未来路径
iMontage:统一、通用、高度动态的多对多图像生成
Agent0-VL:探索面向工具融合的视觉-语言推理的自演化智能体
MedSAM3:基于医学概念深入探索通用图像分割
SteadyDancer:基于首帧保留的协调一致的人体图像动画
GigaEvo:一个由 LLMs 和进化算法驱动的开源优化框架
基于随机路径积分的忠实度感知推荐解释
提取推荐系统中的交互感知单语义概念
MSRNet:用于伪装目标检测的多尺度递归网络
预算感知工具使用实现Agent的有效扩展
视频内指令:视觉信号作为生成控制
DR Tulu:面向深度研究的基于演化评分标准的强化学习
AICC:精细化HTML解析,提升模型性能 —— 基于模型HTML解析器构建的7.3T面向AI语料库
UltraFlux:面向跨多种纵横比的高质量原生4K文本到图像生成的数据-模型协同设计
DeCo:面向端到端图像生成的频率解耦像素扩散
ToolOrchestra:通过高效的模型与工具编排提升智能
视觉思考,文本推理:ARC中的视觉-语言协同作用
和谐:通过跨任务协同实现音频与视频生成的协同统一
Inferix:一种基于块扩散的下一代推理引擎,用于世界模拟
多智能体系统中的潜在协作
多模态评估俄语语言架构
ROOT:用于神经网络训练的鲁棒正交化优化器
叠加效应带来稳健的神经缩放
直接在线学习的最优错误界
强化学习是否真的能够激励LLM在基础模型之外提升推理能力?
扩散模型为何不会记忆:训练中隐式动力学正则化的作用
用于自监督强化学习的1000层网络:增加深度可实现新的目标达成能力
用于大型语言模型的门控注意力:非线性、稀疏性与无注意力陷阱
人工蜂群智能:语言模型(及更广泛领域)的开放性同质性
超大规模下的进化策略
理解是否推动统一多模态模型中的生成?从分析到未来路径
iMontage:统一、通用、高度动态的多对多图像生成
Agent0-VL:探索面向工具融合的视觉-语言推理的自演化智能体
MedSAM3:基于医学概念深入探索通用图像分割
SteadyDancer:基于首帧保留的协调一致的人体图像动画
GigaEvo:一个由 LLMs 和进化算法驱动的开源优化框架
基于随机路径积分的忠实度感知推荐解释
提取推荐系统中的交互感知单语义概念
MSRNet:用于伪装目标检测的多尺度递归网络
预算感知工具使用实现Agent的有效扩展
视频内指令:视觉信号作为生成控制
DR Tulu:面向深度研究的基于演化评分标准的强化学习
AICC:精细化HTML解析,提升模型性能 —— 基于模型HTML解析器构建的7.3T面向AI语料库
UltraFlux:面向跨多种纵横比的高质量原生4K文本到图像生成的数据-模型协同设计
DeCo:面向端到端图像生成的频率解耦像素扩散