Command Palette
Search for a command to run...
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

FACTS排行榜:大语言模型事实性综合基准

Nemotron-Cascade:面向通用推理模型的级联强化学习扩展































FACTS排行榜:大语言模型事实性综合基准

Nemotron-Cascade:面向通用推理模型的级联强化学习扩展






























KlingAvatar 2.0 技术报告
QwenLong-L1.5:长上下文推理与记忆管理的后训练方案
ReFusion:一种具有并行自回归解码的扩散型大语言模型
无错误的线性注意力机制:从连续时间动力学中获得的精确解
AI Agent时代中的记忆
LongVie 2:多模态可控超长视频世界模型
FirstAidQA:面向低连接性环境的急救与应急响应合成数据集
CUDA-L2:通过强化学习超越cuBLAS的矩阵乘法性能
X-VLA:作为可扩展跨具身视觉-语言-动作模型的软提示Transformer
Nemotron 3 Nano:面向Agent推理的开源、高效混合专家Mamba-Transformer模型
基于追踪的结构:视频生成中的结构保持性运动知识蒸馏
基于MetaCanvas的MLLM-Diffusion信息传递探索
PersonaLive!用于直播的生动肖像图像动画
V-RGBX:基于内在属性精确控制的视频编辑
SVG-T2I:在无需变分自编码器的情况下扩展文本到图像的潜在扩散模型
DentalGPT:激励牙科领域的多模态复杂推理
SSRB:对大规模异构半结构化数据的直接自然语言查询
MUVR:具有多层级视觉对应关系的多模态未剪辑视频检索基准
在Veo世界模拟器中评估Gemini Robotics策略
MotionEdit:面向运动中心图像编辑的基准测试与学习
通过复杂度增强强化学习实现奥运级几何大语言模型智能体
OPV:基于结果的流程验证器,用于高效长链推理验证
文本到3D生成中的强化学习:我们准备好了吗?一项渐进式探究
面向奥数级数学问题求解的长时程推理Agent
T-pro 2.0:一种高效的俄语混合推理LLM与实验平台
AutoGLM:用于GUI的自主基础Agent
OpenGU:图去学习的综合基准
预训练、中段训练与强化学习在推理语言模型中的相互作用
DeepCode:开放的智能体编码
InfiniteVL:融合线性与稀疏注意力机制以实现高效、无限输入的视觉-语言模型
KlingAvatar 2.0 技术报告
QwenLong-L1.5:长上下文推理与记忆管理的后训练方案
ReFusion:一种具有并行自回归解码的扩散型大语言模型
无错误的线性注意力机制:从连续时间动力学中获得的精确解
AI Agent时代中的记忆
LongVie 2:多模态可控超长视频世界模型
FirstAidQA:面向低连接性环境的急救与应急响应合成数据集
CUDA-L2:通过强化学习超越cuBLAS的矩阵乘法性能
X-VLA:作为可扩展跨具身视觉-语言-动作模型的软提示Transformer
Nemotron 3 Nano:面向Agent推理的开源、高效混合专家Mamba-Transformer模型
基于追踪的结构:视频生成中的结构保持性运动知识蒸馏
基于MetaCanvas的MLLM-Diffusion信息传递探索
PersonaLive!用于直播的生动肖像图像动画
V-RGBX:基于内在属性精确控制的视频编辑
SVG-T2I:在无需变分自编码器的情况下扩展文本到图像的潜在扩散模型
DentalGPT:激励牙科领域的多模态复杂推理
SSRB:对大规模异构半结构化数据的直接自然语言查询
MUVR:具有多层级视觉对应关系的多模态未剪辑视频检索基准
在Veo世界模拟器中评估Gemini Robotics策略
MotionEdit:面向运动中心图像编辑的基准测试与学习
通过复杂度增强强化学习实现奥运级几何大语言模型智能体
OPV:基于结果的流程验证器,用于高效长链推理验证
文本到3D生成中的强化学习:我们准备好了吗?一项渐进式探究
面向奥数级数学问题求解的长时程推理Agent
T-pro 2.0:一种高效的俄语混合推理LLM与实验平台
AutoGLM:用于GUI的自主基础Agent
OpenGU:图去学习的综合基准
预训练、中段训练与强化学习在推理语言模型中的相互作用
DeepCode:开放的智能体编码
InfiniteVL:融合线性与稀疏注意力机制以实现高效、无限输入的视觉-语言模型