Command Palette
Search for a command to run...
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

MathNet:面向数学推理与检索的全局多模态基准测试

D-OPSD:用于持续微调步骤蒸馏扩散模型的策略自蒸馏方法































MathNet:面向数学推理与检索的全局多模态基准测试

D-OPSD:用于持续微调步骤蒸馏扩散模型的策略自蒸馏方法






























ZAYA1-8B 技术报告
PhysForge:为交互式虚拟世界生成基于物理的3D资产
HERMES++:迈向统一的3D场景理解与生成驾驶世界模型
OpenSearch-VL:前沿多模态搜索代理的开放配方
RLDX-1 技术报告
Stream-T1:用于流式视频生成的测试时扩展
Stream-R1:用于流式视频生成的可靠性-困惑度感知奖励蒸馏
Uni-OPD:统一基于策略的蒸馏与双重视角配方
AGENTIC-IMODELS:通过自动研究进化智能代理可解释性工具
HEAVYSKILL:作为代理驾驭中内在能力的深度思考
WindowsWorld:面向专业跨应用环境中自主GUI智能体的以进程为中心的基准测试
幻觉削弱信任;元认知是前进之路
X2SAM:图像与视频中的任意分割
OpenSeeker-v2:通过信息丰富和高难度轨迹推动搜索智能体的极限
PRISM:面向多模态强化学习的黑盒在线蒸馏预对齐
ARIS:通过对抗性多智能体协作实现自主研究
ProgramBench:语言模型能否从零开始重建程序?
基于GPU的高效加速图编辑距离计算
基于LLM的社会媒体情境信号危机报道不确定性评估
标准LST:一种面向Tezos的原生协议流动性质押解决方案
分离智力与执行:面向模型上下文协议的工作流引擎
理解文本到视频检索中的性能瓶颈:一项综合的经验与语言学分析
持久视觉记忆:在LVLMs的深度生成中维持感知
EnergAIzer:面向 AI 工作负载的快速且准确 GPU 功耗估算框架
利用基于验证器的强化学习进行图像编辑
使用RoundPipe在多个消费级GPU上实现高效训练
ExoActor:作为可泛化交互人形控制的偏中心视频生成
联合演化的策略蒸馏
新时代视觉生成:从原子映射到代理世界建模的演变
异构科学基础模型协作
ZAYA1-8B 技术报告
PhysForge:为交互式虚拟世界生成基于物理的3D资产
HERMES++:迈向统一的3D场景理解与生成驾驶世界模型
OpenSearch-VL:前沿多模态搜索代理的开放配方
RLDX-1 技术报告
Stream-T1:用于流式视频生成的测试时扩展
Stream-R1:用于流式视频生成的可靠性-困惑度感知奖励蒸馏
Uni-OPD:统一基于策略的蒸馏与双重视角配方
AGENTIC-IMODELS:通过自动研究进化智能代理可解释性工具
HEAVYSKILL:作为代理驾驭中内在能力的深度思考
WindowsWorld:面向专业跨应用环境中自主GUI智能体的以进程为中心的基准测试
幻觉削弱信任;元认知是前进之路
X2SAM:图像与视频中的任意分割
OpenSeeker-v2:通过信息丰富和高难度轨迹推动搜索智能体的极限
PRISM:面向多模态强化学习的黑盒在线蒸馏预对齐
ARIS:通过对抗性多智能体协作实现自主研究
ProgramBench:语言模型能否从零开始重建程序?
基于GPU的高效加速图编辑距离计算
基于LLM的社会媒体情境信号危机报道不确定性评估
标准LST:一种面向Tezos的原生协议流动性质押解决方案
分离智力与执行:面向模型上下文协议的工作流引擎
理解文本到视频检索中的性能瓶颈:一项综合的经验与语言学分析
持久视觉记忆:在LVLMs的深度生成中维持感知
EnergAIzer:面向 AI 工作负载的快速且准确 GPU 功耗估算框架
利用基于验证器的强化学习进行图像编辑
使用RoundPipe在多个消费级GPU上实现高效训练
ExoActor:作为可泛化交互人形控制的偏中心视频生成
联合演化的策略蒸馏
新时代视觉生成:从原子映射到代理世界建模的演变
异构科学基础模型协作