Command Palette
Search for a command to run...
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

龙之幼崽:Transformer与大脑模型之间的缺失环节

Vision-Zero:通过策略性游戏化自对弈实现可扩展的VLM自我提升































龙之幼崽:Transformer与大脑模型之间的缺失环节

Vision-Zero:通过策略性游戏化自对弈实现可扩展的VLM自我提升






























MCPMark:用于压力测试现实且全面的MCP使用的基准
可验证奖励下的LLM推理仅需随机策略评估
使用ToolUniverse实现AI科学家的民主化
推理何时才重要?一项关于推理对模型性能贡献的受控研究
多人博弈纳什偏好优化
StableToken:一种抗噪声的语义语音Tokenize,用于增强语音LLM的鲁棒性
SLA:通过可微调稀疏线性注意力实现扩散Transformer中的稀疏性突破
SimpleFold:蛋白质折叠比你想象的更简单
POINTS-Reader:面向文档转换的视觉-语言模型蒸馏-free适配
可泛化的几何图像描述生成
基于强化学习的语言模型规划:理论视角下的优势与陷阱
语言模型Agent的赋能估计
语言模型可以在没有标量奖励的情况下从口头反馈中学习
语言模型的变分推理
EPO:面向LLM Agent的熵正则化策略优化 强化学习
MinerU2.5:一种用于高效高分辨率文档解析的解耦视觉-语言模型
分位数优势估计用于熵安全推理
LongLive:实时交互式长视频生成
组合式创造力:泛化能力的新前沿
因果时空预测:一种高效且有效的多模态方法
Hunyuan3D-Omni:一种用于可控生成3D资产的统一框架
Seedream 4.0:迈向下一代多模态图像生成
LLM Agent强化学习中的树搜索
SciReasoner:跨学科奠定科学推理基础
MMR1:通过方差感知采样与开放资源增强多模态推理
基于方差的课程强化学习用于大语言模型
MultiEdit:在多样且具有挑战性的任务上推进基于指令的图像编辑
BRISC:基于Swin-HAFNet的脑肿瘤分割与分类标注数据集
FDABench:面向异构数据上分析查询的数据Agent基准测试
作画易,思辨难:文本到图像模型能否铺就舞台,却无法主导演出?
MCPMark:用于压力测试现实且全面的MCP使用的基准
可验证奖励下的LLM推理仅需随机策略评估
使用ToolUniverse实现AI科学家的民主化
推理何时才重要?一项关于推理对模型性能贡献的受控研究
多人博弈纳什偏好优化
StableToken:一种抗噪声的语义语音Tokenize,用于增强语音LLM的鲁棒性
SLA:通过可微调稀疏线性注意力实现扩散Transformer中的稀疏性突破
SimpleFold:蛋白质折叠比你想象的更简单
POINTS-Reader:面向文档转换的视觉-语言模型蒸馏-free适配
可泛化的几何图像描述生成
基于强化学习的语言模型规划:理论视角下的优势与陷阱
语言模型Agent的赋能估计
语言模型可以在没有标量奖励的情况下从口头反馈中学习
语言模型的变分推理
EPO:面向LLM Agent的熵正则化策略优化 强化学习
MinerU2.5:一种用于高效高分辨率文档解析的解耦视觉-语言模型
分位数优势估计用于熵安全推理
LongLive:实时交互式长视频生成
组合式创造力:泛化能力的新前沿
因果时空预测:一种高效且有效的多模态方法
Hunyuan3D-Omni:一种用于可控生成3D资产的统一框架
Seedream 4.0:迈向下一代多模态图像生成
LLM Agent强化学习中的树搜索
SciReasoner:跨学科奠定科学推理基础
MMR1:通过方差感知采样与开放资源增强多模态推理
基于方差的课程强化学习用于大语言模型
MultiEdit:在多样且具有挑战性的任务上推进基于指令的图像编辑
BRISC:基于Swin-HAFNet的脑肿瘤分割与分类标注数据集
FDABench:面向异构数据上分析查询的数据Agent基准测试
作画易,思辨难:文本到图像模型能否铺就舞台,却无法主导演出?