Command Palette
Search for a command to run...
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

毒苹果效应:通过AI Agent的技术扩展对中介市场实施策略性操纵

你的组相对优势存在偏差































毒苹果效应:通过AI Agent的技术扩展对中介市场实施策略性操纵

你的组相对优势存在偏差






























STEM:通过嵌入模块扩展Transformer
迷失在噪声中:推理模型在上下文干扰项下的失效机制
超越静态工具:面向科学推理的测试时工具演化
VIBE:基于视觉指令的编辑器
协作式多Agent测试时强化学习用于推理
奖励稀有:面向LLM创造性问题求解的感知独特性强化学习
基于视觉-语言推理的城市社会语义分割
STEP3-VL-10B 技术报告
SeedFold:扩展生物分子结构预测
TranslateGemma 技术报告
Fast-ThinkAct:通过可表述的潜在规划实现高效的视觉-语言-动作推理
SkinFlow:通过动态视觉编码与分阶段强化学习实现开放性皮肤病诊断的高效信息传输
A^3-Bench:通过锚点与吸引子激活进行内存驱动型科学推理的基准测试
算法代码优化的受控自演化
MAXS:基于LLM Agent的元自适应探索
DeepResearchEval:一种用于深度研究任务构建与代理评估的自动化框架
0型映射到旗流形空间的动机类
UniversalRAG:面向多模态与多粒度语料库的检索增强生成
对齐文本、代码与视觉:一种用于文本到可视化生成的多目标强化学习框架
大语言模型在持续预训练过程中如何学习概念?
JudgeRLVR:先判断,后生成,实现高效推理
SnapGen++:释放扩散Transformer在边缘设备上高效高保真图像生成的潜力
视频生成中的运动归因
VLingNav: 具备自适应推理与视觉辅助语言记忆的具身导航
Ministral 3
置信度二分法:工具使用Agent中误校准问题的分析与缓解
ArenaRL:通过基于锦标赛的相对排名实现开放式智能体的强化学习扩展
ShowUI-π:基于流的生成模型作为GUI灵巧手
在野外学习潜在动作世界模型
Dr. Zero:无需训练数据的自演化搜索Agent
STEM:通过嵌入模块扩展Transformer
迷失在噪声中:推理模型在上下文干扰项下的失效机制
超越静态工具:面向科学推理的测试时工具演化
VIBE:基于视觉指令的编辑器
协作式多Agent测试时强化学习用于推理
奖励稀有:面向LLM创造性问题求解的感知独特性强化学习
基于视觉-语言推理的城市社会语义分割
STEP3-VL-10B 技术报告
SeedFold:扩展生物分子结构预测
TranslateGemma 技术报告
Fast-ThinkAct:通过可表述的潜在规划实现高效的视觉-语言-动作推理
SkinFlow:通过动态视觉编码与分阶段强化学习实现开放性皮肤病诊断的高效信息传输
A^3-Bench:通过锚点与吸引子激活进行内存驱动型科学推理的基准测试
算法代码优化的受控自演化
MAXS:基于LLM Agent的元自适应探索
DeepResearchEval:一种用于深度研究任务构建与代理评估的自动化框架
0型映射到旗流形空间的动机类
UniversalRAG:面向多模态与多粒度语料库的检索增强生成
对齐文本、代码与视觉:一种用于文本到可视化生成的多目标强化学习框架
大语言模型在持续预训练过程中如何学习概念?
JudgeRLVR:先判断,后生成,实现高效推理
SnapGen++:释放扩散Transformer在边缘设备上高效高保真图像生成的潜力
视频生成中的运动归因
VLingNav: 具备自适应推理与视觉辅助语言记忆的具身导航
Ministral 3
置信度二分法:工具使用Agent中误校准问题的分析与缓解
ArenaRL:通过基于锦标赛的相对排名实现开放式智能体的强化学习扩展
ShowUI-π:基于流的生成模型作为GUI灵巧手
在野外学习潜在动作世界模型
Dr. Zero:无需训练数据的自演化搜索Agent