HyperAI超神经

Taebong Kim, Minsik Kim, Sunyoung Choi, et al.

推理

SceneFun3D：三维场景中的细粒度功能与可供性理解

机器视觉 3D

语义分割

TheoremGraph：桥接形式化与非形式化数学

检索增强生成

Simon Kurgan, Evan Wang, Eric Leonen, et al.

始终在线智能体：大语言模型智能体的持久记忆、状态与治理综述

Tianyu Ding, Aditya Nannapaneni, Bingfan Liu, et al.

守护AI智能体：面向多层智能体红队测试的统一框架

Yong Yang, Xing Zheng, Huiyu Wu, et al.

DataComp-VLM：面向视觉语言模型的改进开放数据集

数据集

Matteo Farina, Vishaal Udandarao, Thao Nguyen, et al.

OrbitQuant：面向图像与视频扩散Transformer的数据无关量化方法

Donghyun Lee, Jitesh Chavan, Duy Nguyen, et al.

图像生成

VLA-Corrector：面向自适应动作视野的轻量级检测与修正推理框架

Yi Pan, Miao Pan, Qi Lu, et al.

Embodied.cpp：面向异构机器人的具身AI模型可移植推理运行时

具身智能

Ling Xu, Chuyu Han, Borui Li, et al.

优化训练策略的幻象：单调推理策略——大语言模型强化学习的真正目标

Jing Liang, Hongyao Tang, Yi Ma, et al.

监督式微调

GeneBench-Pro：评估基因组学、定量生物学与转化生物医学中的多阶段统计推理

AI for Science

Jeremy Li, Andrew Ho

立场：AI/ML深度伪造研究与AI生成的非自愿亲密影像（AIG-NCII）存在错位

图像生成

Li Qiwei, Wells Lucas Santo, Sarita Schoenebeck, et al.

理解Grokking：岭回归中可证明的Grokking现象

Mingyue Xu, Gal Vardi, Itay Safran

扩散模型一致性的随机矩阵理论视角

Binxu Wang, Jacob Zavatone-Veth, Cengiz Pehlevan

语言模型记忆了多少？

Transformer

John X. Morris, Chawin Sitawarin, Chuan Guo, et al.

混淆图集：用欺骗探针映射RLVR中诚实的涌现位置

Mohammad Taufeeque, Stefan Heimersheim, Adam Gleave, et al.

立场：对齐社区正在无意间构建审查工具包

Sarah Ball, Phil Hackemann

监督式微调

扩散模型与对数凹分布的高精度采样

Fan Chen, Sinho Chewi, Constantinos Daskalakis, et al.

AgenticDataBench：面向数据智能体的综合评测基准

Zhaoyan Sun, Shan Zhong, Daizhou Wen, et al.

多分辨率流匹配：通过分阶段采样实现无需训练的扩散加速

文生图

Xingyu Zheng, Xianglong Liu, Yifu Ding, et al.

跃变为混合注意力模型

Transformer

Disen Lan, Jianbin Zheng, Yuxi Ren, et al.

EvoPolicyGym：评估交互式环境中的自主策略演化能力

Zhilin Wang, Han Song, Runzhe Zhan, et al.

AgenticSTS：面向长周期LLM智能体的有界记忆测试平台

Xiangchen Cheng, Yunwei Jiang, Jianwen Sun, et al.

程序即权重：一种面向模糊函数的编程范式

Wentao Zhang, Liliana Hotsko, Woojeong Kim, et al.

代码生成

MatAnyone 2：通过学习的质量评估器扩展视频抠图

视频处理

图像分割

Peiqing Yang, Shangchen Zhou, Kai Hao, et al.

EdgeTAM：端侧可追踪任意模型

图像分割

目标跟踪

Chong Zhou, Chenchen Zhu, Yunyang Xiong, et al.

PixelRefer：面向任意粒度的时空目标指称统一框架

Yuqian Yuan, Wenqiao Zhang, Xin Li, et al.

多模态表征

EdgeBench：揭示从真实世界环境中学习的标度律

Deyao Zhu, Xin Zhou, Shengling Qin, et al.

ASPIRE：面向机器人的智能体技能发现

Runyu Lu, Yubo Wu, Ethan Kou, et al.

机器人技术

AUTOMEM：自动化学习记忆作为一项认知技能

Shengguang Wu, Hao Zhu, Yuhui Zhang, et al.

解码工作定律：基于裕度控制、可证明精确的压缩几何空间连接

地理信息

Madhulatha Mandarapu, Sandeep Kunkunuru

组合优化问题的神经证书定价方法