Command Palette
Search for a command to run...
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

SPAN:单目3D目标检测中的空间投影对齐

高维系统伏尔泰拉级数的高效近似































SPAN:单目3D目标检测中的空间投影对齐

高维系统伏尔泰拉级数的高效近似






























SofT-GRPO:通过Gumbel重参数化软思考策略优化超越离散token的LLM强化学习
RedOne 2.0:重新思考社交网络服务中的领域特定LLM后训练
车站:一个用于AI驱动发现的开放世界环境
DRIVE:面向竞争性代码生成中可验证奖励强化学习的数据编排最佳实践
IterResearch:通过马尔可夫状态重构重新思考长时域Agent
HaluMem:评估Agent记忆系统中的幻觉
GVPO:面向大语言模型后训练的分组方差策略优化
ReCA:面向实时高效协作式具身自主Agent的集成加速
DexFlyWheel:一种可扩展且自提升的灵巧操作数据生成框架
NovaFlow:通过生成视频中的可操作流实现零样本操控
TreeSynth:通过树引导的子空间划分从零开始合成多样化数据
GTA:基于监督引导的大语言模型文本分类强化学习
使用PLACER建模蛋白质-小分子构象集合
Agentic上下文工程:面向自提升语言模型的上下文演化
DiaMoE-TTS:一种基于IPA的统一方言TTS框架,支持多专家模型与参数高效零样本适配
AI辅助的AR装配:用于增强现实辅助装配的物体识别与计算机视觉
在针堆中越狱
CritiCal:批判性反馈能否帮助LLM不确定性或置信度校准?
通过优化文本嵌入缓解大型视觉-语言模型中的幻觉问题
视觉空间调谐
好到不像反派:论LLMs在扮演反派角色时的失败
DeepEyesV2:迈向代理型多模态模型
基于机器学习的连续血糖监测用于识别代谢亚表型并指导精准生活方式干预
在测试阶段重用预训练数据是一种计算倍增器
NVIDIA Nemotron Nano V2 VL
CostBench:评估LLM工具使用Agent在动态环境中多轮成本最优规划与适应性
寒武纪-S:迈向视频中的空间超感知
通过经验合成实现Agent学习的扩展
V-Thinker:与图像交互的思考
基于视频的思考:视频生成作为一种有前景的多模态推理范式
SofT-GRPO:通过Gumbel重参数化软思考策略优化超越离散token的LLM强化学习
RedOne 2.0:重新思考社交网络服务中的领域特定LLM后训练
车站:一个用于AI驱动发现的开放世界环境
DRIVE:面向竞争性代码生成中可验证奖励强化学习的数据编排最佳实践
IterResearch:通过马尔可夫状态重构重新思考长时域Agent
HaluMem:评估Agent记忆系统中的幻觉
GVPO:面向大语言模型后训练的分组方差策略优化
ReCA:面向实时高效协作式具身自主Agent的集成加速
DexFlyWheel:一种可扩展且自提升的灵巧操作数据生成框架
NovaFlow:通过生成视频中的可操作流实现零样本操控
TreeSynth:通过树引导的子空间划分从零开始合成多样化数据
GTA:基于监督引导的大语言模型文本分类强化学习
使用PLACER建模蛋白质-小分子构象集合
Agentic上下文工程:面向自提升语言模型的上下文演化
DiaMoE-TTS:一种基于IPA的统一方言TTS框架,支持多专家模型与参数高效零样本适配
AI辅助的AR装配:用于增强现实辅助装配的物体识别与计算机视觉
在针堆中越狱
CritiCal:批判性反馈能否帮助LLM不确定性或置信度校准?
通过优化文本嵌入缓解大型视觉-语言模型中的幻觉问题
视觉空间调谐
好到不像反派:论LLMs在扮演反派角色时的失败
DeepEyesV2:迈向代理型多模态模型
基于机器学习的连续血糖监测用于识别代谢亚表型并指导精准生活方式干预
在测试阶段重用预训练数据是一种计算倍增器
NVIDIA Nemotron Nano V2 VL
CostBench:评估LLM工具使用Agent在动态环境中多轮成本最优规划与适应性
寒武纪-S:迈向视频中的空间超感知
通过经验合成实现Agent学习的扩展
V-Thinker:与图像交互的思考
基于视频的思考:视频生成作为一种有前景的多模态推理范式