Command Palette
Search for a command to run...
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

CRINN:用于近似最近邻搜索的对比强化学习

表示偏移:统一令牌压缩与FlashAttention































CRINN:用于近似最近邻搜索的对比强化学习

表示偏移:统一令牌压缩与FlashAttention






























CompassVerifier:一种统一且鲁棒的LLM评估与结果奖励验证器
LongVie:多模态引导的可控超长视频生成
Skywork UniPic:面向视觉理解与生成的统一自回归建模
Seed Diffusion:一种具备高速推理能力的大规模扩散语言模型
Agent Lightning:使用强化学习训练任意AI Agent
基于LLM指导的进化蒙特卡洛树搜索的引力波探测自动化算法发现
超越权衡:用于推理模型指令遵循的自监督强化学习
Llama-3.1-基础AI安全LLM-8B-指令 技术报告
CellForge:虚拟细胞模型的智能体设计
SitEmb-v1.5:面向语义关联与长故事理解的改进型上下文感知密集检索
RL-PLUS:基于混合策略优化的LLM强化学习能力边界坍塌对抗方法
GS-Occ3D:基于高斯点阵的纯视觉占据重建扩展
SWE-Debate:用于软件问题解决的竞争性多Agent辩论
多模态指代分割:一项综述
3D-R1:提升3D VLMs中的推理能力以实现统一场景理解
SWE-Exp:基于经验的软件问题解决
PixNerd:像素神经场扩散
超越固定长度:用于扩散大语言模型的可变长度去噪
认知内核-Pro:面向深度研究Agent与Agent基础模型训练的框架
协同生成人工智能:迈向增强型、参与式的生命周期
iLRM:一种迭代式大规模3D重建模型
villa-X:提升视觉-语言-动作模型中的潜在动作建模
C3:一个用于探索复杂对话中挑战的双语口语对话模型基准
RecGPT 技术报告
Phi-Ground 技术报告:推进GUI接地中的感知能力
Seed-Prover:自动化定理证明中的深度与广度推理
野外环境下的合成语音检测:少即是多
基于方案感知与全局的ReLU选择:部分MILP在DNN验证中强势回归
思维链自指导:为推理与非推理任务构建高质量的合成提示
指向性音视频分割中的全模态表达与推理
CompassVerifier:一种统一且鲁棒的LLM评估与结果奖励验证器
LongVie:多模态引导的可控超长视频生成
Skywork UniPic:面向视觉理解与生成的统一自回归建模
Seed Diffusion:一种具备高速推理能力的大规模扩散语言模型
Agent Lightning:使用强化学习训练任意AI Agent
基于LLM指导的进化蒙特卡洛树搜索的引力波探测自动化算法发现
超越权衡:用于推理模型指令遵循的自监督强化学习
Llama-3.1-基础AI安全LLM-8B-指令 技术报告
CellForge:虚拟细胞模型的智能体设计
SitEmb-v1.5:面向语义关联与长故事理解的改进型上下文感知密集检索
RL-PLUS:基于混合策略优化的LLM强化学习能力边界坍塌对抗方法
GS-Occ3D:基于高斯点阵的纯视觉占据重建扩展
SWE-Debate:用于软件问题解决的竞争性多Agent辩论
多模态指代分割:一项综述
3D-R1:提升3D VLMs中的推理能力以实现统一场景理解
SWE-Exp:基于经验的软件问题解决
PixNerd:像素神经场扩散
超越固定长度:用于扩散大语言模型的可变长度去噪
认知内核-Pro:面向深度研究Agent与Agent基础模型训练的框架
协同生成人工智能:迈向增强型、参与式的生命周期
iLRM:一种迭代式大规模3D重建模型
villa-X:提升视觉-语言-动作模型中的潜在动作建模
C3:一个用于探索复杂对话中挑战的双语口语对话模型基准
RecGPT 技术报告
Phi-Ground 技术报告:推进GUI接地中的感知能力
Seed-Prover:自动化定理证明中的深度与广度推理
野外环境下的合成语音检测:少即是多
基于方案感知与全局的ReLU选择:部分MILP在DNN验证中强势回归
思维链自指导:为推理与非推理任务构建高质量的合成提示
指向性音视频分割中的全模态表达与推理