HyperAI超神经

理解谈判博弈中人类代理与AI代理之间的经济权衡

Agent

偏好

Crystal Qian, Kehang Zhu, John Horton, et al.

Jupiter：通过Notebook与推理时价值引导搜索增强LLM数据分析能力

LLM

推理

Shuocheng Li, Yihao Liu, Silin Du, et al.

翻译

LLM

Mao Zheng, Zheng Li, Bingxin Qu, et al.

计算机视觉

语义分割

Changfeng Ma, Yang Li, Xinhao Yan, et al.

Agent

强化学习

Zhiheng Xi, Jixuan Huang, Chenyang Liao, et al.

3D 模型

建模

Lingdong Kong, Wesley Yang, Jianbiao Mei, et al.

偏好

图像生成

Jie Wu, Yu Gao, Zilyu Ye, et al.

强化学习

LLM

Jeffrey Amico, Gabriel Passamani Andrade, John Donaghy, et al.

文档理解

数据集

Abhinav Arun, Fabrizio Dimino, Tejas Prakash Agarwal, et al.

强化学习

推理

Kaiyan Zhang, Yuxin Zuo, Bingxiang He, et al.

LLM

心理

Lujain Ibrahim, Katherine M. Collins, Sunnie S. Y. Kim, et al.

具身智能

Agent

Qi Lv, Weijie Kong, Hao Li, et al.

扩散模型

图像生成

Yufeng Cheng, Wenxu Wu, Shaojin Wu, et al.

多模态

图像生成

Ji Xie, Trevor Darrell, Luke Zettlemoyer, et al.

推理

Agent

Xin Lai, Junyi Li, Wei Li, et al.

多模态表征

多模态

Heeji Yoon, Jaewoo Jung, Junwan Kim, et al.

强化学习

监督式微调

Tong Zheng, Hongming Zhang, Wenhao Yu, et al.

语音生成

数据集

Longhao Li, Zhao Guo, Hongjie Chen, et al.

多模态

文档理解

Qin Chen, Yuanyi Ren, Xiaojun Ma, et al.

LLM

Agent

Cunxi Yu, Rongjian Liang, Chia-Tung Ho, et al.

强化学习

Agent

Wenjun Li, Zhi Chen, Jingru Lin, et al.

LLM

推理

Zetong Zhou, Dongping Chen, Zixian Ma, et al.

计算机视觉

医学影像

Che Liu, Yinda Chen, Haoyuan Shi, et al.

LLM

监督式微调

Yinjie Wang, Ling Yang, Bowen Li, et al.

Agent

监督式微调

Junteng Liu, Yunji Li, Chi Zhang, et al.

推理

LLM

Haozhe Wang, Haoran Que, Qixin Xu, et al.

Agent

LLM

Jusheng Zhang, Yijia Fan, Kaitong Cai, et al.

自然语言处理

监督式微调

Aysenur Kocak, Shuo Yang, Bardh Prenkaj, et al.

MedVista3D：用于减少三维CT疾病检测、理解与报告中诊断错误的视觉-语言建模

视觉问答

多模态

Yuheng Li, Yenho Chen, Yuxiang Lai, et al.

扩散模型

图生图

Ruofan Liang, Kai He, Zan Gojcic, et al.

基准

视觉问答

Gagan Mundada, Yash Vishe, Amit Namburi, et al.

LLM

文本生成

Itai Gat, Heli Ben-Hamu, Marton Havasi, et al.

理解谈判博弈中人类代理与AI代理之间的经济权衡

Agent

偏好

Crystal Qian, Kehang Zhu, John Horton, et al.

Jupiter：通过Notebook与推理时价值引导搜索增强LLM数据分析能力

LLM

推理

Shuocheng Li, Yihao Liu, Silin Du, et al.

翻译

LLM

Mao Zheng, Zheng Li, Bingxin Qu, et al.

计算机视觉

语义分割

Changfeng Ma, Yang Li, Xinhao Yan, et al.

Agent

强化学习

Zhiheng Xi, Jixuan Huang, Chenyang Liao, et al.

3D 模型

建模

Lingdong Kong, Wesley Yang, Jianbiao Mei, et al.

偏好

图像生成

Jie Wu, Yu Gao, Zilyu Ye, et al.

强化学习

LLM

Jeffrey Amico, Gabriel Passamani Andrade, John Donaghy, et al.

文档理解

数据集

Abhinav Arun, Fabrizio Dimino, Tejas Prakash Agarwal, et al.

强化学习

推理

Kaiyan Zhang, Yuxin Zuo, Bingxiang He, et al.

LLM

心理

Lujain Ibrahim, Katherine M. Collins, Sunnie S. Y. Kim, et al.

具身智能

Agent

Qi Lv, Weijie Kong, Hao Li, et al.

扩散模型

图像生成

Yufeng Cheng, Wenxu Wu, Shaojin Wu, et al.

多模态

图像生成

Ji Xie, Trevor Darrell, Luke Zettlemoyer, et al.

推理

Agent

Xin Lai, Junyi Li, Wei Li, et al.

多模态表征

多模态

Heeji Yoon, Jaewoo Jung, Junwan Kim, et al.

强化学习

监督式微调

Tong Zheng, Hongming Zhang, Wenhao Yu, et al.

语音生成

数据集

Longhao Li, Zhao Guo, Hongjie Chen, et al.

多模态

文档理解

Qin Chen, Yuanyi Ren, Xiaojun Ma, et al.

LLM

Agent

Cunxi Yu, Rongjian Liang, Chia-Tung Ho, et al.

强化学习

Agent

Wenjun Li, Zhi Chen, Jingru Lin, et al.

LLM

推理

Zetong Zhou, Dongping Chen, Zixian Ma, et al.

计算机视觉

医学影像

Che Liu, Yinda Chen, Haoyuan Shi, et al.

LLM

监督式微调

Yinjie Wang, Ling Yang, Bowen Li, et al.

Agent

监督式微调

Junteng Liu, Yunji Li, Chi Zhang, et al.

推理

LLM

Haozhe Wang, Haoran Que, Qixin Xu, et al.

Agent

LLM

Jusheng Zhang, Yijia Fan, Kaitong Cai, et al.

自然语言处理

监督式微调

Aysenur Kocak, Shuo Yang, Bardh Prenkaj, et al.

视觉问答

多模态

Yuheng Li, Yenho Chen, Yuxiang Lai, et al.

扩散模型

图生图

Ruofan Liang, Kai He, Zan Gojcic, et al.

基准

视觉问答

Gagan Mundada, Yash Vishe, Amit Namburi, et al.

LLM

文本生成

Itai Gat, Heli Ben-Hamu, Marton Havasi, et al.

Hunyuan-MT 技术报告

P3-SAM：原生3D部件分割

AgentGym-RL：通过多轮强化学习训练LLM Agent实现长时程决策

三维与四维世界建模：一项综述

RewardDance：视觉生成中的奖励缩放

分享即关爱：基于集体强化学习经验共享的高效LM后训练

FinReflectKG：金融知识图谱的智能体构建与评估

大规模推理模型的强化学习研究综述

衡量并缓解过度依赖对于构建与人类兼容的AI至关重要

F1：一种连接理解与生成到行动的视觉-语言-行动模型

UMO：通过匹配奖励实现图像定制中的多身份一致性扩展

重建对齐提升统一多模态模型

Mini-o3：面向视觉搜索的推理模式与交互轮次的扩展

多模态大语言模型的视觉表征对齐

并行-R1：通过强化学习实现并行思维

WenetSpeech-Yue：一个具有多维度标注的大规模粤语语音语料库

SheetDesigner：基于规则与视觉反馈的MLLM驱动电子表格布局生成

自主代码演化邂逅NP-完全性

深度研究系统中的强化学习基础：一项综述

工具增强的视觉感知

DINOv3 是否设定了新的医学视觉标准？

用于扩散大语言模型的强化学习框架的革命性革新

WebExplorer：用于训练长时序Web Agent的探索与演化

逆向工程推理用于开放式生成

OSC：多智能体LLM协作中的动态知识对齐认知编排

CURE：用于鲁棒嵌入的可控遗忘——缓解预训练语言模型中的概念捷径

MedVista3D：用于减少三维CT疾病检测、理解与报告中诊断错误的视觉-语言建模

LuxDiT：基于视频扩散Transformer的光照估计

WildScore：在野符号音乐推理中对MLLMs的基准测试

设置块解码是一种语言模型推理加速器

Hunyuan-MT 技术报告

P3-SAM：原生3D部件分割

AgentGym-RL：通过多轮强化学习训练LLM Agent实现长时程决策

三维与四维世界建模：一项综述

RewardDance：视觉生成中的奖励缩放

分享即关爱：基于集体强化学习经验共享的高效LM后训练

FinReflectKG：金融知识图谱的智能体构建与评估

大规模推理模型的强化学习研究综述

衡量并缓解过度依赖对于构建与人类兼容的AI至关重要

F1：一种连接理解与生成到行动的视觉-语言-行动模型

UMO：通过匹配奖励实现图像定制中的多身份一致性扩展

重建对齐提升统一多模态模型

Mini-o3：面向视觉搜索的推理模式与交互轮次的扩展

多模态大语言模型的视觉表征对齐

并行-R1：通过强化学习实现并行思维

WenetSpeech-Yue：一个具有多维度标注的大规模粤语语音语料库

SheetDesigner：基于规则与视觉反馈的MLLM驱动电子表格布局生成

自主代码演化邂逅NP-完全性

深度研究系统中的强化学习基础：一项综述

工具增强的视觉感知

DINOv3 是否设定了新的医学视觉标准？

用于扩散大语言模型的强化学习框架的革命性革新

WebExplorer：用于训练长时序Web Agent的探索与演化

逆向工程推理用于开放式生成

OSC：多智能体LLM协作中的动态知识对齐认知编排

CURE：用于鲁棒嵌入的可控遗忘——缓解预训练语言模型中的概念捷径

MedVista3D：用于减少三维CT疾病检测、理解与报告中诊断错误的视觉-语言建模

LuxDiT：基于视频扩散Transformer的光照估计

WildScore：在野符号音乐推理中对MLLMs的基准测试

设置块解码是一种语言模型推理加速器

Command Palette

论文

Command Palette

论文

Command Palette

论文