HyperAI超神经

多智能体链：通过多智能体蒸馏与智能体强化学习构建端到端智能体基础模型

Agent

LLM

Weizhen Li, Jianbo Lin, Zhuosong Jiang, et al.

HPSv3：面向全谱人类偏好评分

偏好

文生图

Yuhang Ma, Xiaoshi Wu, Keqiang Sun, et al.

强化学习

Agent

Hanyu Lai, Xiao Liu, Yanxiao Zhao, et al.

基准

音频和语音处理

Seungmin Seo, Oleg Aulov, Afzal Godil, et al.

图像生成

合成

Yikai Wang, Zhouxia Wang, Zhonghua Wu, et al.

视频生成

3D 生成

Zhaoxi Chen, Tianqi Liu, Long Zhuo, et al.

检索增强生成

推理

Juyuan Wang, Rongchen Zhao, Wei Wei, et al.

神经网络

高性能计算

Bala Govind, Maxwell G. Anderson, Fan O. Wu, et al.

LLM

推理

Wenjie Chen, Wenbin Li, Di Yao, et al.

AI for Science

深度学习

Taiping Hu, Haichao Huang, Guobing Zhou, et al.

LLM

Transformer

Aditya Tomar, Coleman Hooper, Minjae Lee, et al.

LLM

合成

Pratyush Maini, Vineeth Dorna, Parth Doshi, et al.

文档理解

自然语言处理

Zhuoqun Li, Xuanang Chen, Hongyu Lin, et al.

Transformer

多任务学习

Oriane Siméoni, Huy V. Vo, Maximilian Seitzer, et al.

强化学习

LLM

Yuchen Fan, Kaiyan Zhang, Heng Zhou, et al.

多模态

推理

Yi-Fan Zhang, Xingyu Lu, Shukang Yin, et al.

视觉问答

LLM

Jean de Dieu Nyandwi, Yueqi Song, Simran Khanuja, et al.

语音生成

合成

Ryan Langman, Xuesong Yang, Paarth Neekhara, et al.

LLM

检索增强生成

Zhihao Li, Zimo Ji, Tao Zheng, et al.

检索增强生成

LLM

Junde Wu, Jiayuan Zhu, Yunli Qi, et al.

3D 模型

3D 生成

Chaoyue Song, Xiu Li, Fan Yang, et al.

机器视觉 3D

3D 生成

Yushi Lan, Yihang Luo, Fangzhou Hong, et al.

推理

检索增强生成

Mo Yu, Tsz Ting Chung, Chulun Zhou, et al.

图生视频

图生图

Lingen Li, Guangzhi Wang, Zhaoyang Zhang, et al.

文生图

图像生成

NextStep Team, Chunrui Han, Guopeng Li, et al.

推理

数据集

Runqi Qiao, Qiuna Tan, Peiqing Yang, et al.

视觉问答

基准

Ishant Chintapatla, Kazuma Choji, Naaisha Agarwal, et al.

RelayFormer：一种用于可扩展图像与视频操纵定位的统一局部-全局注意力框架

Transformer

统一多模态

Wen Huang, Jiarui Yang, Tao Dai, et al.

Transformer

自动驾驶

Jian Wang, Chaokang Jiang, Haitao Xu

Agent

推理

Lin Long, Yichen He, Wentao Ye, et al.

LLM

扩散模型

Xu Wang, Chenkai Xu, Yijie Jin, et al.

Agent

LLM

Zhitian Xie, Qintong Wu, Chengyue Yu, et al.

多智能体链：通过多智能体蒸馏与智能体强化学习构建端到端智能体基础模型

Agent

LLM

Weizhen Li, Jianbo Lin, Zhuosong Jiang, et al.

HPSv3：面向全谱人类偏好评分

偏好

文生图

Yuhang Ma, Xiaoshi Wu, Keqiang Sun, et al.

强化学习

Agent

Hanyu Lai, Xiao Liu, Yanxiao Zhao, et al.

基准

音频和语音处理

Seungmin Seo, Oleg Aulov, Afzal Godil, et al.

图像生成

合成

Yikai Wang, Zhouxia Wang, Zhonghua Wu, et al.

视频生成

3D 生成

Zhaoxi Chen, Tianqi Liu, Long Zhuo, et al.

检索增强生成

推理

Juyuan Wang, Rongchen Zhao, Wei Wei, et al.

神经网络

高性能计算

Bala Govind, Maxwell G. Anderson, Fan O. Wu, et al.

LLM

推理

Wenjie Chen, Wenbin Li, Di Yao, et al.

AI for Science

深度学习

Taiping Hu, Haichao Huang, Guobing Zhou, et al.

LLM

Transformer

Aditya Tomar, Coleman Hooper, Minjae Lee, et al.

LLM

合成

Pratyush Maini, Vineeth Dorna, Parth Doshi, et al.

文档理解

自然语言处理

Zhuoqun Li, Xuanang Chen, Hongyu Lin, et al.

Transformer

多任务学习

Oriane Siméoni, Huy V. Vo, Maximilian Seitzer, et al.

强化学习

LLM

Yuchen Fan, Kaiyan Zhang, Heng Zhou, et al.

多模态

推理

Yi-Fan Zhang, Xingyu Lu, Shukang Yin, et al.

视觉问答

LLM

Jean de Dieu Nyandwi, Yueqi Song, Simran Khanuja, et al.

语音生成

合成

Ryan Langman, Xuesong Yang, Paarth Neekhara, et al.

LLM

检索增强生成

Zhihao Li, Zimo Ji, Tao Zheng, et al.

检索增强生成

LLM

Junde Wu, Jiayuan Zhu, Yunli Qi, et al.

3D 模型

3D 生成

Chaoyue Song, Xiu Li, Fan Yang, et al.

机器视觉 3D

3D 生成

Yushi Lan, Yihang Luo, Fangzhou Hong, et al.

推理

检索增强生成

Mo Yu, Tsz Ting Chung, Chulun Zhou, et al.

图生视频

图生图

Lingen Li, Guangzhi Wang, Zhaoyang Zhang, et al.

文生图

图像生成

NextStep Team, Chunrui Han, Guopeng Li, et al.

推理

数据集

Runqi Qiao, Qiuna Tan, Peiqing Yang, et al.

视觉问答

基准

Ishant Chintapatla, Kazuma Choji, Naaisha Agarwal, et al.

Transformer

统一多模态

Wen Huang, Jiarui Yang, Tao Dai, et al.

Transformer

自动驾驶

Jian Wang, Chaokang Jiang, Haitao Xu

Agent

推理

Lin Long, Yichen He, Wentao Ye, et al.

LLM

扩散模型

Xu Wang, Chenkai Xu, Yijie Jin, et al.

Agent

LLM

Zhitian Xie, Qintong Wu, Chengyue Yu, et al.

ComputerRL：面向计算机使用Agent的端到端在线强化学习扩展

说话人去标识系统中的身份泄露评估

下一视觉粒度生成

4DNeX：轻松实现前馈式4D生成建模

ComoRAG：一种面向有状态长篇叙述推理的认知启发式记忆组织RAG

用于宽带计算与通信的集成微波神经网络

GTool：基于大语言模型的图增强工具规划

基于机器学习增强的恒电位框架对锂金属-电解质界面枝晶形成的观测

XQuant：通过KV缓存重计算突破LLM推理的内存墙

BeyondWeb：在万亿规模预训练中规模化合成数据的启示

PaperRegister：通过分层注册索引提升细粒度论文检索

DINOv3

SSRL：自搜索强化学习

Thyme：超越图像的思考

用文化知识对多语言多模态LLM进行接地

HiFiTTS-2：一个大规模高带宽语音数据集

CryptoScope：利用大语言模型实现密码逻辑漏洞的自动化检测

医学图谱RAG：通过图谱检索增强生成实现安全的医学大语言模型

Puppeteer：为你的3D模型绑定并动画化

STream3R：基于因果Transformer的可扩展序列3D重建

PRELUDE：一个旨在要求对长上下文进行全局理解与推理的基准

ToonComposer：通过生成式后关键帧技术简化动画制作

NextStep-1：面向大规模连续Token的自回归图像生成

We-Math 2.0：一种用于激励视觉数学推理的多功能MathBook系统

COREVQA：一种众包观察与推理蕴含的视觉问答基准

RelayFormer：一种用于可扩展图像与视频操纵定位的统一局部-全局注意力框架

GMF-Drive：具有空间感知BEV表示的门控Mamba融合用于端到端自动驾驶

看、听、记、思：具备长期记忆的多模态Agent

扩散型LLM可通过离散扩散强制实现快于自回归的推理

AWorld：具有稳定机动性的动态多Agent系统，用于鲁棒的GAIA问题求解

ComputerRL：面向计算机使用Agent的端到端在线强化学习扩展

说话人去标识系统中的身份泄露评估

下一视觉粒度生成

4DNeX：轻松实现前馈式4D生成建模

ComoRAG：一种面向有状态长篇叙述推理的认知启发式记忆组织RAG

用于宽带计算与通信的集成微波神经网络

GTool：基于大语言模型的图增强工具规划

基于机器学习增强的恒电位框架对锂金属-电解质界面枝晶形成的观测

XQuant：通过KV缓存重计算突破LLM推理的内存墙

BeyondWeb：在万亿规模预训练中规模化合成数据的启示

PaperRegister：通过分层注册索引提升细粒度论文检索

DINOv3

SSRL：自搜索强化学习

Thyme：超越图像的思考

用文化知识对多语言多模态LLM进行接地

HiFiTTS-2：一个大规模高带宽语音数据集

CryptoScope：利用大语言模型实现密码逻辑漏洞的自动化检测

医学图谱RAG：通过图谱检索增强生成实现安全的医学大语言模型

Puppeteer：为你的3D模型绑定并动画化

STream3R：基于因果Transformer的可扩展序列3D重建

PRELUDE：一个旨在要求对长上下文进行全局理解与推理的基准

ToonComposer：通过生成式后关键帧技术简化动画制作

NextStep-1：面向大规模连续Token的自回归图像生成

We-Math 2.0：一种用于激励视觉数学推理的多功能MathBook系统

COREVQA：一种众包观察与推理蕴含的视觉问答基准

RelayFormer：一种用于可扩展图像与视频操纵定位的统一局部-全局注意力框架

GMF-Drive：具有空间感知BEV表示的门控Mamba融合用于端到端自动驾驶

看、听、记、思：具备长期记忆的多模态Agent

扩散型LLM可通过离散扩散强制实现快于自回归的推理

AWorld：具有稳定机动性的动态多Agent系统，用于鲁棒的GAIA问题求解

Command Palette

论文

Command Palette

论文

Command Palette

论文