HyperAI超神经

视频生成模型是优秀的潜在奖励模型

统一多模态

扩散模型

Xiaoyue Mi, Wenqing Yu, Jiesong Lian, et al.

DeepSeekMath-V2：迈向自验证的数学推理

LLM

推理

Zhihong Shao, Yuxiang Luo, Chengda Lu, et al.

Agent

推理

Hongjin Su, Shizhe Diao, Ximing Lu, et al.

多模态

推理

Beichen Zhang, Yuhang Zang, Xiaoyi Dong, et al.

扩散模型

统一多模态

Teng Hu, Zhentao Yu, Guozhen Zhang, et al.

视频理解

合成

Inferix Team, Tianyu Feng, Yizeng Han, et al.

Agent

LLM

Jiaru Zou, Xiyuan Yang, Ruizhong Qiu, et al.

多模态

基准

Artem Chervyakov, Ulyana Isaeva, Anton Emelyanov, et al.

LLM

Transformer

Wei He, Kai Han, Hang Zhou, et al.

机器学习

人工智能

Yizhou Liu, Ziming Liu, Jeff Gore

机器学习

人工智能

Zachary Chase, Steve Hanneke, Shay Moran, et al.

强化学习

LLM

Yang Yue, Zhiqi Chen, Rui Lu, et al.

扩散模型

深度学习

Tony Bonnaire, Raphaël Urfin, Giulio Biroli, et al.

强化学习

神经网络

Kevin Wang, Ishaan Javali, Michał Bortkiewicz, et al.

Transformer

LLM

Zihan Qiu, Zekun Wang, Bo Zheng, et al.

LLM

数据集

Liwei Jiang, Yuanjun Chai, Margaret Li, et al.

模型训练

LLM

Bidipta Sarkar, Mattie Fellows, Juan Agustin Duque, et al.

统一多模态

推理

Yuwei Niu, Weiyang Jin, Jiaqi Liao, et al.

统一多模态

图像生成

Zhoujie Fu, Xianfang Zeng, Jinghong Lan, et al.

Agent

推理

Jiaqi Liu, Kaiwen Xiong, Peng Xia, et al.

图像分割

统一多模态

Anglin Liu, Rundong Xue, Xu R. Cao, et al.

图生视频

图生图

Jiaming Zhang, Shengming Cao, Rui Li, et al.

LLM

算法

Valentin Khrulkov, Andrey Galichin, Denis Bashkirov, et al.

偏好

基准

Oren Barkan, Yahlly Schein, Yehonatan Elisha, et al.

深度学习

神经网络

Dor Arviv, Yehonatan Elisha, Oren Barkan, et al.

目标检测

语义分割

Leena Alghamdi, Muhammad Usman, Hafeez Anwar, et al.

Agent

LLM

Tengxiao Liu, Zifeng Wang, Jin Miao, et al.

图生视频

视频生成

Gongfan Fang, Xinyin Ma, Xinchao Wang

强化学习

智能问答

Rulin Shao, Akari Asai, Shannon Zejiang Shen, et al.

AICC：精细化HTML解析，提升模型性能 —— 基于模型HTML解析器构建的7.3T面向AI语料库

LLM

文档理解

Ren Ma, Jiantao Qiu, Chao Xu, et al.

UltraFlux：面向跨多种纵横比的高质量原生4K文本到图像生成的数据-模型协同设计

文生图

扩散模型

Tian Ye, Song Fei, Lei Zhu

扩散模型

图像生成

Zehong Ma, Longhui Wei, Shuai Wang, et al.

视频生成模型是优秀的潜在奖励模型

统一多模态

扩散模型

Xiaoyue Mi, Wenqing Yu, Jiesong Lian, et al.

DeepSeekMath-V2：迈向自验证的数学推理

LLM

推理

Zhihong Shao, Yuxiang Luo, Chengda Lu, et al.

Agent

推理

Hongjin Su, Shizhe Diao, Ximing Lu, et al.

多模态

推理

Beichen Zhang, Yuhang Zang, Xiaoyi Dong, et al.

扩散模型

统一多模态

Teng Hu, Zhentao Yu, Guozhen Zhang, et al.

视频理解

合成

Inferix Team, Tianyu Feng, Yizeng Han, et al.

Agent

LLM

Jiaru Zou, Xiyuan Yang, Ruizhong Qiu, et al.

多模态

基准

Artem Chervyakov, Ulyana Isaeva, Anton Emelyanov, et al.

LLM

Transformer

Wei He, Kai Han, Hang Zhou, et al.

机器学习

人工智能

Yizhou Liu, Ziming Liu, Jeff Gore

机器学习

人工智能

Zachary Chase, Steve Hanneke, Shay Moran, et al.

强化学习

LLM

Yang Yue, Zhiqi Chen, Rui Lu, et al.

扩散模型

深度学习

Tony Bonnaire, Raphaël Urfin, Giulio Biroli, et al.

强化学习

神经网络

Kevin Wang, Ishaan Javali, Michał Bortkiewicz, et al.

Transformer

LLM

Zihan Qiu, Zekun Wang, Bo Zheng, et al.

LLM

数据集

Liwei Jiang, Yuanjun Chai, Margaret Li, et al.

模型训练

LLM

Bidipta Sarkar, Mattie Fellows, Juan Agustin Duque, et al.

统一多模态

推理

Yuwei Niu, Weiyang Jin, Jiaqi Liao, et al.

统一多模态

图像生成

Zhoujie Fu, Xianfang Zeng, Jinghong Lan, et al.

Agent

推理

Jiaqi Liu, Kaiwen Xiong, Peng Xia, et al.

图像分割

统一多模态

Anglin Liu, Rundong Xue, Xu R. Cao, et al.

图生视频

图生图

Jiaming Zhang, Shengming Cao, Rui Li, et al.

LLM

算法

Valentin Khrulkov, Andrey Galichin, Denis Bashkirov, et al.

偏好

基准

Oren Barkan, Yahlly Schein, Yehonatan Elisha, et al.

深度学习

神经网络

Dor Arviv, Yehonatan Elisha, Oren Barkan, et al.

目标检测

语义分割

Leena Alghamdi, Muhammad Usman, Hafeez Anwar, et al.

Agent

LLM

Tengxiao Liu, Zifeng Wang, Jin Miao, et al.

图生视频

视频生成

Gongfan Fang, Xinyin Ma, Xinchao Wang

强化学习

智能问答

Rulin Shao, Akari Asai, Shannon Zejiang Shen, et al.

LLM

文档理解

Ren Ma, Jiantao Qiu, Chao Xu, et al.

文生图

扩散模型

Tian Ye, Song Fei, Lei Zhu

扩散模型

图像生成

Zehong Ma, Longhui Wei, Shuai Wang, et al.

ToolOrchestra：通过高效的模型与工具编排提升智能

视觉思考，文本推理：ARC中的视觉-语言协同作用

和谐：通过跨任务协同实现音频与视频生成的协同统一

Inferix：一种基于块扩散的下一代推理引擎，用于世界模拟

多智能体系统中的潜在协作

多模态评估俄语语言架构

ROOT：用于神经网络训练的鲁棒正交化优化器

叠加效应带来稳健的神经缩放

直接在线学习的最优错误界

强化学习是否真的能够激励LLM在基础模型之外提升推理能力？

扩散模型为何不会记忆：训练中隐式动力学正则化的作用

用于自监督强化学习的1000层网络：增加深度可实现新的目标达成能力

用于大型语言模型的门控注意力：非线性、稀疏性与无注意力陷阱

人工蜂群智能：语言模型（及更广泛领域）的开放性同质性

超大规模下的进化策略

理解是否推动统一多模态模型中的生成？从分析到未来路径

iMontage：统一、通用、高度动态的多对多图像生成

Agent0-VL：探索面向工具融合的视觉-语言推理的自演化智能体

MedSAM3：基于医学概念深入探索通用图像分割

SteadyDancer：基于首帧保留的协调一致的人体图像动画

GigaEvo：一个由 LLMs 和进化算法驱动的开源优化框架

基于随机路径积分的忠实度感知推荐解释

提取推荐系统中的交互感知单语义概念

MSRNet：用于伪装目标检测的多尺度递归网络

预算感知工具使用实现Agent的有效扩展

视频内指令：视觉信号作为生成控制

DR Tulu：面向深度研究的基于演化评分标准的强化学习

AICC：精细化HTML解析，提升模型性能 —— 基于模型HTML解析器构建的7.3T面向AI语料库

UltraFlux：面向跨多种纵横比的高质量原生4K文本到图像生成的数据-模型协同设计

DeCo：面向端到端图像生成的频率解耦像素扩散

ToolOrchestra：通过高效的模型与工具编排提升智能

视觉思考，文本推理：ARC中的视觉-语言协同作用

和谐：通过跨任务协同实现音频与视频生成的协同统一

Inferix：一种基于块扩散的下一代推理引擎，用于世界模拟

多智能体系统中的潜在协作

多模态评估俄语语言架构

ROOT：用于神经网络训练的鲁棒正交化优化器

叠加效应带来稳健的神经缩放

直接在线学习的最优错误界

强化学习是否真的能够激励LLM在基础模型之外提升推理能力？

扩散模型为何不会记忆：训练中隐式动力学正则化的作用

用于自监督强化学习的1000层网络：增加深度可实现新的目标达成能力

用于大型语言模型的门控注意力：非线性、稀疏性与无注意力陷阱

人工蜂群智能：语言模型（及更广泛领域）的开放性同质性

超大规模下的进化策略

理解是否推动统一多模态模型中的生成？从分析到未来路径

iMontage：统一、通用、高度动态的多对多图像生成

Agent0-VL：探索面向工具融合的视觉-语言推理的自演化智能体

MedSAM3：基于医学概念深入探索通用图像分割

SteadyDancer：基于首帧保留的协调一致的人体图像动画

GigaEvo：一个由 LLMs 和进化算法驱动的开源优化框架

基于随机路径积分的忠实度感知推荐解释

提取推荐系统中的交互感知单语义概念

MSRNet：用于伪装目标检测的多尺度递归网络

预算感知工具使用实现Agent的有效扩展

视频内指令：视觉信号作为生成控制

DR Tulu：面向深度研究的基于演化评分标准的强化学习

AICC：精细化HTML解析，提升模型性能 —— 基于模型HTML解析器构建的7.3T面向AI语料库

UltraFlux：面向跨多种纵横比的高质量原生4K文本到图像生成的数据-模型协同设计

DeCo：面向端到端图像生成的频率解耦像素扩散

Command Palette

论文

Command Palette

论文

Command Palette

论文