HyperAI超神经

OmniFusion 技术报告

视觉问答

统一多模态

Elizaveta Goncharova, Anton Razzhigaev, Matvey Mikhalchuk, et al.

机器学习预测误差优于DFT精度

深度学习

分子网络

Felix A. Faber, Luke Hutchison, Bing Huang, et al.

Agent

统一多模态

Zeyi Sun, Ziyu Liu, Yuhang Zang, et al.

AI for Science

深度学习

Changze Lv, Jiang Zhou, Siyu Long, et al.

检索增强生成

LLM

Xiaoya Li, Xiaofei Sun, Albert Wang, et al.

Transformer

视频处理

Joonmyung Choi, Sanghyeok Lee, Byungoh Ko, et al.

LLM

推理

Shudong Liu, Hongwei Liu, Junnan Liu, et al.

视频生成

多模态

Jianxiong Gao, Zhaoxi Chen, Xian Liu, et al.

文生图

图像理解

Peiyu Wang, Yi Peng, Yimeng Gan, et al.

LLM

扩散模型

\Yuxuan Song\, \ Zheng Zhang\, \ Cheng Luo\, et al.

强化学习

LLM

Xufang Luo, Yuge Zhang, Zhiyuan He, et al.

Qingyu Ren, Qianyu He, Bowei Zhang, et al.

LLM

监督式微调

Sajana Weerawardhena, Paul Kassianik, Blaine Nelson, et al.

Agent

建模

Xiangru Tang, Zhuoyun Yu, Jiapeng Chen, et al.

检索增强生成

文档理解

Junjie Wu, Jiangnan Li, Yuqing Li, et al.

强化学习

LLM

Yihong Dong, Xue Jiang, Yongding Tao, et al.

机器视觉 3D

3D 模型

Baijun Ye, Minghui Qin, Saining Zhang, et al.

Agent

LLM

Han Li, Yuling Shi, Shaoxin Lin, et al.

多模态

多模态表征

Henghui Ding, Song Tang, Shuting He, et al.

视觉问答

推理

Ting Huang, Zeyu Zhang, Hao Tang

Agent

LLM

Silin Chen, Shaoxin Lin, Xiaodong Gu, et al.

扩散模型

图像生成

Shuai Wang, Ziteng Gao, Chenhui Zhu, et al.

LLM

扩散模型

Jinsong Li, Xiaoyi Dong, Yuhang Zang, et al.

Agent

LLM

Tianqing Fang, Zhisong Zhang, Xiaoyang Wang, et al.

人机交互

算法

Rashid Mushkani, Hugo Berard, Toumadher Ammar, et al.

Transformer

3D 生成

Gyeongjin Kang, Seungtae Nam, Xiangyu Sun, et al.

机器人技术

视频理解

Xiaoyu Chen, Hangxing Wei, Pushi Zhang, et al.

基准

数据集

Chengqian Ma, Wei Tao, Yiwen Guo

LLM

检索增强生成

Chao Yi, Dian Chen, Gaoyang Guo, et al.

多模态

图像理解

Miaosen Zhang, Ziqiang Xu, Jialiang Zhu, et al.

LLM

推理

Luoxin Chen, Jinming Gu, Liankai Huang, et al.

OmniFusion 技术报告

视觉问答

统一多模态

Elizaveta Goncharova, Anton Razzhigaev, Matvey Mikhalchuk, et al.

机器学习预测误差优于DFT精度

深度学习

分子网络

Felix A. Faber, Luke Hutchison, Bing Huang, et al.

Agent

统一多模态

Zeyi Sun, Ziyu Liu, Yuhang Zang, et al.

AI for Science

深度学习

Changze Lv, Jiang Zhou, Siyu Long, et al.

检索增强生成

LLM

Xiaoya Li, Xiaofei Sun, Albert Wang, et al.

Transformer

视频处理

Joonmyung Choi, Sanghyeok Lee, Byungoh Ko, et al.

LLM

推理

Shudong Liu, Hongwei Liu, Junnan Liu, et al.

视频生成

多模态

Jianxiong Gao, Zhaoxi Chen, Xian Liu, et al.

文生图

图像理解

Peiyu Wang, Yi Peng, Yimeng Gan, et al.

LLM

扩散模型

\Yuxuan Song\, \ Zheng Zhang\, \ Cheng Luo\, et al.

强化学习

LLM

Xufang Luo, Yuge Zhang, Zhiyuan He, et al.

Qingyu Ren, Qianyu He, Bowei Zhang, et al.

LLM

监督式微调

Sajana Weerawardhena, Paul Kassianik, Blaine Nelson, et al.

Agent

建模

Xiangru Tang, Zhuoyun Yu, Jiapeng Chen, et al.

检索增强生成

文档理解

Junjie Wu, Jiangnan Li, Yuqing Li, et al.

强化学习

LLM

Yihong Dong, Xue Jiang, Yongding Tao, et al.

机器视觉 3D

3D 模型

Baijun Ye, Minghui Qin, Saining Zhang, et al.

Agent

LLM

Han Li, Yuling Shi, Shaoxin Lin, et al.

多模态

多模态表征

Henghui Ding, Song Tang, Shuting He, et al.

视觉问答

推理

Ting Huang, Zeyu Zhang, Hao Tang

Agent

LLM

Silin Chen, Shaoxin Lin, Xiaodong Gu, et al.

扩散模型

图像生成

Shuai Wang, Ziteng Gao, Chenhui Zhu, et al.

LLM

扩散模型

Jinsong Li, Xiaoyi Dong, Yuhang Zang, et al.

Agent

LLM

Tianqing Fang, Zhisong Zhang, Xiaoyang Wang, et al.

人机交互

算法

Rashid Mushkani, Hugo Berard, Toumadher Ammar, et al.

Transformer

3D 生成

Gyeongjin Kang, Seungtae Nam, Xiangyu Sun, et al.

机器人技术

视频理解

Xiaoyu Chen, Hangxing Wei, Pushi Zhang, et al.

基准

数据集

Chengqian Ma, Wei Tao, Yiwen Guo

LLM

检索增强生成

Chao Yi, Dian Chen, Gaoyang Guo, et al.

多模态

图像理解

Miaosen Zhang, Ziqiang Xu, Jialiang Zhu, et al.

LLM

推理

Luoxin Chen, Jinming Gu, Liankai Huang, et al.

SEAgent：具备从经验中自主学习能力的自演化计算机使用代理

AMix-1：通往测试时可扩展蛋白质基础模型的路径

CRINN：用于近似最近邻搜索的对比强化学习

表示偏移：统一令牌压缩与FlashAttention

CompassVerifier：一种统一且鲁棒的LLM评估与结果奖励验证器

LongVie：多模态引导的可控超长视频生成

Skywork UniPic：面向视觉理解与生成的统一自回归建模

Seed Diffusion：一种具备高速推理能力的大规模扩散语言模型

Agent Lightning：使用强化学习训练任意AI Agent

基于LLM指导的进化蒙特卡洛树搜索的引力波探测自动化算法发现

超越权衡：用于推理模型指令遵循的自监督强化学习

Llama-3.1-基础AI安全LLM-8B-指令技术报告

CellForge：虚拟细胞模型的智能体设计

SitEmb-v1.5：面向语义关联与长故事理解的改进型上下文感知密集检索

RL-PLUS：基于混合策略优化的LLM强化学习能力边界坍塌对抗方法

GS-Occ3D：基于高斯点阵的纯视觉占据重建扩展

SWE-Debate：用于软件问题解决的竞争性多Agent辩论

多模态指代分割：一项综述

3D-R1：提升3D VLMs中的推理能力以实现统一场景理解

SWE-Exp：基于经验的软件问题解决

PixNerd：像素神经场扩散

超越固定长度：用于扩散大语言模型的可变长度去噪

认知内核-Pro：面向深度研究Agent与Agent基础模型训练的框架

协同生成人工智能：迈向增强型、参与式的生命周期

iLRM：一种迭代式大规模3D重建模型

villa-X：提升视觉-语言-动作模型中的潜在动作建模

C3：一个用于探索复杂对话中挑战的双语口语对话模型基准

RecGPT 技术报告

Phi-Ground 技术报告：推进GUI接地中的感知能力

Seed-Prover：自动化定理证明中的深度与广度推理

SEAgent：具备从经验中自主学习能力的自演化计算机使用代理

AMix-1：通往测试时可扩展蛋白质基础模型的路径

CRINN：用于近似最近邻搜索的对比强化学习

表示偏移：统一令牌压缩与FlashAttention

CompassVerifier：一种统一且鲁棒的LLM评估与结果奖励验证器

LongVie：多模态引导的可控超长视频生成

Skywork UniPic：面向视觉理解与生成的统一自回归建模

Seed Diffusion：一种具备高速推理能力的大规模扩散语言模型

Agent Lightning：使用强化学习训练任意AI Agent

基于LLM指导的进化蒙特卡洛树搜索的引力波探测自动化算法发现

超越权衡：用于推理模型指令遵循的自监督强化学习

Llama-3.1-基础AI安全LLM-8B-指令技术报告

CellForge：虚拟细胞模型的智能体设计

SitEmb-v1.5：面向语义关联与长故事理解的改进型上下文感知密集检索

RL-PLUS：基于混合策略优化的LLM强化学习能力边界坍塌对抗方法

GS-Occ3D：基于高斯点阵的纯视觉占据重建扩展

SWE-Debate：用于软件问题解决的竞争性多Agent辩论

多模态指代分割：一项综述

3D-R1：提升3D VLMs中的推理能力以实现统一场景理解

SWE-Exp：基于经验的软件问题解决

PixNerd：像素神经场扩散

超越固定长度：用于扩散大语言模型的可变长度去噪

认知内核-Pro：面向深度研究Agent与Agent基础模型训练的框架

协同生成人工智能：迈向增强型、参与式的生命周期

iLRM：一种迭代式大规模3D重建模型

villa-X：提升视觉-语言-动作模型中的潜在动作建模

C3：一个用于探索复杂对话中挑战的双语口语对话模型基准

RecGPT 技术报告

Phi-Ground 技术报告：推进GUI接地中的感知能力

Seed-Prover：自动化定理证明中的深度与广度推理

Command Palette

论文

Command Palette

论文

Command Palette

论文