HyperAI超神经

Code2LoRA：软件演化下代码语言模型的超网络生成适配器

代码生成

LLM

Liliana Hotsko, Yinxi Li, Yuntian Deng, et al.

自蒸馏策略梯度

强化学习

LLM

Yifeng Liu, Shiyouan Zhang, Yifan Zhang, et al.

LLM

推理

Iman Mirzadeh, Keivan Alizadeh, Oncel Tuzel, et al.

MUSE-Autoskill：通过技能创建、记忆、管理与评估实现自我进化的智能体

Agent

LLM

Huawei Lin, Peng Li, Jie Song, et al.

Nemotron 3 Ultra：用于智能体推理的开放、高效混合专家混合 Mamba-Transformer 模型

LLM

Agent

Akter et al., Xiao et al., Liu et al., et al.

文生图

图像生成

Tianhe Wu, Kun Yan, Zikai Zhou, et al.

多模态

视频理解

Yifei Li, Pengyiang Liu, Yuhang Zang, et al.

强化学习

LLM

Xuekang Wang, Zhuoyuan Hao, Shuo Hou, et al.

Agent

LLM

Jiaming Wang, Ziteng Feng, Jiangtao Wu, et al.

LLM

音频和语音处理

Zhifei Xie, Zihang Liu, Ze An, et al.

多模态

统一多模态

Aditi, Niket Agarwal, Arslan Ali, et al.

监督式微调

模型训练

Rishabh Tiwari, Kusha Sareen, Lakshya A Agrawal, et al.

LLM

文本生成

Po-Nien Kung, Linfeng Song, Dawsen Hwang, et al.

多模态

视觉问答

Yucheng Zhou, Wei Tao, Yiwen Guo, et al.

图像生成

多模态表征

Yuval Golbari, Navve Wasserman, Matias Cosarinsky, et al.

强化学习

LLM

Lei Yang, Siyu Ding, Deyi Xiong

LLM

目标跟踪

Zekun Qi, Xuchuan Chen, Dairu Liu, et al.

LLM

文本生成

Xingrun Xing, Haoqing Wang, Boyan Gao, et al.

检索增强生成

智能问答

Maksim Savkin, Mikhail Goncharov, Alexander Gambashidze, et al.

Zhipeng Cai, Zhuang Liu, Yunyang Xiong, et al.

检索增强生成

Agent

Pengcheng Jiang, Zhiyi Shi, Kelly Hong, et al.

语义分割

图像分割

Yahui Liu, Lian Yao, Xiaohu Lu, et al.

视频生成

扩散模型

Hidir Yesiltepe, Jiazhen Hu, Tuna Han Salih Meral, et al.

文本生成

LLM

Haodi Lei, Yafy Li, Haoran Zhang, et al.

基准

Agent

Nahyun Lee, Dongkeun Yoon, Guijin Son, et al.

基准

Agent

Tomer Keren, Nitay Calderon, Asaf Yehudai, et al.

LLM

模型训练

Mind Lab, Song Cao, Vic Cao, et al.

图像生成

AI for Science

Haozhe Zhao, Shuzheng Si, Zhenhailong Wang, et al.

TACK：针对新型靶向嵌合体知识数据集（TArgeting Chimeras Knowledge）的降解活性统计评估

AI for Science

深度学习

Stefano Ribes, Nils Dunlop, Rocío Mercado

视频生成

多模态

Zhengjian Yao, Yongzhi Li, Xinyuan Gao, et al.

LLM

Agent

Minhua Lin, Juncheng Wu, Zijun Wang, et al.

Code2LoRA：软件演化下代码语言模型的超网络生成适配器

代码生成

LLM

Liliana Hotsko, Yinxi Li, Yuntian Deng, et al.

自蒸馏策略梯度

强化学习

LLM

Yifeng Liu, Shiyouan Zhang, Yifan Zhang, et al.

LLM

推理

Iman Mirzadeh, Keivan Alizadeh, Oncel Tuzel, et al.

Agent

LLM

Huawei Lin, Peng Li, Jie Song, et al.

LLM

Agent

Akter et al., Xiao et al., Liu et al., et al.

文生图

图像生成

Tianhe Wu, Kun Yan, Zikai Zhou, et al.

多模态

视频理解

Yifei Li, Pengyiang Liu, Yuhang Zang, et al.

强化学习

LLM

Xuekang Wang, Zhuoyuan Hao, Shuo Hou, et al.

Agent

LLM

Jiaming Wang, Ziteng Feng, Jiangtao Wu, et al.

LLM

音频和语音处理

Zhifei Xie, Zihang Liu, Ze An, et al.

多模态

统一多模态

Aditi, Niket Agarwal, Arslan Ali, et al.

监督式微调

模型训练

Rishabh Tiwari, Kusha Sareen, Lakshya A Agrawal, et al.

LLM

文本生成

Po-Nien Kung, Linfeng Song, Dawsen Hwang, et al.

多模态

视觉问答

Yucheng Zhou, Wei Tao, Yiwen Guo, et al.

图像生成

多模态表征

Yuval Golbari, Navve Wasserman, Matias Cosarinsky, et al.

强化学习

LLM

Lei Yang, Siyu Ding, Deyi Xiong

LLM

目标跟踪

Zekun Qi, Xuchuan Chen, Dairu Liu, et al.

LLM

文本生成

Xingrun Xing, Haoqing Wang, Boyan Gao, et al.

检索增强生成

智能问答

Maksim Savkin, Mikhail Goncharov, Alexander Gambashidze, et al.

Zhipeng Cai, Zhuang Liu, Yunyang Xiong, et al.

检索增强生成

Agent

Pengcheng Jiang, Zhiyi Shi, Kelly Hong, et al.

语义分割

图像分割

Yahui Liu, Lian Yao, Xiaohu Lu, et al.

视频生成

扩散模型

Hidir Yesiltepe, Jiazhen Hu, Tuna Han Salih Meral, et al.

文本生成

LLM

Haodi Lei, Yafy Li, Haoran Zhang, et al.

基准

Agent

Nahyun Lee, Dongkeun Yoon, Guijin Son, et al.

基准

Agent

Tomer Keren, Nitay Calderon, Asaf Yehudai, et al.

LLM

模型训练

Mind Lab, Song Cao, Vic Cao, et al.

图像生成

AI for Science

Haozhe Zhao, Shuzheng Si, Zhenhailong Wang, et al.

AI for Science

深度学习

Stefano Ribes, Nils Dunlop, Rocío Mercado

视频生成

多模态

Zhengjian Yao, Yongzhi Li, Xinyuan Gao, et al.

LLM

Agent

Minhua Lin, Juncheng Wu, Zijun Wang, et al.

GSM-Symbolic：理解大语言模型在数学推理中的局限性

MUSE-Autoskill：通过技能创建、记忆、管理与评估实现自我进化的智能体

Nemotron 3 Ultra：用于智能体推理的开放、高效混合专家混合 Mamba-Transformer 模型

Qwen-Image-Flash：超越目标设计

OVO-S-Bench：面向多模态大语言模型流式空间智能的分层基准

复现、分析与检测基于评分标准的强化学习中的奖励黑客攻击

深度研究 Agents 在哪里出错？Agent 轨迹中的跨度级错误定位

音频交互模型

Cosmos 3：面向物理AI的全模态世界模型

学习与快慢思维：迈向具备持续适应能力的 LLM

LEAP：利用智能体框架为大型语言模型在形式化数学领域的赋能增效

世界模型遇见语言模型：论具体与抽象推理的互补性

从激活到因果：人类大脑中因果视觉表征的发现

一种用于多域强化学习中跨域干扰与恢复的局部扰动理论

人形-GPT：用于零样本运动跟踪的数据与结构扩展

信任域同策略蒸馏

OCC-RAG：面向忠实问答的最优认知核心

MAI-Thinking-1：构建爬山算法

$VLM^3$ ：视觉语言模型是原生3D学习者

Harness-1：利用状态外化 Harness 进行搜索代理的强化学习

DeepCrack：一种用于裂纹分割的深度层次化特征学习架构

VideoMLA：用于分钟级自回归视频扩散的低秩潜在KV缓存

Draft-OPD：面向投机草稿模型的在线策略蒸馏

K-BrowseComp：基于韩国语境的 Web 浏览 Agent 基准测试

关键在于TASTE：提升 Agent 基准的覆盖率与难度

关于 PEFT 的扩展：迈向万亿参数的百万级个性化模型

Crafter：用于从多样化输入生成可编辑科学图表的多 Agent 框架

TACK：针对新型靶向嵌合体知识数据集（TArgeting Chimeras Knowledge）的降解活性统计评估

叙事织者：基于多模态条件控制的长程视觉一致性研究

框架更新并非框架增益：解耦自进化大语言模型智能体中的进化能力

GSM-Symbolic：理解大语言模型在数学推理中的局限性

MUSE-Autoskill：通过技能创建、记忆、管理与评估实现自我进化的智能体

Nemotron 3 Ultra：用于智能体推理的开放、高效混合专家混合 Mamba-Transformer 模型

Qwen-Image-Flash：超越目标设计

OVO-S-Bench：面向多模态大语言模型流式空间智能的分层基准

复现、分析与检测基于评分标准的强化学习中的奖励黑客攻击

深度研究 Agents 在哪里出错？Agent 轨迹中的跨度级错误定位

音频交互模型

Cosmos 3：面向物理AI的全模态世界模型

学习与快慢思维：迈向具备持续适应能力的 LLM

LEAP：利用智能体框架为大型语言模型在形式化数学领域的赋能增效

世界模型遇见语言模型：论具体与抽象推理的互补性

从激活到因果：人类大脑中因果视觉表征的发现

一种用于多域强化学习中跨域干扰与恢复的局部扰动理论

人形-GPT：用于零样本运动跟踪的数据与结构扩展

信任域同策略蒸馏

OCC-RAG：面向忠实问答的最优认知核心

MAI-Thinking-1：构建爬山算法

$VLM^3$ ：视觉语言模型是原生3D学习者

Harness-1：利用状态外化 Harness 进行搜索代理的强化学习

DeepCrack：一种用于裂纹分割的深度层次化特征学习架构

VideoMLA：用于分钟级自回归视频扩散的低秩潜在KV缓存

Draft-OPD：面向投机草稿模型的在线策略蒸馏

K-BrowseComp：基于韩国语境的 Web 浏览 Agent 基准测试

关键在于TASTE：提升 Agent 基准的覆盖率与难度

关于 PEFT 的扩展：迈向万亿参数的百万级个性化模型

Crafter：用于从多样化输入生成可编辑科学图表的多 Agent 框架

TACK：针对新型靶向嵌合体知识数据集（TArgeting Chimeras Knowledge）的降解活性统计评估

叙事织者：基于多模态条件控制的长程视觉一致性研究

框架更新并非框架增益：解耦自进化大语言模型智能体中的进化能力

Command Palette

论文

Command Palette

论文

Command Palette

论文