HyperAI超神经

AGENTIC-IMODELS：通过自动研究进化智能代理可解释性工具

Agent

LLM

Chandan Singh, Yan Shuo Tan, Weijia Xu, et al.

HEAVYSKILL：作为代理驾驭中内在能力的深度思考

Agent

推理

Jianing Wang, Linsen Guo, Zhengyu Chen, et al.

基准

Agent

Jinchao Li, Yunxin Li, Chenrui Zhao, et al.

LLM

智能问答

Gal Yona, Mor Geva, Yossi Matias

多模态

图像分割

Hao Wang, Limeng Qiao, Chi Zhang, et al.

LLM

Agent

Yuwen Du, Rui Ye, Shuo Tang, et al.

监督式微调

模型训练

Sudong Wang, Weiquan Huang, Xiaomin Yu, et al.

Agent

LLM

Ruofeng Yang, Yongcan Li, Shuai Li

代码生成

基准

John Yang, Kilian Lieret, Jeffrey Ma, et al.

TVM

人脸识别

Adel Dabah, Andreas Herten

LLM

文本生成

Timothy Douglas, Roben Delos Reyes, Asanobu Kitamoto

金融

Mathias Bourgoin, Arthur Breitman, Pierrick Couderc, et al.

Maria-Eirini Pegia, Dimitrios Stefanopoulos, Björn Þór Jónsson, et al.

多模态

检索增强生成

Siyuan Huang, Xiaoye Qu, Yafu Li, et al.

深度学习

高性能计算

Kyungmi Lee, Zhiye Song, Eun Kyung Lee, et al.

图像生成

图像修复

Hanzhong Guo, Jie Wu, Jie Liu, et al.

模型训练

LLM

Yibin Luo, Shiwei Gao, Huichuan Zheng, et al.

视频生成

具身智能

Yanghao Zhou, Jingyu Ma, Yibo Peng, et al.

模型训练

多模态

Naibin Gu, Chenxu Yang, Qingyi Si, et al.

图像生成

多模态

Keming Wu, Zuhao Yang, Kaichen Zhang, et al.

Agent

AI for Science

Zihao Li, Jiaru Zou, Feihao Fang, et al.

扩散模型

图像生成

Zhongjie Duan, Hong Zhang, Yingda Chen

多模态表征

机器视觉 3D

Zaid Nasser, Mikhail Iumanov, Tianhao Li, et al.

Agent

LLM

Fei Bai, Huatong Song, Shuang Sun, et al.

扩散模型

模型训练

Gongbo Zhang, Wen Wang, Ye Tian, et al.

LLM

文本生成

Yuanhao Zeng, Ao Lu, Lufei Li, et al.

多模态

Agent

V Team, Wenyi Hong, Xiaotao Gu, et al.

代码生成

Agent

Joachim Baumann, Vishakh Padmakumar, Xiang Li, et al.

代码生成

Agent

Weihua Du, Jingming Zhuo, Yixin Dong, et al.

文生图

图像生成

Jiayi Guo, Linqing Wang, Jiangshan Wang, et al.

Agent

基准

Lei Xiong, Kun Luo, Ziyi Xia, et al.

AGENTIC-IMODELS：通过自动研究进化智能代理可解释性工具

Agent

LLM

Chandan Singh, Yan Shuo Tan, Weijia Xu, et al.

HEAVYSKILL：作为代理驾驭中内在能力的深度思考

Agent

推理

Jianing Wang, Linsen Guo, Zhengyu Chen, et al.

基准

Agent

Jinchao Li, Yunxin Li, Chenrui Zhao, et al.

LLM

智能问答

Gal Yona, Mor Geva, Yossi Matias

多模态

图像分割

Hao Wang, Limeng Qiao, Chi Zhang, et al.

LLM

Agent

Yuwen Du, Rui Ye, Shuo Tang, et al.

监督式微调

模型训练

Sudong Wang, Weiquan Huang, Xiaomin Yu, et al.

Agent

LLM

Ruofeng Yang, Yongcan Li, Shuai Li

代码生成

基准

John Yang, Kilian Lieret, Jeffrey Ma, et al.

TVM

人脸识别

Adel Dabah, Andreas Herten

LLM

文本生成

Timothy Douglas, Roben Delos Reyes, Asanobu Kitamoto

金融

Mathias Bourgoin, Arthur Breitman, Pierrick Couderc, et al.

Maria-Eirini Pegia, Dimitrios Stefanopoulos, Björn Þór Jónsson, et al.

多模态

检索增强生成

Siyuan Huang, Xiaoye Qu, Yafu Li, et al.

深度学习

高性能计算

Kyungmi Lee, Zhiye Song, Eun Kyung Lee, et al.

图像生成

图像修复

Hanzhong Guo, Jie Wu, Jie Liu, et al.

模型训练

LLM

Yibin Luo, Shiwei Gao, Huichuan Zheng, et al.

视频生成

具身智能

Yanghao Zhou, Jingyu Ma, Yibo Peng, et al.

模型训练

多模态

Naibin Gu, Chenxu Yang, Qingyi Si, et al.

图像生成

多模态

Keming Wu, Zuhao Yang, Kaichen Zhang, et al.

Agent

AI for Science

Zihao Li, Jiaru Zou, Feihao Fang, et al.

扩散模型

图像生成

Zhongjie Duan, Hong Zhang, Yingda Chen

多模态表征

机器视觉 3D

Zaid Nasser, Mikhail Iumanov, Tianhao Li, et al.

Agent

LLM

Fei Bai, Huatong Song, Shuang Sun, et al.

扩散模型

模型训练

Gongbo Zhang, Wen Wang, Ye Tian, et al.

LLM

文本生成

Yuanhao Zeng, Ao Lu, Lufei Li, et al.

多模态

Agent

V Team, Wenyi Hong, Xiaotao Gu, et al.

代码生成

Agent

Joachim Baumann, Vishakh Padmakumar, Xiang Li, et al.

代码生成

Agent

Weihua Du, Jingming Zhuo, Yixin Dong, et al.

文生图

图像生成

Jiayi Guo, Linqing Wang, Jiangshan Wang, et al.

Agent

基准

Lei Xiong, Kun Luo, Ziyi Xia, et al.

WindowsWorld：面向专业跨应用环境中自主GUI智能体的以进程为中心的基准测试

幻觉削弱信任；元认知是前进之路

X2SAM：图像与视频中的任意分割

OpenSeeker-v2：通过信息丰富和高难度轨迹推动搜索智能体的极限

PRISM：面向多模态强化学习的黑盒在线蒸馏预对齐

ARIS：通过对抗性多智能体协作实现自主研究

ProgramBench：语言模型能否从零开始重建程序？

基于GPU的高效加速图编辑距离计算

基于LLM的社会媒体情境信号危机报道不确定性评估

标准LST：一种面向Tezos的原生协议流动性质押解决方案

分离智力与执行：面向模型上下文协议的工作流引擎

理解文本到视频检索中的性能瓶颈：一项综合的经验与语言学分析

持久视觉记忆：在LVLMs的深度生成中维持感知

EnergAIzer：面向 AI 工作负载的快速且准确 GPU 功耗估算框架

利用基于验证器的强化学习进行图像编辑

使用RoundPipe在多个消费级GPU上实现高效训练

ExoActor：作为可泛化交互人形控制的偏中心视频生成

联合演化的策略蒸馏

新时代视觉生成：从原子映射到代理世界建模的演变

异构科学基础模型协作

扩散模板：一种用于可控扩散的统一插件框架

RADIO-ViPE：动态环境中开放词汇语义SLAM的在线紧耦合多模态融合

ClawGym：构建高效Claw代理的可扩展框架

扭转局势：扩散大型语言模型的跨架构知识蒸馏

大语言模型通过潜在蒸馏进行探索

GLM-5V-Turbo：迈向面向多模态 agents 的原生基础模型

SWE-chat：来自真实用户在自然环境下编码智能体交互的研究

AdaExplore：面向高效内核生成的失败驱动自适应与多样性保持搜索

通过再生进行优化：扩展修改空间可提升统一多模态模型中的图像优化效果

AutoResearchBench: 在复杂科学文献发现中评估AI代理的基准测试

WindowsWorld：面向专业跨应用环境中自主GUI智能体的以进程为中心的基准测试

幻觉削弱信任；元认知是前进之路

X2SAM：图像与视频中的任意分割

OpenSeeker-v2：通过信息丰富和高难度轨迹推动搜索智能体的极限

PRISM：面向多模态强化学习的黑盒在线蒸馏预对齐

ARIS：通过对抗性多智能体协作实现自主研究

ProgramBench：语言模型能否从零开始重建程序？

基于GPU的高效加速图编辑距离计算

基于LLM的社会媒体情境信号危机报道不确定性评估

标准LST：一种面向Tezos的原生协议流动性质押解决方案

分离智力与执行：面向模型上下文协议的工作流引擎

理解文本到视频检索中的性能瓶颈：一项综合的经验与语言学分析

持久视觉记忆：在LVLMs的深度生成中维持感知

EnergAIzer：面向 AI 工作负载的快速且准确 GPU 功耗估算框架

利用基于验证器的强化学习进行图像编辑

使用RoundPipe在多个消费级GPU上实现高效训练

ExoActor：作为可泛化交互人形控制的偏中心视频生成

联合演化的策略蒸馏

新时代视觉生成：从原子映射到代理世界建模的演变

异构科学基础模型协作

扩散模板：一种用于可控扩散的统一插件框架

RADIO-ViPE：动态环境中开放词汇语义SLAM的在线紧耦合多模态融合

ClawGym：构建高效Claw代理的可扩展框架

扭转局势：扩散大型语言模型的跨架构知识蒸馏

大语言模型通过潜在蒸馏进行探索

GLM-5V-Turbo：迈向面向多模态 agents 的原生基础模型

SWE-chat：来自真实用户在自然环境下编码智能体交互的研究

AdaExplore：面向高效内核生成的失败驱动自适应与多样性保持搜索

通过再生进行优化：扩展修改空间可提升统一多模态模型中的图像优化效果

AutoResearchBench: 在复杂科学文献发现中评估AI代理的基准测试

Command Palette

论文

Command Palette

论文

Command Palette

论文