HyperAI超神经

RubricHub：通过自动化粗粒度到细粒度生成的全面且高区分度的评分标准数据集

LLM

数据集

Sunzhu Li, Jiale Zhao, Miteto Wei, et al.

解锁隐性经验：从文本中合成工具使用轨迹

LLM

Agent

Zhihao Xu, Rumei Li, Jiahuan Li, et al.

人工智能

Agent

Eilam Shapira, Roi Reichart, Moshe Tennenholtz

强化学习

LLM

Fengkai Yang, Zherui Chen, Xiaohan Wang, et al.

Transformer

模型训练

Ranajoy Sadhukhan, Sheng Cao, Harry Dong, et al.

基准

推理

Seongyun Lee, Yongrae Jo, Minju Seo, et al.

Agent

推理

Jiaxuan Lu, Ziyu Kong, Yemin Wang, et al.

文生视频

扩散模型

Grigorii Alekseenko, Aleksandr Gordeev, Irina Tolstykh, et al.

Agent

强化学习

Zhiyuan Hu, Yunhai Hu, Juncheng Liu, et al.

强化学习

推理

Zhiyuan Hu, Yucheng Wang, Yufei He, et al.

图像分割

语义分割

Yu Wang, Yi Wang, Rui Dai, et al.

多模态表征

视觉问答

Ailin Huang, Chengyuan Yao, Chunrui Han, et al.

Transformer

蛋白质

Yi Zhou, Chan Lu, Yiming Ma, et al.

翻译

LLM

Mara Finkelstein, Isaac Caswell, Tobias Domhan, et al.

具身智能

机器人技术

Chi-Pin Huang, Yunze Man, Zhiding Yu, et al.

SkinFlow：通过动态视觉编码与分阶段强化学习实现开放性皮肤病诊断的高效信息传输

LLM

图像生成

Lijun Liu, Linwei Chen, Zhishou Zhang, et al.

推理

基准

Jian Zhang, Yu He, Zhiyuan Wang, et al.

代码生成

LLM

Tu Hu, Ronghao Chen, Shuo Zhang, et al.

Agent

推理

Jian Zhang, Zhiyuan Wang, Zhangqi Wang, et al.

DeepResearchEval：一种用于深度研究任务构建与代理评估的自动化框架

Agent

基准

Yibo Wang, Lei Wang, Yue Deng, et al.

数学

算法

Jim Bryan, Balázs Elek, Freddie Manners, et al.

检索增强生成

多模态表征

Woongyeong Yeo, Kangsan Kim, Soyeong Jeong, et al.

LLM

代码生成

Mizanur Rahman, Mohammed Saidul Islam, Md Tahmid Rahman Laskar, et al.

LLM

模型训练

Barry Menglong Yao, Sha Li, Yunzhi Yao, et al.

强化学习

推理

Jiangshan Duo, Hanyu Li, Hailin Zhang, et al.

扩散模型

图像生成

Dongting Hu, Aarush Gupta, Magzhan Gabidolla, et al.

视频生成

文生视频

Xindi Wu, Despoina Paschalidou, Jun Gao, et al.

Agent

多模态表征

Shaoan Wang, Yuanfei Luo, Xingyu Chen, et al.

LLM

文本生成

Alexander H. Liu, Kartik Khandelwal, Sandeep Subramanian, et al.

强化学习

Agent

Weihao Xuan, Qingcheng Zeng, Heli Qi, et al.

强化学习

偏好

Qiang Zhang, Boli Chen, Fanrui Zhang, et al.

通义千问

人机交互

Siyuan Hu, Kevin Qinghong Lin, Mike Zheng Shou

RubricHub：通过自动化粗粒度到细粒度生成的全面且高区分度的评分标准数据集

LLM

数据集

Sunzhu Li, Jiale Zhao, Miteto Wei, et al.

解锁隐性经验：从文本中合成工具使用轨迹

LLM

Agent

Zhihao Xu, Rumei Li, Jiahuan Li, et al.

人工智能

Agent

Eilam Shapira, Roi Reichart, Moshe Tennenholtz

强化学习

LLM

Fengkai Yang, Zherui Chen, Xiaohan Wang, et al.

Transformer

模型训练

Ranajoy Sadhukhan, Sheng Cao, Harry Dong, et al.

基准

推理

Seongyun Lee, Yongrae Jo, Minju Seo, et al.

Agent

推理

Jiaxuan Lu, Ziyu Kong, Yemin Wang, et al.

文生视频

扩散模型

Grigorii Alekseenko, Aleksandr Gordeev, Irina Tolstykh, et al.

Agent

强化学习

Zhiyuan Hu, Yunhai Hu, Juncheng Liu, et al.

强化学习

推理

Zhiyuan Hu, Yucheng Wang, Yufei He, et al.

图像分割

语义分割

Yu Wang, Yi Wang, Rui Dai, et al.

多模态表征

视觉问答

Ailin Huang, Chengyuan Yao, Chunrui Han, et al.

Transformer

蛋白质

Yi Zhou, Chan Lu, Yiming Ma, et al.

翻译

LLM

Mara Finkelstein, Isaac Caswell, Tobias Domhan, et al.

具身智能

机器人技术

Chi-Pin Huang, Yunze Man, Zhiding Yu, et al.

LLM

图像生成

Lijun Liu, Linwei Chen, Zhishou Zhang, et al.

推理

基准

Jian Zhang, Yu He, Zhiyuan Wang, et al.

代码生成

LLM

Tu Hu, Ronghao Chen, Shuo Zhang, et al.

Agent

推理

Jian Zhang, Zhiyuan Wang, Zhangqi Wang, et al.

Agent

基准

Yibo Wang, Lei Wang, Yue Deng, et al.

数学

算法

Jim Bryan, Balázs Elek, Freddie Manners, et al.

检索增强生成

多模态表征

Woongyeong Yeo, Kangsan Kim, Soyeong Jeong, et al.

LLM

代码生成

Mizanur Rahman, Mohammed Saidul Islam, Md Tahmid Rahman Laskar, et al.

LLM

模型训练

Barry Menglong Yao, Sha Li, Yunzhi Yao, et al.

强化学习

推理

Jiangshan Duo, Hanyu Li, Hailin Zhang, et al.

扩散模型

图像生成

Dongting Hu, Aarush Gupta, Magzhan Gabidolla, et al.

视频生成

文生视频

Xindi Wu, Despoina Paschalidou, Jun Gao, et al.

Agent

多模态表征

Shaoan Wang, Yuanfei Luo, Xingyu Chen, et al.

LLM

文本生成

Alexander H. Liu, Kartik Khandelwal, Sandeep Subramanian, et al.

强化学习

Agent

Weihao Xuan, Qingcheng Zeng, Heli Qi, et al.

强化学习

偏好

Qiang Zhang, Boli Chen, Fanrui Zhang, et al.

通义千问

人机交互

Siyuan Hu, Kevin Qinghong Lin, Mike Zheng Shou

毒苹果效应：通过AI Agent的技术扩展对中介市场实施策略性操纵

你的组相对优势存在偏差

STEM：通过嵌入模块扩展Transformer

迷失在噪声中：推理模型在上下文干扰项下的失效机制

超越静态工具：面向科学推理的测试时工具演化

VIBE：基于视觉指令的编辑器

协作式多Agent测试时强化学习用于推理

奖励稀有：面向LLM创造性问题求解的感知独特性强化学习

基于视觉-语言推理的城市社会语义分割

STEP3-VL-10B 技术报告

SeedFold：扩展生物分子结构预测

TranslateGemma 技术报告

Fast-ThinkAct：通过可表述的潜在规划实现高效的视觉-语言-动作推理

SkinFlow：通过动态视觉编码与分阶段强化学习实现开放性皮肤病诊断的高效信息传输

A^3-Bench：通过锚点与吸引子激活进行内存驱动型科学推理的基准测试

算法代码优化的受控自演化

MAXS：基于LLM Agent的元自适应探索

DeepResearchEval：一种用于深度研究任务构建与代理评估的自动化框架

0型映射到旗流形空间的动机类

UniversalRAG：面向多模态与多粒度语料库的检索增强生成

对齐文本、代码与视觉：一种用于文本到可视化生成的多目标强化学习框架

大语言模型在持续预训练过程中如何学习概念？

JudgeRLVR：先判断，后生成，实现高效推理

SnapGen++：释放扩散Transformer在边缘设备上高效高保真图像生成的潜力

视频生成中的运动归因

VLingNav: 具备自适应推理与视觉辅助语言记忆的具身导航

Ministral 3

置信度二分法：工具使用Agent中误校准问题的分析与缓解

ArenaRL：通过基于锦标赛的相对排名实现开放式智能体的强化学习扩展

ShowUI-π：基于流的生成模型作为GUI灵巧手

毒苹果效应：通过AI Agent的技术扩展对中介市场实施策略性操纵

你的组相对优势存在偏差

STEM：通过嵌入模块扩展Transformer

迷失在噪声中：推理模型在上下文干扰项下的失效机制

超越静态工具：面向科学推理的测试时工具演化

VIBE：基于视觉指令的编辑器

协作式多Agent测试时强化学习用于推理

奖励稀有：面向LLM创造性问题求解的感知独特性强化学习

基于视觉-语言推理的城市社会语义分割

STEP3-VL-10B 技术报告

SeedFold：扩展生物分子结构预测

TranslateGemma 技术报告

Fast-ThinkAct：通过可表述的潜在规划实现高效的视觉-语言-动作推理

SkinFlow：通过动态视觉编码与分阶段强化学习实现开放性皮肤病诊断的高效信息传输

A^3-Bench：通过锚点与吸引子激活进行内存驱动型科学推理的基准测试

算法代码优化的受控自演化

MAXS：基于LLM Agent的元自适应探索

DeepResearchEval：一种用于深度研究任务构建与代理评估的自动化框架

0型映射到旗流形空间的动机类

UniversalRAG：面向多模态与多粒度语料库的检索增强生成

对齐文本、代码与视觉：一种用于文本到可视化生成的多目标强化学习框架

大语言模型在持续预训练过程中如何学习概念？

JudgeRLVR：先判断，后生成，实现高效推理

SnapGen++：释放扩散Transformer在边缘设备上高效高保真图像生成的潜力

视频生成中的运动归因

VLingNav: 具备自适应推理与视觉辅助语言记忆的具身导航

Ministral 3

置信度二分法：工具使用Agent中误校准问题的分析与缓解

ArenaRL：通过基于锦标赛的相对排名实现开放式智能体的强化学习扩展

ShowUI-π：基于流的生成模型作为GUI灵巧手

Command Palette

论文

Command Palette

论文

Command Palette

论文