HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
超大规模下的进化策略
模型训练
LLM
Bidipta Sarkar, Mattie Fellows, Juan Agustin Duque, et al.
理解是否推动统一多模态模型中的生成?从分析到未来路径
统一多模态
推理
Yuwei Niu, Weiyang Jin, Jiaqi Liao, et al.
iMontage:统一、通用、高度动态的多对多图像生成
统一多模态
图像生成
Zhoujie Fu, Xianfang Zeng, Jinghong Lan, et al.
Agent0-VL:探索面向工具融合的视觉-语言推理的自演化智能体
Agent
推理
Jiaqi Liu, Kaiwen Xiong, Peng Xia, et al.
MedSAM3:基于医学概念深入探索通用图像分割
图像分割
统一多模态
Anglin Liu, Rundong Xue, Xu R. Cao, et al.
SteadyDancer:基于首帧保留的协调一致的人体图像动画
图生视频
图生图
Jiaming Zhang, Shengming Cao, Rui Li, et al.
GigaEvo:一个由 LLMs 和进化算法驱动的开源优化框架
LLM
算法
Valentin Khrulkov, Andrey Galichin, Denis Bashkirov, et al.
基于随机路径积分的忠实度感知推荐解释
偏好
基准
Oren Barkan, Yahlly Schein, Yehonatan Elisha, et al.
提取推荐系统中的交互感知单语义概念
深度学习
神经网络
Dor Arviv, Yehonatan Elisha, Oren Barkan, et al.
MSRNet:用于伪装目标检测的多尺度递归网络
目标检测
语义分割
Leena Alghamdi, Muhammad Usman, Hafeez Anwar, et al.
预算感知工具使用实现Agent的有效扩展
Agent
LLM
Tengxiao Liu, Zifeng Wang, Jin Miao, et al.
视频内指令:视觉信号作为生成控制
图生视频
视频生成
Gongfan Fang, Xinyin Ma, Xinchao Wang
DR Tulu:面向深度研究的基于演化评分标准的强化学习
强化学习
智能问答
Rulin Shao, Akari Asai, Shannon Zejiang Shen, et al.
AICC:精细化HTML解析,提升模型性能 —— 基于模型HTML解析器构建的7.3T面向AI语料库
LLM
文档理解
Ren Ma, Jiantao Qiu, Chao Xu, et al.
UltraFlux:面向跨多种纵横比的高质量原生4K文本到图像生成的数据-模型协同设计
文生图
扩散模型
Tian Ye, Song Fei, Lei Zhu
DeCo:面向端到端图像生成的频率解耦像素扩散
扩散模型
图像生成
Zehong Ma, Longhui Wei, Shuai Wang, et al.
计算机操作 Agent 作为生成式用户界面的评判者
Agent
代码生成
Kevin Qinghong Lin, Siyuan Hu, Linjie Li, et al.
AutoEnv:衡量 Agent 跨环境学习的自动化环境
强化学习
Agent
Jiayi Zhang, Yiran Peng, Fanqi Kong, et al.
基于深度研究的通用 Agent 记忆
检索增强生成
Agent
B. Y. Yan, Chaofan Li, Hongjin Qian, et al.
VIRAL:面向人形机器人运动操作的规模化视觉仿真到现实迁移
强化学习
计算机视觉
Tairan He, Zi Wang, Haoru Xue, et al.
MIST:基于监督训练的互信息
神经网络
深度学习
German Gritsai, Megan Richards, Maxime Méloux, et al.
多Agent深度研究:基于M-GRPO训练多Agent系统
强化学习
Agent
Haoyang Hong, Jiajun Yin, Yuan Wang, et al.
无数据流程图提炼
扩散模型
合成
Shangyuan Tong, Nanye Ma, Saining Xie, et al.
HunyuanOCR 技术报告
OCR
视觉问答
Tencent Hunyuan Vision Team, Jie Jiang, Linus, et al.
PhysToolBench:面向MLLMs的物理工具理解能力评估
视觉问答
基准
Zixin Zhang, Kanghao Chen, Xingwang Lin, et al.
赫胥黎-哥德尔机器:通过最优自改进机器的近似实现人类水平的编码Agent开发
Agent
人工智能
Wenyi Wang, Piotr Piękos, Li Nanbo, et al.
无需空间超感知的空间超感知求解
视频理解
计算机视觉
Vishaal Udandarao, Shyamgopal Karthik, Surabhi S. Nath, et al.
Parrot:输出真实性的说服与认同鲁棒性评级——面向 LLMs 的阿谀鲁棒性基准
LLM
基准
Yusuf Çelebi, Mahmoud El Hussieni, Özay Ezerceli
O-Mem:面向个性化、长跨度及自进化 Agents 的全能记忆系统
LLM
基准
Piaohong Wang, Motong Tian, Jiaxian Li, et al.
揭示文本本征维度:从学术摘要到创意故事
LLM
自然语言处理
Vladislav Pedashenko, Laida Kushnareva, Yana Khassan Nibal, et al.
SAM 3:基于概念的万物分割
计算机视觉
语义分割
Nicolas Carion, Laura Gustafson, Yuan-Ting Hu, et al.
GeoVista:面向地理定位的网络增强 Agent 视觉推理
Agent
检索增强生成
Yikun Wang, Zuyan Liu, Ziyi Wang, et al.
1
13
14
15
16
17
18
19
50
超大规模下的进化策略
模型训练
LLM
Bidipta Sarkar, Mattie Fellows, Juan Agustin Duque, et al.
理解是否推动统一多模态模型中的生成?从分析到未来路径
统一多模态
推理
Yuwei Niu, Weiyang Jin, Jiaqi Liao, et al.
iMontage:统一、通用、高度动态的多对多图像生成
统一多模态
图像生成
Zhoujie Fu, Xianfang Zeng, Jinghong Lan, et al.
Agent0-VL:探索面向工具融合的视觉-语言推理的自演化智能体
Agent
推理
Jiaqi Liu, Kaiwen Xiong, Peng Xia, et al.
MedSAM3:基于医学概念深入探索通用图像分割
图像分割
统一多模态
Anglin Liu, Rundong Xue, Xu R. Cao, et al.
SteadyDancer:基于首帧保留的协调一致的人体图像动画
图生视频
图生图
Jiaming Zhang, Shengming Cao, Rui Li, et al.
GigaEvo:一个由 LLMs 和进化算法驱动的开源优化框架
LLM
算法
Valentin Khrulkov, Andrey Galichin, Denis Bashkirov, et al.
基于随机路径积分的忠实度感知推荐解释
偏好
基准
Oren Barkan, Yahlly Schein, Yehonatan Elisha, et al.
提取推荐系统中的交互感知单语义概念
深度学习
神经网络
Dor Arviv, Yehonatan Elisha, Oren Barkan, et al.
MSRNet:用于伪装目标检测的多尺度递归网络
目标检测
语义分割
Leena Alghamdi, Muhammad Usman, Hafeez Anwar, et al.
预算感知工具使用实现Agent的有效扩展
Agent
LLM
Tengxiao Liu, Zifeng Wang, Jin Miao, et al.
视频内指令:视觉信号作为生成控制
图生视频
视频生成
Gongfan Fang, Xinyin Ma, Xinchao Wang
DR Tulu:面向深度研究的基于演化评分标准的强化学习
强化学习
智能问答
Rulin Shao, Akari Asai, Shannon Zejiang Shen, et al.
AICC:精细化HTML解析,提升模型性能 —— 基于模型HTML解析器构建的7.3T面向AI语料库
LLM
文档理解
Ren Ma, Jiantao Qiu, Chao Xu, et al.
UltraFlux:面向跨多种纵横比的高质量原生4K文本到图像生成的数据-模型协同设计
文生图
扩散模型
Tian Ye, Song Fei, Lei Zhu
DeCo:面向端到端图像生成的频率解耦像素扩散
扩散模型
图像生成
Zehong Ma, Longhui Wei, Shuai Wang, et al.
计算机操作 Agent 作为生成式用户界面的评判者
Agent
代码生成
Kevin Qinghong Lin, Siyuan Hu, Linjie Li, et al.
AutoEnv:衡量 Agent 跨环境学习的自动化环境
强化学习
Agent
Jiayi Zhang, Yiran Peng, Fanqi Kong, et al.
基于深度研究的通用 Agent 记忆
检索增强生成
Agent
B. Y. Yan, Chaofan Li, Hongjin Qian, et al.
VIRAL:面向人形机器人运动操作的规模化视觉仿真到现实迁移
强化学习
计算机视觉
Tairan He, Zi Wang, Haoru Xue, et al.
MIST:基于监督训练的互信息
神经网络
深度学习
German Gritsai, Megan Richards, Maxime Méloux, et al.
多Agent深度研究:基于M-GRPO训练多Agent系统
强化学习
Agent
Haoyang Hong, Jiajun Yin, Yuan Wang, et al.
无数据流程图提炼
扩散模型
合成
Shangyuan Tong, Nanye Ma, Saining Xie, et al.
HunyuanOCR 技术报告
OCR
视觉问答
Tencent Hunyuan Vision Team, Jie Jiang, Linus, et al.
PhysToolBench:面向MLLMs的物理工具理解能力评估
视觉问答
基准
Zixin Zhang, Kanghao Chen, Xingwang Lin, et al.
赫胥黎-哥德尔机器:通过最优自改进机器的近似实现人类水平的编码Agent开发
Agent
人工智能
Wenyi Wang, Piotr Piękos, Li Nanbo, et al.
无需空间超感知的空间超感知求解
视频理解
计算机视觉
Vishaal Udandarao, Shyamgopal Karthik, Surabhi S. Nath, et al.
Parrot:输出真实性的说服与认同鲁棒性评级——面向 LLMs 的阿谀鲁棒性基准
LLM
基准
Yusuf Çelebi, Mahmoud El Hussieni, Özay Ezerceli
O-Mem:面向个性化、长跨度及自进化 Agents 的全能记忆系统
LLM
基准
Piaohong Wang, Motong Tian, Jiaxian Li, et al.
揭示文本本征维度:从学术摘要到创意故事
LLM
自然语言处理
Vladislav Pedashenko, Laida Kushnareva, Yana Khassan Nibal, et al.
SAM 3:基于概念的万物分割
计算机视觉
语义分割
Nicolas Carion, Laura Gustafson, Yuan-Ting Hu, et al.
GeoVista:面向地理定位的网络增强 Agent 视觉推理
Agent
检索增强生成
Yikun Wang, Zuyan Liu, Ziyi Wang, et al.
1
13
14
15
16
17
18
19
50