HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务协议
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务协议
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
Mobile-O:移动端的统一多模态理解与生成
多模态
扩散模型
Abdelrahman Shaker, Ahmed Heakl, Jaseel Muhammad, et al.
TOPReward:作为机器人学中隐藏零样本奖励的Token概率
强化学习
多模态表征
Shirui Chen, Cole Harrison, Ying-Chun Lee, et al.
ManCAR:基于流形约束的潜在推理与自适应测试时计算的序列推荐
偏好
多任务学习
Kun Yang, Yuxuan Zhu, Yazhe Chen, et al.
VLANeXt:构建强大VLA模型的配方
多模态
多模态表征
Xiao-Ming Wu, Bin Fan, Kang Liao, et al.
一个超大规模视频推理套件
视频理解
推理
Maijunxian Wang, Ruisi Wang, Juyi Lin, et al.
基于视觉信息增益的大规模视觉语言模型选择性训练
多模态
监督式微调
Seulbi Lee, Sangheum Hwang
DeepVision-103K:一个视觉多样、覆盖广泛且可验证的多模态推理数学数据集
多模态
视觉问答
Haoxiang Sun, Lizhen Xu, Bing Zhao, et al.
SARAH:面向空间感知的实时智能体人类
多模态表征
3D 生成
Evonne Ng, Siwei Zhang, Zhang Chen, et al.
EgoPush:面向移动机器人的端到端第一人称多物体重排学习
感知
目标跟踪
Boyuan An, Zhexiong Wang, Yipeng Wang, et al.
生成现实:基于手部与相机控制的交互式视频生成的人本世界模拟
扩散模型
视频生成
Linxi Xie, Lisong C. Sun, Ashley Neall, et al.
VESPO:用于稳定离策略LLM训练的变分序列级软策略优化
强化学习
LLM
Guobin Shen, Chenxiao Zhao, Xiang Cheng, et al.
阿斯翠三一大型技术报告
LLM
Transformer
Varun Singh, Lucas Krauss, Sami Jaghouar, et al.
前沿人工智能风险管理体系实践:风险分析技术报告 v1.5
LLM
Agent
Dongrui Liu, Yi Yu, Jie Zhang, et al.
统一潜在表示(Unified Latents, UL):如何训练你的潜在表示
扩散模型
图像生成
Jonathan Heek, Emiel Hoogeboom, Thomas Mensink, et al.
Mobile-Agent-v3.5:多平台基础GUI Agent
Agent
LLM
Haiyang Xu, Xi Zhang, Haowei Liu, et al.
SpargeAttention2:通过混合Top-k+Top-p掩码与蒸馏微调实现可训练的稀疏注意力
扩散模型
Transformer
Jintao Zhang, Kai Jiang, Chendong Xiang, et al.
AutoWebWorld:通过有限状态机合成无限可验证的Web环境
Agent
3D 生成
Yifan Wu, Yiran Peng, Yiyu Chen, et al.
无界客户端-服务器系统的有界模型检测
建模
深度学习
Ramchandra Phawade, Tephilla Prince, S. Sheerazuddin
检索增强模型相较于LLM在推理方面带来了多少提升?面向混合知识的多跳推理基准测试框架
检索增强生成
基准
Junhong Lin, Bing Zhang, Song Wang, et al.
视觉虫洞:异构多Agent系统中的潜在空间通信
多模态表征
统一多模态
Xiaoze Liu, Ruowang Zhang, Weichen Yu, et al.
帕尼尼:通过结构化记忆实现令牌空间中的持续学习
检索增强生成
智能问答
Shreyas Rajesh, Pavan Holur, Mehmet Yigit Turali, et al.
ResearchGym:在真实世界AI研究中评估语言模型代理
Agent
基准
Aniketh Garikaparthi, Manasi Patwardhan, Arman Cohan
学习配置智能体AI系统
Agent
LLM
Aditya Taparia, Som Sagar, Ransalu Senanayake
人工智能代理社会中的社会化现象是否涌现?——Moltbook案例研究
Agent
LLM
Ming Li, Xirui Li, Tianyi Zhou
稀疏自编码器的合理性检验:SAE 是否优于随机基线?
深度学习
Transformer
Anton Korznikov, Andrey Galichin, Alexey Dontsov, et al.
SkillsBench:跨多样化任务评估Agent技能的有效性
Agent
基准
Xiangyi Li, Wenbo Chen, Yimin Liu, et al.
GLM-5:从Vibe Coding到Agentic Engineering
代码生成
模型训练
GLM-5 Team, Aohan Zeng, Xin Lv, et al.
字节跳动:基于二进制标记的自回归生成模型扩展
图像生成
扩散模型
Yuang Ai, Jiaming Han, Shaobin Zhuang, et al.
REDSearcher:一种可扩展且成本高效的长时序搜索Agent框架
Agent
多模态
Zheng Chu, Xiao Wang, Jack Hong, et al.
Qute:面向量子原生数据库
AI 编译器
检索增强生成
Muzhi Chen, Xuanhe Zhou, Wei Zhou, et al.
InnoEval:将研究创意评估视为一种基于知识的多视角推理问题
检索增强生成
基准
Shuofei Qiao, Yunxiang Wei, Xuehai Wang, et al.
查询作为锚点:基于大语言模型的场景自适应用户表征
多模态表征
LLM
Jiahao Yuan, Yike Xu, Jinyong Wen, et al.
1
3
4
5
6
7
8
9
57
Mobile-O:移动端的统一多模态理解与生成
多模态
扩散模型
Abdelrahman Shaker, Ahmed Heakl, Jaseel Muhammad, et al.
TOPReward:作为机器人学中隐藏零样本奖励的Token概率
强化学习
多模态表征
Shirui Chen, Cole Harrison, Ying-Chun Lee, et al.
ManCAR:基于流形约束的潜在推理与自适应测试时计算的序列推荐
偏好
多任务学习
Kun Yang, Yuxuan Zhu, Yazhe Chen, et al.
VLANeXt:构建强大VLA模型的配方
多模态
多模态表征
Xiao-Ming Wu, Bin Fan, Kang Liao, et al.
一个超大规模视频推理套件
视频理解
推理
Maijunxian Wang, Ruisi Wang, Juyi Lin, et al.
基于视觉信息增益的大规模视觉语言模型选择性训练
多模态
监督式微调
Seulbi Lee, Sangheum Hwang
DeepVision-103K:一个视觉多样、覆盖广泛且可验证的多模态推理数学数据集
多模态
视觉问答
Haoxiang Sun, Lizhen Xu, Bing Zhao, et al.
SARAH:面向空间感知的实时智能体人类
多模态表征
3D 生成
Evonne Ng, Siwei Zhang, Zhang Chen, et al.
EgoPush:面向移动机器人的端到端第一人称多物体重排学习
感知
目标跟踪
Boyuan An, Zhexiong Wang, Yipeng Wang, et al.
生成现实:基于手部与相机控制的交互式视频生成的人本世界模拟
扩散模型
视频生成
Linxi Xie, Lisong C. Sun, Ashley Neall, et al.
VESPO:用于稳定离策略LLM训练的变分序列级软策略优化
强化学习
LLM
Guobin Shen, Chenxiao Zhao, Xiang Cheng, et al.
阿斯翠三一大型技术报告
LLM
Transformer
Varun Singh, Lucas Krauss, Sami Jaghouar, et al.
前沿人工智能风险管理体系实践:风险分析技术报告 v1.5
LLM
Agent
Dongrui Liu, Yi Yu, Jie Zhang, et al.
统一潜在表示(Unified Latents, UL):如何训练你的潜在表示
扩散模型
图像生成
Jonathan Heek, Emiel Hoogeboom, Thomas Mensink, et al.
Mobile-Agent-v3.5:多平台基础GUI Agent
Agent
LLM
Haiyang Xu, Xi Zhang, Haowei Liu, et al.
SpargeAttention2:通过混合Top-k+Top-p掩码与蒸馏微调实现可训练的稀疏注意力
扩散模型
Transformer
Jintao Zhang, Kai Jiang, Chendong Xiang, et al.
AutoWebWorld:通过有限状态机合成无限可验证的Web环境
Agent
3D 生成
Yifan Wu, Yiran Peng, Yiyu Chen, et al.
无界客户端-服务器系统的有界模型检测
建模
深度学习
Ramchandra Phawade, Tephilla Prince, S. Sheerazuddin
检索增强模型相较于LLM在推理方面带来了多少提升?面向混合知识的多跳推理基准测试框架
检索增强生成
基准
Junhong Lin, Bing Zhang, Song Wang, et al.
视觉虫洞:异构多Agent系统中的潜在空间通信
多模态表征
统一多模态
Xiaoze Liu, Ruowang Zhang, Weichen Yu, et al.
帕尼尼:通过结构化记忆实现令牌空间中的持续学习
检索增强生成
智能问答
Shreyas Rajesh, Pavan Holur, Mehmet Yigit Turali, et al.
ResearchGym:在真实世界AI研究中评估语言模型代理
Agent
基准
Aniketh Garikaparthi, Manasi Patwardhan, Arman Cohan
学习配置智能体AI系统
Agent
LLM
Aditya Taparia, Som Sagar, Ransalu Senanayake
人工智能代理社会中的社会化现象是否涌现?——Moltbook案例研究
Agent
LLM
Ming Li, Xirui Li, Tianyi Zhou
稀疏自编码器的合理性检验:SAE 是否优于随机基线?
深度学习
Transformer
Anton Korznikov, Andrey Galichin, Alexey Dontsov, et al.
SkillsBench:跨多样化任务评估Agent技能的有效性
Agent
基准
Xiangyi Li, Wenbo Chen, Yimin Liu, et al.
GLM-5:从Vibe Coding到Agentic Engineering
代码生成
模型训练
GLM-5 Team, Aohan Zeng, Xin Lv, et al.
字节跳动:基于二进制标记的自回归生成模型扩展
图像生成
扩散模型
Yuang Ai, Jiaming Han, Shaobin Zhuang, et al.
REDSearcher:一种可扩展且成本高效的长时序搜索Agent框架
Agent
多模态
Zheng Chu, Xiao Wang, Jack Hong, et al.
Qute:面向量子原生数据库
AI 编译器
检索增强生成
Muzhi Chen, Xuanhe Zhou, Wei Zhou, et al.
InnoEval:将研究创意评估视为一种基于知识的多视角推理问题
检索增强生成
基准
Shuofei Qiao, Yunxiang Wei, Xuehai Wang, et al.
查询作为锚点:基于大语言模型的场景自适应用户表征
多模态表征
LLM
Jiahao Yuan, Yike Xu, Jinyong Wen, et al.
1
3
4
5
6
7
8
9
57