HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务协议
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务协议
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
MonkeyOCR:基于结构识别关系三元组范式的文档解析
文档理解
OCR
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
更安全的生成式AI的共识采样
算法
LLM
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
Argus:面向端到端ADS的韧性导向安全保证框架
自动驾驶
基准
Dingji Wang, You Lu, Bihuan Chen, et al.
基于世界模型的策略优化用于视觉-语言-动作模型
强化学习
机器人技术
Fangqi Zhu, Zhengyang Yan, Zicong Hong, et al.
LoopTool:用于鲁棒LLM工具调用的数据-训练闭环
LLM
模型训练
Kangning Zhang, Wenxiang Jiao, Kounianhua Du, et al.
超越事实检索:基于生成语义空间的RAG情景记忆
检索增强生成
推理
Shreyas Rajesh, Pavan Holur, Chenda Duan, et al.
TiDAR:在扩散中思考,在自回归中表达
扩散模型
Transformer
Jingyu Liu, Xin Dong, Zhifan Ye, et al.
Time-to-Move:通过双时钟去噪实现无需训练的运动控制视频生成
图生视频
扩散模型
Assaf Singer, Noam Rotstein, Amir Mann, et al.
Lumine:在3D开放世界中构建通用Agent的开源方案
Agent
推理
Weihao Tan, Xiangyang Li, Yunhao Fang, et al.
从1,000个词生成一张图像:通过结构化描述增强文本到图像生成
文生图
图像生成
Eyal Gutflaish, Eliran Kachlon, Hezi Zisman, et al.
KLASS:基于KL引导的掩码扩散模型快速推理
扩散模型
自然语言处理
Seo Hyun Kim, Sunwoo Hong, Hojung Jung, et al.
基于人类示范的计算机使用Agent定位
数据集
文档理解
Aarash Feizi, Shravan Nayak, Xiangru Jian, et al.
Wasm:构建结构化阿拉伯语交错多模态语料库的流水线
多模态
数据集
Khalil Hennara, Ahmad Bastati, Muhammad Hreden, et al.
对话系统中的自适应多智能体响应优化
Agent
LLM
Soyeong Jeong, Aparna Elangovan, Emine Yilmaz, et al.
SPAN:单目3D目标检测中的空间投影对齐
目标检测
机器视觉 3D
Yifan Wang, Yian Zhao, Fanqi Pu, et al.
高维系统伏尔泰拉级数的高效近似
机器学习
建模
Navin Khoshnan, Claudia K Petritsch, Bryce-Allen Bagley
SofT-GRPO:通过Gumbel重参数化软思考策略优化超越离散token的LLM强化学习
强化学习
推理
Zhi Zheng, Wee Sun Lee
RedOne 2.0:重新思考社交网络服务中的领域特定LLM后训练
监督式微调
LLM
Fei Zhao, Chonggang Lu, Haofu Qian, et al.
车站:一个用于AI驱动发现的开放世界环境
Agent
推理
Stephen Chung, Wenyu Du
DRIVE:面向竞争性代码生成中可验证奖励强化学习的数据编排最佳实践
监督式微调
强化学习
Speed Zhu, Jianwei Cai, Guang Chen, et al.
IterResearch:通过马尔可夫状态重构重新思考长时域Agent
强化学习
推理
Guoxin Chen, Zile Qiao, Xuanzhong Chen, et al.
HaluMem:评估Agent记忆系统中的幻觉
基准
Agent
Ding Chen, Simin Niu, Kehang Li, et al.
GVPO:面向大语言模型后训练的分组方差策略优化
偏好
模型训练
Kaichen Zhang, Yuzhong Hong, Junwei Bao, et al.
ReCA:面向实时高效协作式具身自主Agent的集成加速
具身智能
机器人技术
Zishen Wan, Yuhang Du, Mohamed Ibrahim, et al.
DexFlyWheel:一种可扩展且自提升的灵巧操作数据生成框架
机器人技术
强化学习
Kefei Zhu, Fengshuo Bai, YuanHao Xiang, et al.
NovaFlow:通过生成视频中的可操作流实现零样本操控
统一多模态
文生视频
Hongyu Li, Lingfeng Sun, Yafei Hu, et al.
TreeSynth:通过树引导的子空间划分从零开始合成多样化数据
合成
数据集
Sheng Wang, Pengan Chen, Jingqi Zhou, et al.
GTA:基于监督引导的大语言模型文本分类强化学习
监督式微调
强化学习
Ivan Anishchenko, Yakov Kipnis, Indrek Kalvet, et al.
使用PLACER建模蛋白质-小分子构象集合
深度学习
建模
Ivan Anishchenko, Yakov Kipnis, Indrek Kalvet, et al.
Agentic上下文工程:面向自提升语言模型的上下文演化
Agent
LLM
Qizheng Zhang, Changran Hu, Shubhangi Upasani, et al.
DiaMoE-TTS:一种基于IPA的统一方言TTS框架,支持多专家模型与参数高效零样本适配
语音生成
统一多模态
Ziqi Chen, Gongyu Chen, Yihua Wang, et al.
AI辅助的AR装配:用于增强现实辅助装配的物体识别与计算机视觉
目标检测
目标识别
Alexander Htet Kyaw, Haotian Ma, Sasa Zivkovic, et al.
1
23
24
25
26
27
28
29
57
MonkeyOCR:基于结构识别关系三元组范式的文档解析
文档理解
OCR
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
更安全的生成式AI的共识采样
算法
LLM
Adam Tauman Kalai, Yael Tauman Kalai, Or Zamir
Argus:面向端到端ADS的韧性导向安全保证框架
自动驾驶
基准
Dingji Wang, You Lu, Bihuan Chen, et al.
基于世界模型的策略优化用于视觉-语言-动作模型
强化学习
机器人技术
Fangqi Zhu, Zhengyang Yan, Zicong Hong, et al.
LoopTool:用于鲁棒LLM工具调用的数据-训练闭环
LLM
模型训练
Kangning Zhang, Wenxiang Jiao, Kounianhua Du, et al.
超越事实检索:基于生成语义空间的RAG情景记忆
检索增强生成
推理
Shreyas Rajesh, Pavan Holur, Chenda Duan, et al.
TiDAR:在扩散中思考,在自回归中表达
扩散模型
Transformer
Jingyu Liu, Xin Dong, Zhifan Ye, et al.
Time-to-Move:通过双时钟去噪实现无需训练的运动控制视频生成
图生视频
扩散模型
Assaf Singer, Noam Rotstein, Amir Mann, et al.
Lumine:在3D开放世界中构建通用Agent的开源方案
Agent
推理
Weihao Tan, Xiangyang Li, Yunhao Fang, et al.
从1,000个词生成一张图像:通过结构化描述增强文本到图像生成
文生图
图像生成
Eyal Gutflaish, Eliran Kachlon, Hezi Zisman, et al.
KLASS:基于KL引导的掩码扩散模型快速推理
扩散模型
自然语言处理
Seo Hyun Kim, Sunwoo Hong, Hojung Jung, et al.
基于人类示范的计算机使用Agent定位
数据集
文档理解
Aarash Feizi, Shravan Nayak, Xiangru Jian, et al.
Wasm:构建结构化阿拉伯语交错多模态语料库的流水线
多模态
数据集
Khalil Hennara, Ahmad Bastati, Muhammad Hreden, et al.
对话系统中的自适应多智能体响应优化
Agent
LLM
Soyeong Jeong, Aparna Elangovan, Emine Yilmaz, et al.
SPAN:单目3D目标检测中的空间投影对齐
目标检测
机器视觉 3D
Yifan Wang, Yian Zhao, Fanqi Pu, et al.
高维系统伏尔泰拉级数的高效近似
机器学习
建模
Navin Khoshnan, Claudia K Petritsch, Bryce-Allen Bagley
SofT-GRPO:通过Gumbel重参数化软思考策略优化超越离散token的LLM强化学习
强化学习
推理
Zhi Zheng, Wee Sun Lee
RedOne 2.0:重新思考社交网络服务中的领域特定LLM后训练
监督式微调
LLM
Fei Zhao, Chonggang Lu, Haofu Qian, et al.
车站:一个用于AI驱动发现的开放世界环境
Agent
推理
Stephen Chung, Wenyu Du
DRIVE:面向竞争性代码生成中可验证奖励强化学习的数据编排最佳实践
监督式微调
强化学习
Speed Zhu, Jianwei Cai, Guang Chen, et al.
IterResearch:通过马尔可夫状态重构重新思考长时域Agent
强化学习
推理
Guoxin Chen, Zile Qiao, Xuanzhong Chen, et al.
HaluMem:评估Agent记忆系统中的幻觉
基准
Agent
Ding Chen, Simin Niu, Kehang Li, et al.
GVPO:面向大语言模型后训练的分组方差策略优化
偏好
模型训练
Kaichen Zhang, Yuzhong Hong, Junwei Bao, et al.
ReCA:面向实时高效协作式具身自主Agent的集成加速
具身智能
机器人技术
Zishen Wan, Yuhang Du, Mohamed Ibrahim, et al.
DexFlyWheel:一种可扩展且自提升的灵巧操作数据生成框架
机器人技术
强化学习
Kefei Zhu, Fengshuo Bai, YuanHao Xiang, et al.
NovaFlow:通过生成视频中的可操作流实现零样本操控
统一多模态
文生视频
Hongyu Li, Lingfeng Sun, Yafei Hu, et al.
TreeSynth:通过树引导的子空间划分从零开始合成多样化数据
合成
数据集
Sheng Wang, Pengan Chen, Jingqi Zhou, et al.
GTA:基于监督引导的大语言模型文本分类强化学习
监督式微调
强化学习
Ivan Anishchenko, Yakov Kipnis, Indrek Kalvet, et al.
使用PLACER建模蛋白质-小分子构象集合
深度学习
建模
Ivan Anishchenko, Yakov Kipnis, Indrek Kalvet, et al.
Agentic上下文工程:面向自提升语言模型的上下文演化
Agent
LLM
Qizheng Zhang, Changran Hu, Shubhangi Upasani, et al.
DiaMoE-TTS:一种基于IPA的统一方言TTS框架,支持多专家模型与参数高效零样本适配
语音生成
统一多模态
Ziqi Chen, Gongyu Chen, Yihua Wang, et al.
AI辅助的AR装配:用于增强现实辅助装配的物体识别与计算机视觉
目标检测
目标识别
Alexander Htet Kyaw, Haotian Ma, Sasa Zivkovic, et al.
1
23
24
25
26
27
28
29
57