HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
UMO:通过匹配奖励实现图像定制中的多身份一致性扩展
扩散模型
图像生成
Yufeng Cheng, Wenxu Wu, Shaojin Wu, et al.
重建对齐提升统一多模态模型
多模态
图像生成
Ji Xie, Trevor Darrell, Luke Zettlemoyer, et al.
Mini-o3:面向视觉搜索的推理模式与交互轮次的扩展
推理
Agent
Xin Lai, Junyi Li, Wei Li, et al.
多模态大语言模型的视觉表征对齐
多模态表征
多模态
Heeji Yoon, Jaewoo Jung, Junwan Kim, et al.
并行-R1:通过强化学习实现并行思维
强化学习
监督式微调
Tong Zheng, Hongming Zhang, Wenhao Yu, et al.
WenetSpeech-Yue:一个具有多维度标注的大规模粤语语音语料库
语音生成
数据集
Longhao Li, Zhao Guo, Hongjie Chen, et al.
SheetDesigner:基于规则与视觉反馈的MLLM驱动电子表格布局生成
多模态
文档理解
Qin Chen, Yuanyi Ren, Xiaojun Ma, et al.
自主代码演化邂逅NP-完全性
LLM
Agent
Cunxi Yu, Rongjian Liang, Chia-Tung Ho, et al.
深度研究系统中的强化学习基础:一项综述
强化学习
Agent
Wenjun Li, Zhi Chen, Jingru Lin, et al.
工具增强的视觉感知
LLM
推理
Zetong Zhou, Dongping Chen, Zixian Ma, et al.
DINOv3 是否设定了新的医学视觉标准?
计算机视觉
医学影像
Che Liu, Yinda Chen, Haoyuan Shi, et al.
用于扩散大语言模型的强化学习框架的革命性革新
LLM
监督式微调
Yinjie Wang, Ling Yang, Bowen Li, et al.
WebExplorer:用于训练长时序Web Agent的探索与演化
Agent
监督式微调
Junteng Liu, Yunji Li, Chi Zhang, et al.
逆向工程推理用于开放式生成
推理
LLM
Haozhe Wang, Haoran Que, Qixin Xu, et al.
OSC:多智能体LLM协作中的动态知识对齐认知编排
Agent
LLM
Jusheng Zhang, Yijia Fan, Kaitong Cai, et al.
CURE:用于鲁棒嵌入的可控遗忘——缓解预训练语言模型中的概念捷径
自然语言处理
监督式微调
Aysenur Kocak, Shuo Yang, Bardh Prenkaj, et al.
MedVista3D:用于减少三维CT疾病检测、理解与报告中诊断错误的视觉-语言建模
视觉问答
多模态
Yuheng Li, Yenho Chen, Yuxiang Lai, et al.
LuxDiT:基于视频扩散Transformer的光照估计
扩散模型
图生图
Ruofan Liang, Kai He, Zan Gojcic, et al.
WildScore:在野符号音乐推理中对MLLMs的基准测试
基准
视觉问答
Gagan Mundada, Yash Vishe, Amit Namburi, et al.
设置块解码是一种语言模型推理加速器
LLM
文本生成
Itai Gat, Heli Ben-Hamu, Marton Havasi, et al.
基于大型语言模型的符号图形编程
LLM
代码生成
Yamei Chen, Haoquan Zhang, Yangyi Huang, et al.
语言模型为何会产生幻觉
LLM
推理
Adam Tauman Kalai, Ofir Nachum, Santosh S. Vempala, et al.
LatticeWorld:一种由多模态大语言模型驱动的交互式复杂世界生成框架
3D 生成
Agent
Yinglin Duan, Zhengxia Zou, Tongwei Gu, et al.
Recomposer:基于事件滚动引导的生成式音频编辑
音频生成
语音生成
Daniel P. W. Ellis, Eduardo Fonseca, Ron J. Weiss, et al.
转换模型:重新思考生成式学习目标
扩散模型
建模
Zidong Wang, Yiyuan Zhang, Xiaoyu Yue, et al.
逆向 IFEval:LLMs 能否摒弃顽固的训练惯例以遵循真实指令?
基准
监督式微调
Qinyan Zhang, Xinping Lei, Ruijie Miao, et al.
DeepResearch Arena:通过研讨会基础任务对LLMs研究能力的首次检验
LLM
Agent
Haiyuan Wan, Chen Yang, Junchi Yu, et al.
迈向大语言模型后训练的统一视角
监督式微调
强化学习
Xingtai Lv, Yuxin Zuo, Youbang Sun, et al.
从编辑到密集几何估计器
深度估计
扩散模型
JiYuan Wang, Chunyu Lin, Lei Sun, et al.
Drivel-ology:通过深度解读荒谬内容挑战LLM
LLM
DeepSeek
Yang Wang, Chenghao Xiao, Chia-Yi Hsiao, et al.
龙:通过验证器实现大规模长链思维合成
LLM
数据集
Xingyue Huang, Rishabh, Gregor Franke, et al.
ArcMemo:基于持续学习LLM记忆的抽象推理组合
LLM
推理
Matthew Ho, Chen Si, Zhaoxiang Feng, et al.
1
29
30
31
32
33
34
35
50
UMO:通过匹配奖励实现图像定制中的多身份一致性扩展
扩散模型
图像生成
Yufeng Cheng, Wenxu Wu, Shaojin Wu, et al.
重建对齐提升统一多模态模型
多模态
图像生成
Ji Xie, Trevor Darrell, Luke Zettlemoyer, et al.
Mini-o3:面向视觉搜索的推理模式与交互轮次的扩展
推理
Agent
Xin Lai, Junyi Li, Wei Li, et al.
多模态大语言模型的视觉表征对齐
多模态表征
多模态
Heeji Yoon, Jaewoo Jung, Junwan Kim, et al.
并行-R1:通过强化学习实现并行思维
强化学习
监督式微调
Tong Zheng, Hongming Zhang, Wenhao Yu, et al.
WenetSpeech-Yue:一个具有多维度标注的大规模粤语语音语料库
语音生成
数据集
Longhao Li, Zhao Guo, Hongjie Chen, et al.
SheetDesigner:基于规则与视觉反馈的MLLM驱动电子表格布局生成
多模态
文档理解
Qin Chen, Yuanyi Ren, Xiaojun Ma, et al.
自主代码演化邂逅NP-完全性
LLM
Agent
Cunxi Yu, Rongjian Liang, Chia-Tung Ho, et al.
深度研究系统中的强化学习基础:一项综述
强化学习
Agent
Wenjun Li, Zhi Chen, Jingru Lin, et al.
工具增强的视觉感知
LLM
推理
Zetong Zhou, Dongping Chen, Zixian Ma, et al.
DINOv3 是否设定了新的医学视觉标准?
计算机视觉
医学影像
Che Liu, Yinda Chen, Haoyuan Shi, et al.
用于扩散大语言模型的强化学习框架的革命性革新
LLM
监督式微调
Yinjie Wang, Ling Yang, Bowen Li, et al.
WebExplorer:用于训练长时序Web Agent的探索与演化
Agent
监督式微调
Junteng Liu, Yunji Li, Chi Zhang, et al.
逆向工程推理用于开放式生成
推理
LLM
Haozhe Wang, Haoran Que, Qixin Xu, et al.
OSC:多智能体LLM协作中的动态知识对齐认知编排
Agent
LLM
Jusheng Zhang, Yijia Fan, Kaitong Cai, et al.
CURE:用于鲁棒嵌入的可控遗忘——缓解预训练语言模型中的概念捷径
自然语言处理
监督式微调
Aysenur Kocak, Shuo Yang, Bardh Prenkaj, et al.
MedVista3D:用于减少三维CT疾病检测、理解与报告中诊断错误的视觉-语言建模
视觉问答
多模态
Yuheng Li, Yenho Chen, Yuxiang Lai, et al.
LuxDiT:基于视频扩散Transformer的光照估计
扩散模型
图生图
Ruofan Liang, Kai He, Zan Gojcic, et al.
WildScore:在野符号音乐推理中对MLLMs的基准测试
基准
视觉问答
Gagan Mundada, Yash Vishe, Amit Namburi, et al.
设置块解码是一种语言模型推理加速器
LLM
文本生成
Itai Gat, Heli Ben-Hamu, Marton Havasi, et al.
基于大型语言模型的符号图形编程
LLM
代码生成
Yamei Chen, Haoquan Zhang, Yangyi Huang, et al.
语言模型为何会产生幻觉
LLM
推理
Adam Tauman Kalai, Ofir Nachum, Santosh S. Vempala, et al.
LatticeWorld:一种由多模态大语言模型驱动的交互式复杂世界生成框架
3D 生成
Agent
Yinglin Duan, Zhengxia Zou, Tongwei Gu, et al.
Recomposer:基于事件滚动引导的生成式音频编辑
音频生成
语音生成
Daniel P. W. Ellis, Eduardo Fonseca, Ron J. Weiss, et al.
转换模型:重新思考生成式学习目标
扩散模型
建模
Zidong Wang, Yiyuan Zhang, Xiaoyu Yue, et al.
逆向 IFEval:LLMs 能否摒弃顽固的训练惯例以遵循真实指令?
基准
监督式微调
Qinyan Zhang, Xinping Lei, Ruijie Miao, et al.
DeepResearch Arena:通过研讨会基础任务对LLMs研究能力的首次检验
LLM
Agent
Haiyuan Wan, Chen Yang, Junchi Yu, et al.
迈向大语言模型后训练的统一视角
监督式微调
强化学习
Xingtai Lv, Yuxin Zuo, Youbang Sun, et al.
从编辑到密集几何估计器
深度估计
扩散模型
JiYuan Wang, Chunyu Lin, Lei Sun, et al.
Drivel-ology:通过深度解读荒谬内容挑战LLM
LLM
DeepSeek
Yang Wang, Chenghao Xiao, Chia-Yi Hsiao, et al.
龙:通过验证器实现大规模长链思维合成
LLM
数据集
Xingyue Huang, Rishabh, Gregor Franke, et al.
ArcMemo:基于持续学习LLM记忆的抽象推理组合
LLM
推理
Matthew Ho, Chen Si, Zhaoxiang Feng, et al.
1
29
30
31
32
33
34
35
50