HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务协议
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务协议
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
MSign:通过稳定秩恢复防止大语言模型训练不稳定的优化器
模型训练
LLM
Lianhai Ren, Yucheng Ding, Xiao Liu, et al.
AudioSAE:基于稀疏自编码器的音频处理模型理解
音频和语音处理
深度学习
Georgii Aparin, Tasnima Sadekova, Alexey Rukhovich, et al.
大型语言模型强化微调中的熵动态研究
强化学习
LLM
Shumin Wang, Yuexiang Xie, Wenhao Zhang, et al.
OdysseyArena:面向长时程、主动式与归纳性交互的大型语言模型基准测试
Agent
LLM
Fangzhi Xu, Hang Yan, Qiushi Sun, et al.
百川-M3:面向可靠医疗决策的临床问诊建模
LLM
医学
Baichuan-M3 Team, Chengfeng Dou, Fan Yang, et al.
通过漂移进行生成建模
扩散模型
图像生成
Mingyang Deng, He Li, Tianhong Li, Kaiming He
AlphaEdit:针对语言模型的零空间约束知识编辑
LLM
文本生成
Junfeng Fang, Houcheng Jiang, Kun Wang, et al.
在13个参数中进行推理学习
推理
智能问答
John X. Morris, Niloofar Mireshghallah, Mark Ibrahim, et al.
DFlash:用于快速推测解码的块扩散方法
LLM
扩散模型
Jian Chen, Yesheng Liang, Zhijian Liu
上下文强制:基于长上下文的一致性自回归视频生成
视频生成
扩散模型
Shuo Chen, Cong Wei, Sun Sun, et al.
MemSkill:面向自演化智能体的内存技能学习与演化
Agent
LLM
Haozhen Zhang, Quanyu Long, Jianzhu Bao, et al.
长度无偏序列策略优化:揭示与控制RLVR中的响应长度变异
强化学习
LLM
Fanfan Liu, Youyang Yin, Peng Shi, et al.
Spider-Sense:基于分层自适应筛选的高效Agent防御内在风险感知
Agent
LLM
Zhenxiong Yu, Zhi Yang, Zhiheng Jin, et al.
CAR-bench:在现实世界不确定性下评估LLM Agent的一致性与限知性
LLM
Agent
Johannes Kirmayr, Lukas Stappen, Elisabeth André
延迟流建模的流式序列到序列学习
语音生成
多模态
Neil Zeghidour, Eugene Kharitonov, Manu Orsini, et al.
Kiss3DGen:将图像扩散模型重用于3D资产生成
3D 生成
扩散模型
Jiantao Lin, Xin Yang, Meixi Chen, et al.
基于缓存推理的有状态Conformer在流式自动语音识别中的应用
音频识别
Transformer
Vahid Noroozi, Somshubra Majumdar, Ankur Kumar, et al.
用于3D生成的原生与紧凑结构化隐变量
3D 生成
3D 模型
Jianfeng Xiang, Xiaoxue Chen, Sicheng Xu, et al.
连续音频语言模型
音频和语音处理
语音生成
Simon Rouard, Manu Orsini, Axel Roebel, et al.
虚拟临床环境中的诊断Agent演化
Agent
模型训练
Pengcheng Qiu, Chaoyi Wu, Junwei Liu, et al.
WeDLM:弥合扩散语言模型与标准因果注意力机制以实现快速推理
扩散模型
LLM
Aiwei Liu, Minghua He, Shaoxun Zeng, et al.
TurboDiffusion:通过100-200倍加速视频Diffusion模型
扩散模型
视频生成
Jintao Zhang, Kaiwen Zheng, Kai Jiang, et al.
HunyuanVideo-Foley:基于表示对齐的多模态扩散模型用于高保真Foley音频生成
视频生成
音频生成
Sizhe Shan, Qiulin Li, Yutao Cui, et al.
Fara-7B:一种用于计算机使用的高效Agent模型
Agent
LLM
Ahmed Awadallah, Yash Lara, Raghav Magazine, et al.
Fun-ASR 技术报告
LLM
音频识别
Keyu An, Yanni Chen, Zhigao Chen, et al.
利用Gemini加速科学研究:案例研究与常用技术
AI for Science
LLM
David P. Woodruff, Vincent Cohen-Addad, Lalit Jain, et al.
通过策略拍卖实现小规模Agent的扩展
Agent
LLM
Lisa Alazraki, William F. Shen, Yoram Bachrach, et al.
Vibe AIGC:通过智能体编排实现内容生成的新范式
Agent
多模态
Jiaheng Liu, Yuanxing Zhang, Shihao Li, et al.
PaperSearchQA:基于RLVR的科学论文搜索与推理学习
检索增强生成
AI for Science
James Burgess, Jan N. Hansen, Duo Peng, et al.
EgoActor:通过视觉-语言模型将任务规划嵌入空间感知的视角动作中以实现类人机器人
多模态
视觉问答
Yu Bai, MingMing Yu, Chaojie Li, et al.
A-RAG:通过分层检索接口实现智能体增强型检索生成的扩展
检索增强生成
Agent
Mingxuan Du, Benfeng Xu, Chiwei Zhu, et al.
Quant VideoGen:通过2比特KV缓存量化实现自回归长视频生成
视频生成
扩散模型
Haocheng Xi, Shuo Yang, Yilong Zhao, et al.
1
6
7
8
9
10
11
12
57
MSign:通过稳定秩恢复防止大语言模型训练不稳定的优化器
模型训练
LLM
Lianhai Ren, Yucheng Ding, Xiao Liu, et al.
AudioSAE:基于稀疏自编码器的音频处理模型理解
音频和语音处理
深度学习
Georgii Aparin, Tasnima Sadekova, Alexey Rukhovich, et al.
大型语言模型强化微调中的熵动态研究
强化学习
LLM
Shumin Wang, Yuexiang Xie, Wenhao Zhang, et al.
OdysseyArena:面向长时程、主动式与归纳性交互的大型语言模型基准测试
Agent
LLM
Fangzhi Xu, Hang Yan, Qiushi Sun, et al.
百川-M3:面向可靠医疗决策的临床问诊建模
LLM
医学
Baichuan-M3 Team, Chengfeng Dou, Fan Yang, et al.
通过漂移进行生成建模
扩散模型
图像生成
Mingyang Deng, He Li, Tianhong Li, Kaiming He
AlphaEdit:针对语言模型的零空间约束知识编辑
LLM
文本生成
Junfeng Fang, Houcheng Jiang, Kun Wang, et al.
在13个参数中进行推理学习
推理
智能问答
John X. Morris, Niloofar Mireshghallah, Mark Ibrahim, et al.
DFlash:用于快速推测解码的块扩散方法
LLM
扩散模型
Jian Chen, Yesheng Liang, Zhijian Liu
上下文强制:基于长上下文的一致性自回归视频生成
视频生成
扩散模型
Shuo Chen, Cong Wei, Sun Sun, et al.
MemSkill:面向自演化智能体的内存技能学习与演化
Agent
LLM
Haozhen Zhang, Quanyu Long, Jianzhu Bao, et al.
长度无偏序列策略优化:揭示与控制RLVR中的响应长度变异
强化学习
LLM
Fanfan Liu, Youyang Yin, Peng Shi, et al.
Spider-Sense:基于分层自适应筛选的高效Agent防御内在风险感知
Agent
LLM
Zhenxiong Yu, Zhi Yang, Zhiheng Jin, et al.
CAR-bench:在现实世界不确定性下评估LLM Agent的一致性与限知性
LLM
Agent
Johannes Kirmayr, Lukas Stappen, Elisabeth André
延迟流建模的流式序列到序列学习
语音生成
多模态
Neil Zeghidour, Eugene Kharitonov, Manu Orsini, et al.
Kiss3DGen:将图像扩散模型重用于3D资产生成
3D 生成
扩散模型
Jiantao Lin, Xin Yang, Meixi Chen, et al.
基于缓存推理的有状态Conformer在流式自动语音识别中的应用
音频识别
Transformer
Vahid Noroozi, Somshubra Majumdar, Ankur Kumar, et al.
用于3D生成的原生与紧凑结构化隐变量
3D 生成
3D 模型
Jianfeng Xiang, Xiaoxue Chen, Sicheng Xu, et al.
连续音频语言模型
音频和语音处理
语音生成
Simon Rouard, Manu Orsini, Axel Roebel, et al.
虚拟临床环境中的诊断Agent演化
Agent
模型训练
Pengcheng Qiu, Chaoyi Wu, Junwei Liu, et al.
WeDLM:弥合扩散语言模型与标准因果注意力机制以实现快速推理
扩散模型
LLM
Aiwei Liu, Minghua He, Shaoxun Zeng, et al.
TurboDiffusion:通过100-200倍加速视频Diffusion模型
扩散模型
视频生成
Jintao Zhang, Kaiwen Zheng, Kai Jiang, et al.
HunyuanVideo-Foley:基于表示对齐的多模态扩散模型用于高保真Foley音频生成
视频生成
音频生成
Sizhe Shan, Qiulin Li, Yutao Cui, et al.
Fara-7B:一种用于计算机使用的高效Agent模型
Agent
LLM
Ahmed Awadallah, Yash Lara, Raghav Magazine, et al.
Fun-ASR 技术报告
LLM
音频识别
Keyu An, Yanni Chen, Zhigao Chen, et al.
利用Gemini加速科学研究:案例研究与常用技术
AI for Science
LLM
David P. Woodruff, Vincent Cohen-Addad, Lalit Jain, et al.
通过策略拍卖实现小规模Agent的扩展
Agent
LLM
Lisa Alazraki, William F. Shen, Yoram Bachrach, et al.
Vibe AIGC:通过智能体编排实现内容生成的新范式
Agent
多模态
Jiaheng Liu, Yuanxing Zhang, Shihao Li, et al.
PaperSearchQA:基于RLVR的科学论文搜索与推理学习
检索增强生成
AI for Science
James Burgess, Jan N. Hansen, Duo Peng, et al.
EgoActor:通过视觉-语言模型将任务规划嵌入空间感知的视角动作中以实现类人机器人
多模态
视觉问答
Yu Bai, MingMing Yu, Chaojie Li, et al.
A-RAG:通过分层检索接口实现智能体增强型检索生成的扩展
检索增强生成
Agent
Mingxuan Du, Benfeng Xu, Chiwei Zhu, et al.
Quant VideoGen:通过2比特KV缓存量化实现自回归长视频生成
视频生成
扩散模型
Haocheng Xi, Shuo Yang, Yilong Zhao, et al.
1
6
7
8
9
10
11
12
57