HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
Extract-0:用于文档信息提取的专用语言模型
监督式微调
文档理解
Henrique Godoy
OmniRetarget:面向人形机器人全身运动与操作及场景交互的交互保持型数据生成
机器人技术
强化学习
Lujie Yang, Xiaoyu Huang, Zhen Wu, et al.
WildSpeech-Bench:在真实场景中对端到端SpeechLLM进行基准测试
基准
音频和语音处理
Linhao Zhang, Jian Zhang, Bokai Lei, et al.
针对大型语言模型对齐的内部激活值的Token感知编辑
LLM
监督式微调
Tianbo Wang, Yuqing Ma, Kewei Liao, et al.
旨在学习:面向低资源视觉-语言建模的Token级动态门控
视觉问答
Transformer
Bianca-Mihaela Ganescu, Suchir Salhan, Andrew Caines, et al.
通过早期经验进行Agent学习
监督式微调
强化学习
Kai Zhang, Xiangchao Chen, Bo Liu, et al.
MATRIX:用于交互感知视频生成的掩码轨迹对齐
视频生成
文生视频
Siyoon Jin, Seongchan Kim, Dahyun Chung, et al.
RLinf-VLA:一种统一且高效的VLA+RL训练框架
强化学习
多模态表征
Hongzhi Zang, Mingjie Wei, Si Xu, et al.
SHANKS:用于语音语言模型的同步听与思
音频和语音处理
人机交互
Cheng-Han Chiang, Xiaofei Wang, Linjie Li, et al.
Lumina-DiMOO:一种用于多模态生成与理解的全模态扩散大型语言模型
统一多模态
扩散模型
Yi Xin, Qi Qin, Siqi Luo, et al.
缓存到缓存:大型语言模型之间的直接语义通信
LLM
Transformer
Tianyu Fu, Zihan Min, Hanling Zhang, et al.
Ming-UniVision:基于统一连续Tokenizer的联合图像理解与生成
图像理解
多模态
Ziyuan Huang, DanDan Zheng, Cheng Zou, et al.
Phi-3 技术报告:一款可在您的手机上本地运行的高性能语言模型
LLM
模型训练
Marah Abdin, Sam Ade Jacobs, Ammar Ahmad Awan, et al.
Qwen2.5 技术报告
LLM
监督式微调
Qwen, An Yang, Baosong Yang, et al.
通过引入深度研究增强AlphaEvolve实现科学算法发现
Agent
算法
Gang Liu, Yihan Zhu, Jie Chen, et al.
ConstraintLLM:一种面向工业级约束编程的神经符号框架
LLM
监督式微调
Weichun Shi, Minghao Liu, Wanting Zhang, et al.
代码辅助思维链与指令的扩展用于模型推理
LLM
代码生成
Honglin Lin, Qizhi Pei, Xin Gao, et al.
CoDA:通过扩散适应进行编码LM
扩散模型
文本生成
Haolin Chen, Shiyu Wang, Can Qin, et al.
Fast-dLLM v2:高效块扩散LLM
扩散模型
模型训练
Chengyue Wu, Hao Zhang, Shuchen Xue, et al.
少即是多:使用小型网络进行递归推理
推理
神经网络
Alexia Jolicoeur-Martineau
Fathom-DeepResearch:解锁长时程信息检索与综合以赋能SLMs
智能问答
Agent
Shreyas Singh, Kunal Singh, Pradeep Moturi
TaTToo:面向表格推理中测试时扩展的工具基础思维PRM
监督式微调
LLM
Jiaru Zou, Soumya Roy, Vinay Kumar Verma, et al.
语言模型的混合架构:系统性分析与设计洞察
LLM
Transformer
Sangmin Bae, Bilge Acun, Haroun Habeeb, et al.
MITS:通过点互信息增强LLM的树搜索推理
推理
LLM
Jiaxi Li, Yucheng Shi, Jin Lu, et al.
对大型语言模型的不可察觉的越狱攻击
LLM
文本生成
Kuofeng Gao, Yiming Li, Chao Du, et al.
VChain:用于视频生成推理的视觉思维链
视频生成
推理
Ziqi Huang, Ning Yu, Gordon Chen, et al.
视频-LMM后训练:基于大型多模态模型的视频推理深度探究
监督式微调
LLM
Yunlong Tang, Jing Bi, Pinxin Liu, et al.
Paper2Video:从科学论文自动生成视频
文生视频
统一多模态
Zeyu Zhu, Kevin Qinghong Lin, Mike Zheng Shou
微缩扩展FP4量化中的承诺与性能之间的差距
LLM
Transformer
Vage Egiazarian, Roberto L. Castro, Denis Kuznedelev, et al.
多模态大语言模型中的自提升:一项综述
多模态
LLM
Shijian Deng, Kai Wang, Tianyu Yang, et al.
通过测试时分布级组合改进基于扩散或基于流的机器人策略
扩散模型
机器人技术
Jiahang Cao, Yize Huang, Hanzhong Guo, et al.
大型推理模型从有缺陷的思维中学习到更好的对齐
LLM
偏好
ShengYun Peng, Eric Smith, Ivan Evtimov, et al.
1
23
24
25
26
27
28
29
50
Extract-0:用于文档信息提取的专用语言模型
监督式微调
文档理解
Henrique Godoy
OmniRetarget:面向人形机器人全身运动与操作及场景交互的交互保持型数据生成
机器人技术
强化学习
Lujie Yang, Xiaoyu Huang, Zhen Wu, et al.
WildSpeech-Bench:在真实场景中对端到端SpeechLLM进行基准测试
基准
音频和语音处理
Linhao Zhang, Jian Zhang, Bokai Lei, et al.
针对大型语言模型对齐的内部激活值的Token感知编辑
LLM
监督式微调
Tianbo Wang, Yuqing Ma, Kewei Liao, et al.
旨在学习:面向低资源视觉-语言建模的Token级动态门控
视觉问答
Transformer
Bianca-Mihaela Ganescu, Suchir Salhan, Andrew Caines, et al.
通过早期经验进行Agent学习
监督式微调
强化学习
Kai Zhang, Xiangchao Chen, Bo Liu, et al.
MATRIX:用于交互感知视频生成的掩码轨迹对齐
视频生成
文生视频
Siyoon Jin, Seongchan Kim, Dahyun Chung, et al.
RLinf-VLA:一种统一且高效的VLA+RL训练框架
强化学习
多模态表征
Hongzhi Zang, Mingjie Wei, Si Xu, et al.
SHANKS:用于语音语言模型的同步听与思
音频和语音处理
人机交互
Cheng-Han Chiang, Xiaofei Wang, Linjie Li, et al.
Lumina-DiMOO:一种用于多模态生成与理解的全模态扩散大型语言模型
统一多模态
扩散模型
Yi Xin, Qi Qin, Siqi Luo, et al.
缓存到缓存:大型语言模型之间的直接语义通信
LLM
Transformer
Tianyu Fu, Zihan Min, Hanling Zhang, et al.
Ming-UniVision:基于统一连续Tokenizer的联合图像理解与生成
图像理解
多模态
Ziyuan Huang, DanDan Zheng, Cheng Zou, et al.
Phi-3 技术报告:一款可在您的手机上本地运行的高性能语言模型
LLM
模型训练
Marah Abdin, Sam Ade Jacobs, Ammar Ahmad Awan, et al.
Qwen2.5 技术报告
LLM
监督式微调
Qwen, An Yang, Baosong Yang, et al.
通过引入深度研究增强AlphaEvolve实现科学算法发现
Agent
算法
Gang Liu, Yihan Zhu, Jie Chen, et al.
ConstraintLLM:一种面向工业级约束编程的神经符号框架
LLM
监督式微调
Weichun Shi, Minghao Liu, Wanting Zhang, et al.
代码辅助思维链与指令的扩展用于模型推理
LLM
代码生成
Honglin Lin, Qizhi Pei, Xin Gao, et al.
CoDA:通过扩散适应进行编码LM
扩散模型
文本生成
Haolin Chen, Shiyu Wang, Can Qin, et al.
Fast-dLLM v2:高效块扩散LLM
扩散模型
模型训练
Chengyue Wu, Hao Zhang, Shuchen Xue, et al.
少即是多:使用小型网络进行递归推理
推理
神经网络
Alexia Jolicoeur-Martineau
Fathom-DeepResearch:解锁长时程信息检索与综合以赋能SLMs
智能问答
Agent
Shreyas Singh, Kunal Singh, Pradeep Moturi
TaTToo:面向表格推理中测试时扩展的工具基础思维PRM
监督式微调
LLM
Jiaru Zou, Soumya Roy, Vinay Kumar Verma, et al.
语言模型的混合架构:系统性分析与设计洞察
LLM
Transformer
Sangmin Bae, Bilge Acun, Haroun Habeeb, et al.
MITS:通过点互信息增强LLM的树搜索推理
推理
LLM
Jiaxi Li, Yucheng Shi, Jin Lu, et al.
对大型语言模型的不可察觉的越狱攻击
LLM
文本生成
Kuofeng Gao, Yiming Li, Chao Du, et al.
VChain:用于视频生成推理的视觉思维链
视频生成
推理
Ziqi Huang, Ning Yu, Gordon Chen, et al.
视频-LMM后训练:基于大型多模态模型的视频推理深度探究
监督式微调
LLM
Yunlong Tang, Jing Bi, Pinxin Liu, et al.
Paper2Video:从科学论文自动生成视频
文生视频
统一多模态
Zeyu Zhu, Kevin Qinghong Lin, Mike Zheng Shou
微缩扩展FP4量化中的承诺与性能之间的差距
LLM
Transformer
Vage Egiazarian, Roberto L. Castro, Denis Kuznedelev, et al.
多模态大语言模型中的自提升:一项综述
多模态
LLM
Shijian Deng, Kai Wang, Tianyu Yang, et al.
通过测试时分布级组合改进基于扩散或基于流的机器人策略
扩散模型
机器人技术
Jiahang Cao, Yize Huang, Hanzhong Guo, et al.
大型推理模型从有缺陷的思维中学习到更好的对齐
LLM
偏好
ShengYun Peng, Eric Smith, Ivan Evtimov, et al.
1
23
24
25
26
27
28
29
50