HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
HyperAI
HyperAI
主区域
首页
GPU
控制台
文档
价格
Pulse
报道
资源
论文
教程
数据集
百科
基准测试
SOTA
大语言模型(LLM)
GPU 排行榜
社区
活动
开源
实用工具
搜索
关于
服务条款
隐私政策
中文
HyperAI
HyperAI
Toggle Sidebar
⌘
K
Command Palette
Search for a command to run...
登录
HyperAI
论文
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势
面向语言中心的多模态表征学习的扩展
多模态表征
统一多模态
Chenghao Xiao, Hou Pong Chan, Hao Zhang, et al.
DITING:用于基准测试网络小说翻译的多Agent评估框架
翻译
LLM
Enze Zhang, Jiaying Wang, Mengxi Xiao, et al.
通过自监督预训练推进端到端像素空间生成建模
扩散模型
图像生成
Jiachen Lei, Keli Liu, Julius Berner, et al.
空间强制:面向视觉-语言-动作模型的隐式空间表征对齐
多模态
多模态表征
Fuhao Li, Wenxuan Song, Han Zhao, et al.
基于大型语言模型的偏好获取中的澄清性问题提问
偏好
LLM
Ali Montazeralghaem, Guy Tennenholtz, Craig Boutilier, et al.
CTRL-Rec:通过自然语言控制推荐系统
偏好
自然语言处理
Micah Carroll, Adeline Foote, Kevin Feng, et al.
RLFR:通过流环境扩展用于LLM的强化学习
强化学习
LLM
Jinghao Zhang, Naishan Zheng, Ruilin Li, et al.
潜在精炼解码:通过精炼信念状态增强基于扩散的LLM
扩散模型
文本生成
Qinglin Zhu, Yizhen Yao, Runcong Zhao, et al.
OmniVideoBench:面向全景多模态大模型的音视频理解评估
视频理解
多模态
Caorui Li, Yu Chen, Yiyan Ji, et al.
BEAR:面向原子化具身能力的多模态语言模型基准测试与增强
Agent
基准
Yu Qi, Haibo Zhao, Ziyu Guo, et al.
具有表示自编码器的扩散Transformer
扩散模型
图像生成
Boyang Zheng, Nanye Ma, Shengbang Tong, et al.
QeRL:超越效率——面向LLMs的量化增强型强化学习
强化学习
模型训练
Wei Huang, Yi Ge, Shuai Yang, et al.
无需反向传播的威尔逊环:一种用于检测不变性与顺序敏感性的实用诊断方法
Transformer
监督式微调
Edward Y. Chang, Ethan Y. Chang
TUMIX:带有工具使用混合的多Agent测试时扩展
Agent
推理
Yongchao Chen, Jiefeng Chen, Rui Meng, et al.
R-Horizon:你的大型推理模型在广度与深度上究竟能走多远?
推理
基准
Yi Lu, Jianing Wang, Linsen Guo, et al.
AutoPR:让我们自动化你的学术晋升!
基准
多模态
Qiguang Chen, Zheng Yan, Mingda Yang, et al.
多模态提示优化:为何不利用多种模态来提升MLLMs?
多模态
统一多模态
Yumin Choi, Dongki Kim, Jinheon Baek, et al.
旁路增强引导用于幻觉抑制的扩散采样
扩散模型
图像生成
Hyunmin Cho, Donghoon Ahn, Susung Hong, et al.
用相机思考:一种面向以相机为中心的感知与生成的统一多模态模型
多模态
统一多模态
Kang Liao, Size Wu, Zhonghua Wu, et al.
D2E:在桌面数据上扩展视觉-动作预训练以实现向具身AI的迁移
具身智能
统一多模态
Suwhan Choi, Jaeyoon Jung, Haebin Seong, et al.
Code2Video:一种以代码为中心的教育视频生成范式
视频生成
代码生成
Yanzhe Chen, Kevin Qinghong Lin, Mike Zheng Shou
博士偏见:人工智能驱动的医疗指导中的社会不平等
自然语言处理
医学
Emma Kondrup, Anne Imouza
LLM的二阶优化潜力:基于完整高斯-牛顿法的研究
Transformer
LLM
Natalie Abreu, Nikhil Vyas, Sham Kakade, et al.
元认知增强推理模型:自对齐强化学习
推理
LLM
Yoonjeon Kim, Doohyuk Jang, Eunho Yang
从何到因:一种基于证据的化学反应条件推理多Agent系统
Agent
检索增强生成
Cheng Yang, Jiaxuan Lu, Haiyuan Wan, et al.
DreamOmni2:基于多模态指令的编辑与生成
多模态
图像生成
Bin Xia, Bohao Peng, Yuechen Zhang, et al.
VideoCanvas:通过上下文条件实现任意时空补丁的统一视频补全
视频生成
图像修复
Minghong Cai, Qiulin Wang, Zongli Ye, et al.
UniVideo:视频的统一理解、生成与编辑
统一多模态
视频生成
Cong Wei, Quande Liu, Zixuan Ye, et al.
MemMamba:重新思考状态空间模型中的记忆模式
Transformer
自然语言处理
Youjin Wang, Yangjingyi Chen, Jiahao Yan, et al.
MM-HELIX:通过整体平台与自适应混合策略优化提升多模态长链反思推理
多模态
推理
Xiangyu Zhao, Junming Lin, Tianhao Liang, et al.
PromptCoT 2.0:面向大型语言模型推理的提示合成扩展
LLM
推理
Xueliang Zhao, Wei Wu, Jian Guan, et al.
Extract-0:用于文档信息提取的专用语言模型
监督式微调
文档理解
Henrique Godoy
1
22
23
24
25
26
27
28
50
面向语言中心的多模态表征学习的扩展
多模态表征
统一多模态
Chenghao Xiao, Hou Pong Chan, Hao Zhang, et al.
DITING:用于基准测试网络小说翻译的多Agent评估框架
翻译
LLM
Enze Zhang, Jiaying Wang, Mengxi Xiao, et al.
通过自监督预训练推进端到端像素空间生成建模
扩散模型
图像生成
Jiachen Lei, Keli Liu, Julius Berner, et al.
空间强制:面向视觉-语言-动作模型的隐式空间表征对齐
多模态
多模态表征
Fuhao Li, Wenxuan Song, Han Zhao, et al.
基于大型语言模型的偏好获取中的澄清性问题提问
偏好
LLM
Ali Montazeralghaem, Guy Tennenholtz, Craig Boutilier, et al.
CTRL-Rec:通过自然语言控制推荐系统
偏好
自然语言处理
Micah Carroll, Adeline Foote, Kevin Feng, et al.
RLFR:通过流环境扩展用于LLM的强化学习
强化学习
LLM
Jinghao Zhang, Naishan Zheng, Ruilin Li, et al.
潜在精炼解码:通过精炼信念状态增强基于扩散的LLM
扩散模型
文本生成
Qinglin Zhu, Yizhen Yao, Runcong Zhao, et al.
OmniVideoBench:面向全景多模态大模型的音视频理解评估
视频理解
多模态
Caorui Li, Yu Chen, Yiyan Ji, et al.
BEAR:面向原子化具身能力的多模态语言模型基准测试与增强
Agent
基准
Yu Qi, Haibo Zhao, Ziyu Guo, et al.
具有表示自编码器的扩散Transformer
扩散模型
图像生成
Boyang Zheng, Nanye Ma, Shengbang Tong, et al.
QeRL:超越效率——面向LLMs的量化增强型强化学习
强化学习
模型训练
Wei Huang, Yi Ge, Shuai Yang, et al.
无需反向传播的威尔逊环:一种用于检测不变性与顺序敏感性的实用诊断方法
Transformer
监督式微调
Edward Y. Chang, Ethan Y. Chang
TUMIX:带有工具使用混合的多Agent测试时扩展
Agent
推理
Yongchao Chen, Jiefeng Chen, Rui Meng, et al.
R-Horizon:你的大型推理模型在广度与深度上究竟能走多远?
推理
基准
Yi Lu, Jianing Wang, Linsen Guo, et al.
AutoPR:让我们自动化你的学术晋升!
基准
多模态
Qiguang Chen, Zheng Yan, Mingda Yang, et al.
多模态提示优化:为何不利用多种模态来提升MLLMs?
多模态
统一多模态
Yumin Choi, Dongki Kim, Jinheon Baek, et al.
旁路增强引导用于幻觉抑制的扩散采样
扩散模型
图像生成
Hyunmin Cho, Donghoon Ahn, Susung Hong, et al.
用相机思考:一种面向以相机为中心的感知与生成的统一多模态模型
多模态
统一多模态
Kang Liao, Size Wu, Zhonghua Wu, et al.
D2E:在桌面数据上扩展视觉-动作预训练以实现向具身AI的迁移
具身智能
统一多模态
Suwhan Choi, Jaeyoon Jung, Haebin Seong, et al.
Code2Video:一种以代码为中心的教育视频生成范式
视频生成
代码生成
Yanzhe Chen, Kevin Qinghong Lin, Mike Zheng Shou
博士偏见:人工智能驱动的医疗指导中的社会不平等
自然语言处理
医学
Emma Kondrup, Anne Imouza
LLM的二阶优化潜力:基于完整高斯-牛顿法的研究
Transformer
LLM
Natalie Abreu, Nikhil Vyas, Sham Kakade, et al.
元认知增强推理模型:自对齐强化学习
推理
LLM
Yoonjeon Kim, Doohyuk Jang, Eunho Yang
从何到因:一种基于证据的化学反应条件推理多Agent系统
Agent
检索增强生成
Cheng Yang, Jiaxuan Lu, Haiyuan Wan, et al.
DreamOmni2:基于多模态指令的编辑与生成
多模态
图像生成
Bin Xia, Bohao Peng, Yuechen Zhang, et al.
VideoCanvas:通过上下文条件实现任意时空补丁的统一视频补全
视频生成
图像修复
Minghong Cai, Qiulin Wang, Zongli Ye, et al.
UniVideo:视频的统一理解、生成与编辑
统一多模态
视频生成
Cong Wei, Quande Liu, Zixuan Ye, et al.
MemMamba:重新思考状态空间模型中的记忆模式
Transformer
自然语言处理
Youjin Wang, Yangjingyi Chen, Jiahao Yan, et al.
MM-HELIX:通过整体平台与自适应混合策略优化提升多模态长链反思推理
多模态
推理
Xiangyu Zhao, Junming Lin, Tianhao Liang, et al.
PromptCoT 2.0:面向大型语言模型推理的提示合成扩展
LLM
推理
Xueliang Zhao, Wei Wu, Jian Guan, et al.
Extract-0:用于文档信息提取的专用语言模型
监督式微调
文档理解
Henrique Godoy
1
22
23
24
25
26
27
28
50