HyperAI超神经

OmniVinci：提升架构与数据以实现全模态理解 LLM

多模态表征

统一多模态

Hanrong Ye, Chao-Han Huck Yang, Arushi Goel, et al.

关于LLM推理中内部概率与自洽性衔接的理论研究

推理

LLM

Zhi Zhou, Yuhao Tan, Zenan Li, et al.

OCR

LLM

Haoran Wei, Yaofeng Sun, Yukun Li

偏好

LLM

Keertana Chidambaram, Karthik Vinary Seetharaman, Vasilis Syrgkanis

扩散模型

深度学习

Salva Rühling Cachay, Miika Aittala, Karsten Kreis, et al.

统一多模态

文生视频

Meiqi Wu, Jiashu Zhu, Xiaokun Feng, et al.

多模态

多模态表征

Haiwen Diao, Mingxuan Li, Silei Wu, et al.

Agent

多模态

Zichen Wen, Yiyu Wang, Chenfei Liao, et al.

文生图

图像生成

Hengyuan Xu, Wei Cheng, Peng Xing, et al.

强化学习

Agent

Guanting Dong, Licheng Bao, Zhongyuan Wang, et al.

数据集

LLM

Elisei Rykov, Kseniia Petrushina, Maksim Savkin, et al.

深度学习

卷积神经网络

Andreas L. Gimpel, Bowen Fan, Dexiong Chen, et al.

基因组学

高性能计算

Aaron McKenna, Matthew Hanna, Eric Banks, et al.

建模

高性能计算

Aidan P. Thompson, H. Metin Aktulga, Richard Berger, et al.

Le Cong, Zaixi Zhang, Xiaotong Wang, et al.

文档理解

多模态

Hao Feng, Shu Wei, Xiang Fei, et al.

LLM

视觉问答

Joya Chen, Ziyun Zeng, Yiqi Lin, et al.

视觉问答

检索增强生成

Kartik Narayan, Yang Xu, Tian Cao, et al.

LLM

AI for Science

Syed Asad Rizvi, Daniel Levine, Aakash Patel, et al.

LLM

Agent

Yuyao Ge, Lingrui Mei, Zenghao Duan, et al.

目标检测

多模态

Qing Jiang, Junan Huo, Xingyu Chen, et al.

多模态表征

统一多模态

Chenghao Xiao, Hou Pong Chan, Hao Zhang, et al.

翻译

LLM

Enze Zhang, Jiaying Wang, Mengxi Xiao, et al.

扩散模型

图像生成

Jiachen Lei, Keli Liu, Julius Berner, et al.

多模态

多模态表征

Fuhao Li, Wenxuan Song, Han Zhao, et al.

偏好

LLM

Ali Montazeralghaem, Guy Tennenholtz, Craig Boutilier, et al.

偏好

自然语言处理

Micah Carroll, Adeline Foote, Kevin Feng, et al.

强化学习

LLM

Jinghao Zhang, Naishan Zheng, Ruilin Li, et al.

扩散模型

文本生成

Qinglin Zhu, Yizhen Yao, Runcong Zhao, et al.

视频理解

多模态

Caorui Li, Yu Chen, Yiyan Ji, et al.

Agent

基准

Yu Qi, Haibo Zhao, Ziyu Guo, et al.

扩散模型

图像生成

Boyang Zheng, Nanye Ma, Shengbang Tong, et al.

OmniVinci：提升架构与数据以实现全模态理解 LLM

多模态表征

统一多模态

Hanrong Ye, Chao-Han Huck Yang, Arushi Goel, et al.

关于LLM推理中内部概率与自洽性衔接的理论研究

推理

LLM

Zhi Zhou, Yuhao Tan, Zenan Li, et al.

OCR

LLM

Haoran Wei, Yaofeng Sun, Yukun Li

偏好

LLM

Keertana Chidambaram, Karthik Vinary Seetharaman, Vasilis Syrgkanis

扩散模型

深度学习

Salva Rühling Cachay, Miika Aittala, Karsten Kreis, et al.

统一多模态

文生视频

Meiqi Wu, Jiashu Zhu, Xiaokun Feng, et al.

多模态

多模态表征

Haiwen Diao, Mingxuan Li, Silei Wu, et al.

Agent

多模态

Zichen Wen, Yiyu Wang, Chenfei Liao, et al.

文生图

图像生成

Hengyuan Xu, Wei Cheng, Peng Xing, et al.

强化学习

Agent

Guanting Dong, Licheng Bao, Zhongyuan Wang, et al.

数据集

LLM

Elisei Rykov, Kseniia Petrushina, Maksim Savkin, et al.

深度学习

卷积神经网络

Andreas L. Gimpel, Bowen Fan, Dexiong Chen, et al.

基因组学

高性能计算

Aaron McKenna, Matthew Hanna, Eric Banks, et al.

建模

高性能计算

Aidan P. Thompson, H. Metin Aktulga, Richard Berger, et al.

Le Cong, Zaixi Zhang, Xiaotong Wang, et al.

文档理解

多模态

Hao Feng, Shu Wei, Xiang Fei, et al.

LLM

视觉问答

Joya Chen, Ziyun Zeng, Yiqi Lin, et al.

视觉问答

检索增强生成

Kartik Narayan, Yang Xu, Tian Cao, et al.

LLM

AI for Science

Syed Asad Rizvi, Daniel Levine, Aakash Patel, et al.

LLM

Agent

Yuyao Ge, Lingrui Mei, Zenghao Duan, et al.

目标检测

多模态

Qing Jiang, Junan Huo, Xingyu Chen, et al.

多模态表征

统一多模态

Chenghao Xiao, Hou Pong Chan, Hao Zhang, et al.

翻译

LLM

Enze Zhang, Jiaying Wang, Mengxi Xiao, et al.

扩散模型

图像生成

Jiachen Lei, Keli Liu, Julius Berner, et al.

多模态

多模态表征

Fuhao Li, Wenxuan Song, Han Zhao, et al.

偏好

LLM

Ali Montazeralghaem, Guy Tennenholtz, Craig Boutilier, et al.

偏好

自然语言处理

Micah Carroll, Adeline Foote, Kevin Feng, et al.

强化学习

LLM

Jinghao Zhang, Naishan Zheng, Ruilin Li, et al.

扩散模型

文本生成

Qinglin Zhu, Yizhen Yao, Runcong Zhao, et al.

视频理解

多模态

Caorui Li, Yu Chen, Yiyan Ji, et al.

Agent

基准

Yu Qi, Haibo Zhao, Ziyu Guo, et al.

扩散模型

图像生成

Boyang Zheng, Nanye Ma, Shengbang Tong, et al.

DeepSeek-OCR：上下文光学压缩

带有未观测偏好异质性的直接偏好优化：三元偏好必要性

用于概率天气预报的滚动扩散模型阐释

图像搜索：超越语义依赖约束的视频生成自适应测试时搜索

从像素到文字——迈向大规模原生视觉-语言原子单元

面向服务的AI：通过AI眼镜实现主动辅助

WithAnyone：迈向可控且ID一致的图像生成

代理熵平衡策略优化

当模型说谎时，我们得以学习：基于PsiloQA的多语言跨度级幻觉检测

基于深度学习预测多模板PCR中的序列特异性扩增效率

基因组分析工具：一种用于分析下一代DNA测序数据的MapReduce框架

LAMMPS - 一种用于原子、介观和连续尺度下基于粒子材料建模的灵活模拟工具

LabOS：能够感知并协同人类的AI-XR共科研人员

海豚：基于异构锚点提示的文档图像解析

LiveCC：基于大规模流式语音转录学习视频LLM

DeepMMSearch-R1：赋能多模态LLM在多模态网络搜索中的应用

用于下一代单细胞分析的大型语言模型扩展

基于大语言模型的氛围编码综述

通过下一位置预测检测任何内容

面向语言中心的多模态表征学习的扩展

DITING：用于基准测试网络小说翻译的多Agent评估框架

通过自监督预训练推进端到端像素空间生成建模

空间强制：面向视觉-语言-动作模型的隐式空间表征对齐

基于大型语言模型的偏好获取中的澄清性问题提问

CTRL-Rec：通过自然语言控制推荐系统

RLFR：通过流环境扩展用于LLM的强化学习

潜在精炼解码：通过精炼信念状态增强基于扩散的LLM

OmniVideoBench：面向全景多模态大模型的音视频理解评估

BEAR：面向原子化具身能力的多模态语言模型基准测试与增强

具有表示自编码器的扩散Transformer

DeepSeek-OCR：上下文光学压缩

带有未观测偏好异质性的直接偏好优化：三元偏好必要性

用于概率天气预报的滚动扩散模型阐释

图像搜索：超越语义依赖约束的视频生成自适应测试时搜索

从像素到文字——迈向大规模原生视觉-语言原子单元

面向服务的AI：通过AI眼镜实现主动辅助

WithAnyone：迈向可控且ID一致的图像生成

代理熵平衡策略优化

当模型说谎时，我们得以学习：基于PsiloQA的多语言跨度级幻觉检测

基于深度学习预测多模板PCR中的序列特异性扩增效率

基因组分析工具：一种用于分析下一代DNA测序数据的MapReduce框架

LAMMPS - 一种用于原子、介观和连续尺度下基于粒子材料建模的灵活模拟工具

LabOS：能够感知并协同人类的AI-XR共科研人员

海豚：基于异构锚点提示的文档图像解析

LiveCC：基于大规模流式语音转录学习视频LLM

DeepMMSearch-R1：赋能多模态LLM在多模态网络搜索中的应用

用于下一代单细胞分析的大型语言模型扩展

基于大语言模型的氛围编码综述

通过下一位置预测检测任何内容

面向语言中心的多模态表征学习的扩展

DITING：用于基准测试网络小说翻译的多Agent评估框架

通过自监督预训练推进端到端像素空间生成建模

空间强制：面向视觉-语言-动作模型的隐式空间表征对齐

基于大型语言模型的偏好获取中的澄清性问题提问

CTRL-Rec：通过自然语言控制推荐系统

RLFR：通过流环境扩展用于LLM的强化学习

潜在精炼解码：通过精炼信念状态增强基于扩散的LLM

OmniVideoBench：面向全景多模态大模型的音视频理解评估

BEAR：面向原子化具身能力的多模态语言模型基准测试与增强

具有表示自编码器的扩散Transformer

Command Palette

论文

Command Palette

论文

Command Palette

论文