HyperAI超神经

预训练、中段训练与强化学习在推理语言模型中的相互作用

强化学习

LLM

Charlie Zhang, Graham Neubig, Xiang Yue

DeepCode：开放的智能体编码

代码生成

检索增强生成

Zongwei Li, Zhonghang Li, Zirui Guo, et al.

InfiniteVL：融合线性与稀疏注意力机制以实现高效、无限输入的视觉-语言模型

Transformer

统一多模态

Hongyuan Tao, Bencheng Liao, Shaoyu Chen, et al.

扩散模型

图像生成

Cheng Liu, Yiren Song, Haofan Wang, et al.

统一多模态

机器人技术

Minghui Lin, Pengxiang Ding, Shu Wang, et al.

LLM

推理

Monishwaran Maheswaran, Rishabh Tiwari, Yuezhou Hu, et al.

多模态

统一多模态

Xianghao Kong, Zeyu Zhang, Yuwei Guo, et al.

视频生成

3D 生成

Ke Xing, Longfei Li, Yuyang Yin, et al.

LLM

基准

Daogao Liu, Edith Cohen, Badih Ghazi, et al.

LLM

监督式微调

Manas Joglekar, Jeremy Chen, Gabriel Wu, et al.

Agent

推理

Melissa Z. Pan, Negar Arabzadeh, Riccardo Cogo, et al.

LLM

推理

Yiming Wang, Pei Zhang, Jialong Tang, et al.

LLM

推理

Long Lian, Sida Wang, Felix Juefei-Xu, et al.

强化学习

监督式微调

Salman Rahman, Sruthi Gorantla, Arpit Gupta, et al.

视频生成

图生视频

Zhaochong An, Menglin Jia, Haonan Qiu, et al.

视频处理

计算机视觉

Zekai Luo, Zongze Du, Zhouhang Zhu, et al.

3D 模型

3D 生成

Yuning Gong, Yifei Liu, Yifan Zhan, et al.

视频生成

图生视频

Ruihang Chu, Yefei He, Zhekai Chen, et al.

强化学习

LLM

Chang Gao, Chujie Zheng, Xiong-Hui Chen, et al.

视频生成

文生视频

Zijian Zhou, Shikun Liu, Haozhe Liu, et al.

3D 生成

图生图

Yi-Chuan Huang, Jiewen Chan, Hao-Jen Chien, et al.

LLM

Agent

Ming Ma, Jue Zhang, Fangkai Yang, et al.

视频生成

视频处理

Xiangpeng Yang, Ji Xie, Yiyuan Yang, et al.

Transformer

LLM

Xiaoran Liu, Yuerong Song, Zhigeng Liu, et al.

LLM

Agent

Tong Wu, Yang Liu, Jun Bai, et al.

LLM

深度学习

Zixun Xiong, Gaoyi Wu, Qingyang Yu, et al.

多模态

监督式微调

Yitong Zhang, Jia Li, Liyi Cai, et al.

3D 生成

扩散模型

Dilin Wang, Hyunyoung Jung, Tom Monnier, et al.

LLM

模型训练

Shalini Maiti, Amar Budhiraja, Bhavul Gauri, et al.

推理

LLM

Zicheng Xu, Guanchu Wang, Yu-Neng Chuang, et al.

LLM

建模

Richard Cornelius Suwandi, Feng Yin, Juntao Wang, et al.

Transformer

自然语言处理

Xiangyu Hong, Che Jiang, Kai Tian, et al.

预训练、中段训练与强化学习在推理语言模型中的相互作用

强化学习

LLM

Charlie Zhang, Graham Neubig, Xiang Yue

DeepCode：开放的智能体编码

代码生成

检索增强生成

Zongwei Li, Zhonghang Li, Zirui Guo, et al.

Transformer

统一多模态

Hongyuan Tao, Bencheng Liao, Shaoyu Chen, et al.

扩散模型

图像生成

Cheng Liu, Yiren Song, Haofan Wang, et al.

统一多模态

机器人技术

Minghui Lin, Pengxiang Ding, Shu Wang, et al.

LLM

推理

Monishwaran Maheswaran, Rishabh Tiwari, Yuezhou Hu, et al.

多模态

统一多模态

Xianghao Kong, Zeyu Zhang, Yuwei Guo, et al.

视频生成

3D 生成

Ke Xing, Longfei Li, Yuyang Yin, et al.

LLM

基准

Daogao Liu, Edith Cohen, Badih Ghazi, et al.

LLM

监督式微调

Manas Joglekar, Jeremy Chen, Gabriel Wu, et al.

Agent

推理

Melissa Z. Pan, Negar Arabzadeh, Riccardo Cogo, et al.

LLM

推理

Yiming Wang, Pei Zhang, Jialong Tang, et al.

LLM

推理

Long Lian, Sida Wang, Felix Juefei-Xu, et al.

强化学习

监督式微调

Salman Rahman, Sruthi Gorantla, Arpit Gupta, et al.

视频生成

图生视频

Zhaochong An, Menglin Jia, Haonan Qiu, et al.

视频处理

计算机视觉

Zekai Luo, Zongze Du, Zhouhang Zhu, et al.

3D 模型

3D 生成

Yuning Gong, Yifei Liu, Yifan Zhan, et al.

视频生成

图生视频

Ruihang Chu, Yefei He, Zhekai Chen, et al.

强化学习

LLM

Chang Gao, Chujie Zheng, Xiong-Hui Chen, et al.

视频生成

文生视频

Zijian Zhou, Shikun Liu, Haozhe Liu, et al.

3D 生成

图生图

Yi-Chuan Huang, Jiewen Chan, Hao-Jen Chien, et al.

LLM

Agent

Ming Ma, Jue Zhang, Fangkai Yang, et al.

视频生成

视频处理

Xiangpeng Yang, Ji Xie, Yiyuan Yang, et al.

Transformer

LLM

Xiaoran Liu, Yuerong Song, Zhigeng Liu, et al.

LLM

Agent

Tong Wu, Yang Liu, Jun Bai, et al.

LLM

深度学习

Zixun Xiong, Gaoyi Wu, Qingyang Yu, et al.

多模态

监督式微调

Yitong Zhang, Jia Li, Liyi Cai, et al.

3D 生成

扩散模型

Dilin Wang, Hyunyoung Jung, Tom Monnier, et al.

LLM

模型训练

Shalini Maiti, Amar Budhiraja, Bhavul Gauri, et al.

推理

LLM

Zicheng Xu, Guanchu Wang, Yu-Neng Chuang, et al.

LLM

建模

Richard Cornelius Suwandi, Feng Yin, Juntao Wang, et al.

Transformer

自然语言处理

Xiangyu Hong, Che Jiang, Kai Tian, et al.

InfiniteVL：融合线性与稀疏注意力机制以实现高效、无限输入的视觉-语言模型

OmniPSD：基于扩散Transformer的分层PSD生成

HiF-VLA：通过运动表征实现的回望、洞察与前瞻，用于视觉-语言-动作模型

套利：通过优势感知推测实现高效推理

通过概念提示绑定从图像和视频中组合概念

StereoWorld：面向几何感知的单目到立体视频生成

Urania：面向AI使用的差分隐私洞察

通过忏悔训练LLM实现诚实性

生产环境中的Agent评估

PolyMath：多语言情境下的数学推理评估

ThreadWeaver：面向语言模型高效并行推理的自适应线程调度

SPARK：面向无参考强化学习的分步过程感知奖励

OneStory：基于自适应记忆的一致性多轮视频生成

保持源视频真实感：面向电影级画质的高保真人脸替换

Visionary：基于WebGPU驱动的高斯点渲染平台构建的世界模型载体

Wan-Move：基于潜在轨迹引导的可控制运动视频生成

软适应性策略优化

零样本跨模态视频生成

Voxify3D：像素艺术邂逅体素渲染

DoVer：基于干预驱动的LLM多智能体系统自动调试

基于时序推理的统一视频编辑

超越真实：用于长上下文LLM的旋转位置编码的虚数扩展

原生并行推理器：通过自蒸馏强化学习实现并行推理

iSeal：用于可靠LLM所有权验证的加密指纹技术

DAVSP：通过深度对齐视觉安全提示实现大视觉-语言模型的安全对齐

WorldGen：从文本到可通行且可交互的3D世界

超级模型：简单算术如何解锁最先进的LLM性能

DTS：通过解码树草图增强大型推理模型

基于LLMs的贝叶斯优化自适应核设计宛如轻而易举之事

DePass：通过简单分解前向传播实现统一特征归因

InfiniteVL：融合线性与稀疏注意力机制以实现高效、无限输入的视觉-语言模型

OmniPSD：基于扩散Transformer的分层PSD生成

HiF-VLA：通过运动表征实现的回望、洞察与前瞻，用于视觉-语言-动作模型

套利：通过优势感知推测实现高效推理

通过概念提示绑定从图像和视频中组合概念

StereoWorld：面向几何感知的单目到立体视频生成

Urania：面向AI使用的差分隐私洞察

通过忏悔训练LLM实现诚实性

生产环境中的Agent评估

PolyMath：多语言情境下的数学推理评估

ThreadWeaver：面向语言模型高效并行推理的自适应线程调度

SPARK：面向无参考强化学习的分步过程感知奖励

OneStory：基于自适应记忆的一致性多轮视频生成

保持源视频真实感：面向电影级画质的高保真人脸替换

Visionary：基于WebGPU驱动的高斯点渲染平台构建的世界模型载体

Wan-Move：基于潜在轨迹引导的可控制运动视频生成

软适应性策略优化

零样本跨模态视频生成

Voxify3D：像素艺术邂逅体素渲染

DoVer：基于干预驱动的LLM多智能体系统自动调试

基于时序推理的统一视频编辑

超越真实：用于长上下文LLM的旋转位置编码的虚数扩展

原生并行推理器：通过自蒸馏强化学习实现并行推理

iSeal：用于可靠LLM所有权验证的加密指纹技术

DAVSP：通过深度对齐视觉安全提示实现大视觉-语言模型的安全对齐

WorldGen：从文本到可通行且可交互的3D世界

超级模型：简单算术如何解锁最先进的LLM性能

DTS：通过解码树草图增强大型推理模型

基于LLMs的贝叶斯优化自适应核设计宛如轻而易举之事

DePass：通过简单分解前向传播实现统一特征归因

Command Palette

论文

Command Palette

论文

Command Palette

论文