HyperAI超神经

擦除它！通过机器遗忘在代码语言模型中消除敏感记忆

代码生成

LLM

Zhaoyang Chu, Yao Wan, Zhikun Zhang, et al.

全景图：具身AI时代全向视觉的崛起

计算机视觉

图像理解

Xu Zheng, Chenfei Liao, Ziqiao Weng, et al.

LLM

语言

Hasan Abed Al Kader Hammoud, Mohammad Zbeeb, Bernard Ghanem

强化学习

LLM

Daya Guo, Dejian Yang, Haowei Zhang, et al.

LLM

监督式微调

Pulkit Verma, Ngoc La, Anthony Favier, et al.

统一多模态

多任务学习

Zihao Wang, Muyao Li, Kaichen He, et al.

LLM

Agent

Deepro Choudhury, Sinead Williamson, Adam Goliński, et al.

Agent

推理

Xixi Wu, Kuan Li, Yida Zhao, et al.

Agent

推理

Zile Qiao, Guoxin Chen, Xuanzhong Chen, et al.

Agent

LLM

Runnan Fang, Shihao Cai, Baixuan Li, et al.

Agent

强化学习

Kuan Li, Zhongwang Zhang, Huifeng Yin, et al.

Agent

LLM

Liangcai Su, Zhen Zhang, Guangyu Li, et al.

检索增强生成

Agent

Zijian Li, Xin Guan, Bo Zhang, et al.

LLM

Transformer

Yuxi Li, Yi Liu, Gelei Deng, et al.

检索增强生成

LLM

Xiaoqiang Lin, Aritra Ghosh, Bryan Kian Hsiang Low, et al.

统一多模态

多任务学习

Yang Zhang, Chenwei Wang, Ouyang Lu, et al.

LLM

数据集

Gayathri Saranathan, Cong Xu, Mahammad Parwez Alam, et al.

视频生成

Transformer

Shengqu Cai, Ceyuan Yang, Lvmin Zhang, et al.

Yujun Lin, Zhekai Zhang, Song Han

扩散模型

多模态

Zixin Yin, Xili Dai, Duomin Wang, et al.

监督式微调

检索增强生成

Iman Barati, Mostafa Amiri, Heshaam Faili

多模态

推理

Pranav Pawar, Kavish Shah, Akshat Bhalani, et al.

3D 模型

数据集

Weipeng Zhong, Peizhou Cao, Yichen Jin, et al.

强化学习

Agent

Zhengxi Lu, Jiabo Ye, Fei Tang, et al.

数据集

视频理解

Yang Zhou, Yifan Wang, Jianjun Zhou, et al.

LLM

Transformer

Yiqun Shen, Song Yuan, Zhengze Zhang, et al.

建模

视频理解

Klemen Kotar, Wanhee Lee, Rahul Venkatesh, et al.

语音生成

统一多模态

Jun Zhan, Mingyang Han, Yuxuan Xie, et al.

检索增强生成

LLM

Duolin Sun, Dan Yang, Yue Shen, et al.

扩散模型

图像生成

Tao Han, Wanghan Xu, Junchao Gong, et al.

3D 生成

语义分割

Xinhao Yan, Jiachen Xu, Yang Li, et al.

擦除它！通过机器遗忘在代码语言模型中消除敏感记忆

代码生成

LLM

Zhaoyang Chu, Yao Wan, Zhikun Zhang, et al.

全景图：具身AI时代全向视觉的崛起

计算机视觉

图像理解

Xu Zheng, Chenfei Liao, Ziqiao Weng, et al.

LLM

语言

Hasan Abed Al Kader Hammoud, Mohammad Zbeeb, Bernard Ghanem

强化学习

LLM

Daya Guo, Dejian Yang, Haowei Zhang, et al.

LLM

监督式微调

Pulkit Verma, Ngoc La, Anthony Favier, et al.

统一多模态

多任务学习

Zihao Wang, Muyao Li, Kaichen He, et al.

LLM

Agent

Deepro Choudhury, Sinead Williamson, Adam Goliński, et al.

Agent

推理

Xixi Wu, Kuan Li, Yida Zhao, et al.

Agent

推理

Zile Qiao, Guoxin Chen, Xuanzhong Chen, et al.

Agent

LLM

Runnan Fang, Shihao Cai, Baixuan Li, et al.

Agent

强化学习

Kuan Li, Zhongwang Zhang, Huifeng Yin, et al.

Agent

LLM

Liangcai Su, Zhen Zhang, Guangyu Li, et al.

检索增强生成

Agent

Zijian Li, Xin Guan, Bo Zhang, et al.

LLM

Transformer

Yuxi Li, Yi Liu, Gelei Deng, et al.

检索增强生成

LLM

Xiaoqiang Lin, Aritra Ghosh, Bryan Kian Hsiang Low, et al.

统一多模态

多任务学习

Yang Zhang, Chenwei Wang, Ouyang Lu, et al.

LLM

数据集

Gayathri Saranathan, Cong Xu, Mahammad Parwez Alam, et al.

视频生成

Transformer

Shengqu Cai, Ceyuan Yang, Lvmin Zhang, et al.

Yujun Lin, Zhekai Zhang, Song Han

扩散模型

多模态

Zixin Yin, Xili Dai, Duomin Wang, et al.

监督式微调

检索增强生成

Iman Barati, Mostafa Amiri, Heshaam Faili

多模态

推理

Pranav Pawar, Kavish Shah, Akshat Bhalani, et al.

3D 模型

数据集

Weipeng Zhong, Peizhou Cao, Yichen Jin, et al.

强化学习

Agent

Zhengxi Lu, Jiabo Ye, Fei Tang, et al.

数据集

视频理解

Yang Zhou, Yifan Wang, Jianjun Zhou, et al.

LLM

Transformer

Yiqun Shen, Song Yuan, Zhengze Zhang, et al.

建模

视频理解

Klemen Kotar, Wanhee Lee, Rahul Venkatesh, et al.

语音生成

统一多模态

Jun Zhan, Mingyang Han, Yuxuan Xie, et al.

检索增强生成

LLM

Duolin Sun, Dan Yang, Yue Shen, et al.

扩散模型

图像生成

Tao Han, Wanghan Xu, Junchao Gong, et al.

3D 生成

语义分割

Xinhao Yan, Jiachen Xu, Yang Li, et al.

Hala技术报告：大规模构建以阿拉伯语为中心的指令与翻译模型

DeepSeek-R1 通过强化学习激励 LLMs 进行推理

教LLM进行规划：用于符号规划的逻辑思维链指令微调

OpenHA：一系列开源的Minecraft层级化Agent模型

BED-LLM：基于LLM与贝叶斯实验设计的智能信息收集

ReSum：通过上下文摘要解锁长时程搜索智能

WebResearcher：在长时程Agent中释放无边界推理能力

通过环境扩展迈向通用Agent智能

WebSailor-V2：通过合成数据与可扩展强化学习弥合专有Agent的鸿沟

通过持续预训练扩展Agent

WebWeaver：通过动态大纲构建网络规模证据以支持开放式深度研究

大型语言模型中的Glitch Tokens：分类体系与有效检测

REFRAG：重新思考基于RAG的解码

对齐后引导：通过统一潜在引导适应视觉-语言-动作模型

SubLIME：基于秩相关性预测的子集选择用于数据高效的LLM评估

上下文混合用于长视频生成

MusicSwarm：用于音乐创作的生物启发式智能

LEGO：张量应用的时空加速器生成与优化

LazyDrag：通过显式对应关系实现多模态扩散Transformer上的稳定拖拽编辑

SearchInstruct：通过基于检索的指令数据集构建增强领域自适应

可解释的物理推理与视觉-语言模型的性能分类体系

InternScenes：一个大规模可模拟室内场景数据集，具备真实布局

UI-S1：通过半在线强化学习推进GUI自动化

OmniWorld：用于4D世界建模的多领域多模态数据集

LAVa：基于层级的KV缓存淘汰与动态预算分配

基于概率结构融合的世界建模

VStyle：一个基于口语指令的语音风格适配基准

HANRAG：启发式高精度抗噪声多跳问答增强生成

InfGen：一种与分辨率无关的可扩展图像合成范式

X-Part：高保真且结构一致的形状分解

Hala技术报告：大规模构建以阿拉伯语为中心的指令与翻译模型

DeepSeek-R1 通过强化学习激励 LLMs 进行推理

教LLM进行规划：用于符号规划的逻辑思维链指令微调

OpenHA：一系列开源的Minecraft层级化Agent模型

BED-LLM：基于LLM与贝叶斯实验设计的智能信息收集

ReSum：通过上下文摘要解锁长时程搜索智能

WebResearcher：在长时程Agent中释放无边界推理能力

通过环境扩展迈向通用Agent智能

WebSailor-V2：通过合成数据与可扩展强化学习弥合专有Agent的鸿沟

通过持续预训练扩展Agent

WebWeaver：通过动态大纲构建网络规模证据以支持开放式深度研究

大型语言模型中的Glitch Tokens：分类体系与有效检测

REFRAG：重新思考基于RAG的解码

对齐后引导：通过统一潜在引导适应视觉-语言-动作模型

SubLIME：基于秩相关性预测的子集选择用于数据高效的LLM评估

上下文混合用于长视频生成

MusicSwarm：用于音乐创作的生物启发式智能

LEGO：张量应用的时空加速器生成与优化

LazyDrag：通过显式对应关系实现多模态扩散Transformer上的稳定拖拽编辑

SearchInstruct：通过基于检索的指令数据集构建增强领域自适应

可解释的物理推理与视觉-语言模型的性能分类体系

InternScenes：一个大规模可模拟室内场景数据集，具备真实布局

UI-S1：通过半在线强化学习推进GUI自动化

OmniWorld：用于4D世界建模的多领域多模态数据集

LAVa：基于层级的KV缓存淘汰与动态预算分配

基于概率结构融合的世界建模

VStyle：一个基于口语指令的语音风格适配基准

HANRAG：启发式高精度抗噪声多跳问答增强生成

InfGen：一种与分辨率无关的可扩展图像合成范式

X-Part：高保真且结构一致的形状分解

Command Palette

论文

Command Palette

论文

Command Palette

论文