HyperAI超神经

HyperAI

机器学习术语表:探索关键AI和ML概念的定义与解释

Faster R-CNN

通过共享卷积特征将 RPN 和 Fast R-CNN 合并为一个网络，用于目标检测。

3 个月前

建设性安全对齐 CSA

CSA 旨在构建不仅安全，而且真正有帮助的系统。

3 个月前

计算即教师 Compute As Teacher

CaT 可以在测试时用于推理时提升，或在内置于 RL（CaT-RL）中以提高策略。

4 个月前

模型上下文协议 MCP

MCP 用于连接 AI 助手到存储数据的地方，包括内容库、业务工具和开发环境。

5 个月前

MetaFold

MetaFold 能够处理多种衣物和广泛的语言指令，高效完成各种衣物折叠任务。

5 个月前

ST-Raptor 基于树形框架的智能表格问答系统

ST-Raptor 在答案准确率上比九个基线模型高出最多 20% 。

5 个月前

SubLlME 基于排名相关性预测的数据高效评估子集选择方法

SubLlME 旨在通过排名相关性预测，在无需全量评测的情况下，实现高效、准确的模型性能评估。

5 个月前

仿生空间导航认知 BSC-Nav

BSC-Nav 从自中心轨迹和上下文线索构建 allocentric 认知地图，并动态检索与语义目标一致的空间知识。

5 个月前

深度聚类方法 Deep Clustering

初步实验表明，DPCL 能够分离语音并且取得较为理想的效果。

5 个月前

双模退火 Bi-mode Annealing

双模退火的目标是开发一个能够掌握思考模式和非思考模式两种不同响应模式的模型。

5 个月前

双模策略优化 BPO

BPO 的核心原理是通过明确对比相同输入查询下思考与非思考路径的效用来学习自适应策略。

5 个月前

基于 LLM 的贝叶斯实验设计 BED-LLM

BED-LLM 有效地将序贯贝叶斯实验设计（BED）框架应用于与 LLMs 的交互信息收集问题。

5 个月前

REFRAG 解码框架

与 LLaMA 模型和其他最先进基线模型相比，REFRAG 在准确性没有损失的情况下实现了显著加速。

5 个月前

对齐 – 引导 – 泛化 ATE

作为一种通用且轻量级的解决方案，ATE 增强了将 VLA 模型部署到新的机器人平台和任务中的实用性。

5 个月前

上下文混合 Mixture of Contexts

MoC 为下一代可扩展、可控的长期视频生成模型提供了新的蓝图。

5 个月前

在游戏中思考框架 Think-In-Games

TiG 框架够使 LLM 通过直接与游戏环境交互来发展程序性理解，同时保留其固有的推理和解释能力。

5 个月前

具身式开放词汇物体导航 LOVON

LOVON 旨在将大语言模型用于分层任务规划，并结合开放词汇视觉检测模型。

6 个月前

基于 MeanFlow 的一步策略学习框架 MP1

MP1 能够在一次网络函数评估内直接生成动作轨迹。

6 个月前

多维度预训练数据筛选框架 Meta-rater

Meta-rater 旨在通过学习最优权重，将专业性、可读性、推理性、干净程度四个维度与现有质量指标整合。

6 个月前

简约而强大的自适应余弦投影 MaCP

MaCP 旨在通过最小的参数和内存开销，在大型基础模型的微调中实现出色的性能。

6 个月前

上下文工程 Context Engineering

上下文工程标志着 LLM 实践从「prompt 工程」走向系统「上下文工程」的范式升级。

6 个月前

模仿学习 Imitation Learning

模仿学习通过学习专家示范行为来获得策略

6 个月前

基于第一性原理的 LLM 全新训练范式 POET

POET 是一种新颖的重参数化训练算法

6 个月前

原生稀疏注意力 Native Sparse Attention

NSA 结合算法创新与硬件优化，实现了高效的长上下文建模。

6 个月前

Command Palette

百科

Command Palette

百科

Faster R-CNN

建设性安全对齐 CSA

计算即教师 Compute As Teacher

模型上下文协议 MCP

MetaFold

ST-Raptor 基于树形框架的智能表格问答系统

SubLlME 基于排名相关性预测的数据高效评估子集选择方法

仿生空间导航认知 BSC-Nav

深度聚类方法 Deep Clustering

双模退火 Bi-mode Annealing

双模策略优化 BPO

基于 LLM 的贝叶斯实验设计 BED-LLM

REFRAG 解码框架

对齐 – 引导 – 泛化 ATE

上下文混合 Mixture of Contexts

在游戏中思考框架 Think-In-Games

具身式开放词汇物体导航 LOVON

基于 MeanFlow 的一步策略学习框架 MP1

多维度预训练数据筛选框架 Meta-rater

简约而强大的自适应余弦投影 MaCP

上下文工程 Context Engineering

模仿学习 Imitation Learning

基于第一性原理的 LLM 全新训练范式 POET

原生稀疏注意力 Native Sparse Attention

Command Palette

百科

Faster R-CNN

建设性安全对齐 CSA

计算即教师 Compute As Teacher

模型上下文协议 MCP

MetaFold

ST-Raptor 基于树形框架的智能表格问答系统

SubLlME 基于排名相关性预测的数据高效评估子集选择方法

仿生空间导航认知 BSC-Nav

深度聚类方法 Deep Clustering

双模退火 Bi-mode Annealing

双模策略优化 BPO

基于 LLM 的贝叶斯实验设计 BED-LLM

REFRAG 解码框架

对齐 – 引导 – 泛化 ATE

上下文混合 Mixture of Contexts

在游戏中思考框架 Think-In-Games

具身式开放词汇物体导航 LOVON

基于 MeanFlow 的一步策略学习框架 MP1

多维度预训练数据筛选框架 Meta-rater

简约而强大的自适应余弦投影 MaCP

上下文工程 Context Engineering

模仿学习 Imitation Learning

基于第一性原理的 LLM 全新训练范式 POET

原生稀疏注意力 Native Sparse Attention

Faster R-CNN

建设性安全对齐 CSA

计算即教师 Compute As Teacher

模型上下文协议 MCP

MetaFold

ST-Raptor 基于树形框架的智能表格问答系统

SubLlME 基于排名相关性预测的数据高效评估子集选择方法

仿生空间导航认知 BSC-Nav

深度聚类方法 Deep Clustering

双模退火 Bi-mode Annealing

双模策略优化 BPO

基于 LLM 的贝叶斯实验设计 BED-LLM

REFRAG 解码框架

对齐 – 引导 – 泛化 ATE

上下文混合 Mixture of Contexts

在游戏中思考框架 Think-In-Games

具身式开放词汇物体导航 LOVON

基于 MeanFlow 的一步策略学习框架 MP1

多维度预训练数据筛选框架 Meta-rater

简约而强大的自适应余弦投影 MaCP

上下文工程 Context Engineering

模仿学习 Imitation Learning

基于第一性原理的 LLM 全新训练范式 POET

原生稀疏注意力 Native Sparse Attention

Faster R-CNN

建设性安全对齐 CSA