Command Palette
Search for a command to run...
百科
机器学习术语表:探索关键AI和ML概念的定义与解释
Search for a command to run...
机器学习术语表:探索关键AI和ML概念的定义与解释
ReinFlow 具有轻量级实现、内置探索功能,并能广泛适用于各种流策略变体。
FHE 广泛应用于云计算安全、联邦学习、医疗数据分析、金融数据协作等场景。
BRFL 意在解决模型聚合过程中出现的拜占庭攻击问题。
EGMN 成功捕捉了用户偏好和视频特征之间的潜在交互效应。
SAC Flow 在连续控制和机器人操作基准测试中达到最先进性能。
UserBench 旨在评估和促进智能体理解、交互和适应现实世界用户沟通的能力。
PLACER 具有快速和随机的特性,可以轻易生成预测集合来映射构象异质性。
RAE 凭借明显优势有望成为扩散 Transformer 训练的新默认选择。
基于 GRPO 等微调技术现有局限性,GVPO 作为一种可靠、多功能的后训练范式应运而生。
ReCA 在应用场景和系统规模上具有泛化能力,成功任务率提升了 4.3% 。
DexFlyWheel 是一个用于灵巧操作的、可扩展且自我改进的数据生成范式。
NovaFlow 能够在不同的机器人形态中处理刚性、铰接和可变形物体。
TreeSynth 在大规模数据合成方面展现出卓越鲁棒性和可扩展性。
GTA 在多个文本分类基准测试中均显著优于标准 SFT 基线和最先进的 RL 方法。
ACE 通过动态优化输入上下文使智能体能够自我改进。
Vibe-coding 的兴起,不仅改变了编程的形态,也重塑了软件开发的生态。
类比 LLM 领域的思维链概念,CoF 适用于当今的生成视频模型。
在三个对齐能力上的实验表明 TAE 的有效性,特别是真实性以极低成本超越基线 25.8% 。
彩票假说的出现,催生了一系列高效训练神经网络的方法。
TileLang 通过统一的块和线程范式以及透明的调度能力,能够满足现代 AI 系统开发所要求的强大功能和灵活性。
通过共享卷积特征将 RPN 和 Fast R-CNN 合并为一个网络,用于目标检测。
CSA 旨在构建不仅安全,而且真正有帮助的系统。
CaT 可以在测试时用于推理时提升,或在内置于 RL(CaT-RL)中以提高策略。
MCP 用于连接 AI 助手到存储数据的地方,包括内容库、业务工具和开发环境。
ReinFlow 具有轻量级实现、内置探索功能,并能广泛适用于各种流策略变体。
FHE 广泛应用于云计算安全、联邦学习、医疗数据分析、金融数据协作等场景。
BRFL 意在解决模型聚合过程中出现的拜占庭攻击问题。
EGMN 成功捕捉了用户偏好和视频特征之间的潜在交互效应。
SAC Flow 在连续控制和机器人操作基准测试中达到最先进性能。
UserBench 旨在评估和促进智能体理解、交互和适应现实世界用户沟通的能力。
PLACER 具有快速和随机的特性,可以轻易生成预测集合来映射构象异质性。
RAE 凭借明显优势有望成为扩散 Transformer 训练的新默认选择。
基于 GRPO 等微调技术现有局限性,GVPO 作为一种可靠、多功能的后训练范式应运而生。
ReCA 在应用场景和系统规模上具有泛化能力,成功任务率提升了 4.3% 。
DexFlyWheel 是一个用于灵巧操作的、可扩展且自我改进的数据生成范式。
NovaFlow 能够在不同的机器人形态中处理刚性、铰接和可变形物体。
TreeSynth 在大规模数据合成方面展现出卓越鲁棒性和可扩展性。
GTA 在多个文本分类基准测试中均显著优于标准 SFT 基线和最先进的 RL 方法。
ACE 通过动态优化输入上下文使智能体能够自我改进。
Vibe-coding 的兴起,不仅改变了编程的形态,也重塑了软件开发的生态。
类比 LLM 领域的思维链概念,CoF 适用于当今的生成视频模型。
在三个对齐能力上的实验表明 TAE 的有效性,特别是真实性以极低成本超越基线 25.8% 。
彩票假说的出现,催生了一系列高效训练神经网络的方法。
TileLang 通过统一的块和线程范式以及透明的调度能力,能够满足现代 AI 系统开发所要求的强大功能和灵活性。
通过共享卷积特征将 RPN 和 Fast R-CNN 合并为一个网络,用于目标检测。
CSA 旨在构建不仅安全,而且真正有帮助的系统。
CaT 可以在测试时用于推理时提升,或在内置于 RL(CaT-RL)中以提高策略。
MCP 用于连接 AI 助手到存储数据的地方,包括内容库、业务工具和开发环境。