Command Palette
Search for a command to run...
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

BTL-UI:用于GUI Agent的Blink-Think-Link推理模型

Lynx:迈向高保真个性化视频生成































BTL-UI:用于GUI Agent的Blink-Think-Link推理模型

Lynx:迈向高保真个性化视频生成






























SPATIALGEN:布局引导的3D室内场景生成
BaseReward:多模态Reward Model的强大基线
潜在分区网络:生成建模、表示学习与分类的统一原理
MANZANO:一种具有混合视觉Tokenize的简单且可扩展的统一多模态模型
Oyster-I:超越拒绝——负责任语言模型的建设性安全对齐
计算即教师:将推理计算转化为无参考监督
RPG:用于统一且可扩展代码库生成的仓库规划图
合成自举预训练
基于再分析数据训练的机器学习天气模型实现精准的全球季节预测
FinSearchComp:迈向现实的、专家级别的金融搜索与推理评估
生成之前先理解:自引导训练用于自回归图像生成
无标签的演化语言模型:多数驱动选择,新颖促进变异
边界推理:通过推理时反思提升规范对齐
FlowRL:为LLM推理匹配奖励分布
ScaleCUA:基于跨平台数据的开源计算机使用Agent扩展
大型预训练视觉语言模型能否有效担任施工安全检查员?
HTSC-2025:面向AI驱动临界温度预测的常压高温超导体基准数据集
不稳定性奇点的发现
VCBench:在风险投资中对LLMs进行基准测试
MedReseacher-R1:基于知识引导轨迹合成框架的专家级医学深度研究者
擦除它!通过机器遗忘在代码语言模型中消除敏感记忆
全景图:具身AI时代全向视觉的崛起
Hala技术报告:大规模构建以阿拉伯语为中心的指令与翻译模型
DeepSeek-R1 通过强化学习激励 LLMs 进行推理
教LLM进行规划:用于符号规划的逻辑思维链指令微调
OpenHA:一系列开源的Minecraft层级化Agent模型
BED-LLM:基于LLM与贝叶斯实验设计的智能信息收集
ReSum:通过上下文摘要解锁长时程搜索智能
WebResearcher:在长时程Agent中释放无边界推理能力
通过环境扩展迈向通用Agent智能
SPATIALGEN:布局引导的3D室内场景生成
BaseReward:多模态Reward Model的强大基线
潜在分区网络:生成建模、表示学习与分类的统一原理
MANZANO:一种具有混合视觉Tokenize的简单且可扩展的统一多模态模型
Oyster-I:超越拒绝——负责任语言模型的建设性安全对齐
计算即教师:将推理计算转化为无参考监督
RPG:用于统一且可扩展代码库生成的仓库规划图
合成自举预训练
基于再分析数据训练的机器学习天气模型实现精准的全球季节预测
FinSearchComp:迈向现实的、专家级别的金融搜索与推理评估
生成之前先理解:自引导训练用于自回归图像生成
无标签的演化语言模型:多数驱动选择,新颖促进变异
边界推理:通过推理时反思提升规范对齐
FlowRL:为LLM推理匹配奖励分布
ScaleCUA:基于跨平台数据的开源计算机使用Agent扩展
大型预训练视觉语言模型能否有效担任施工安全检查员?
HTSC-2025:面向AI驱动临界温度预测的常压高温超导体基准数据集
不稳定性奇点的发现
VCBench:在风险投资中对LLMs进行基准测试
MedReseacher-R1:基于知识引导轨迹合成框架的专家级医学深度研究者
擦除它!通过机器遗忘在代码语言模型中消除敏感记忆
全景图:具身AI时代全向视觉的崛起
Hala技术报告:大规模构建以阿拉伯语为中心的指令与翻译模型
DeepSeek-R1 通过强化学习激励 LLMs 进行推理
教LLM进行规划:用于符号规划的逻辑思维链指令微调
OpenHA:一系列开源的Minecraft层级化Agent模型
BED-LLM:基于LLM与贝叶斯实验设计的智能信息收集
ReSum:通过上下文摘要解锁长时程搜索智能
WebResearcher:在长时程Agent中释放无边界推理能力
通过环境扩展迈向通用Agent智能