Command Palette
Search for a command to run...
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

扩散模板:一种用于可控扩散的统一插件框架

RADIO-ViPE:动态环境中开放词汇语义SLAM的在线紧耦合多模态融合































扩散模板:一种用于可控扩散的统一插件框架

RADIO-ViPE:动态环境中开放词汇语义SLAM的在线紧耦合多模态融合






























ClawGym:构建高效Claw代理的可扩展框架
扭转局势:扩散大型语言模型的跨架构知识蒸馏
大语言模型通过潜在蒸馏进行探索
GLM-5V-Turbo:迈向面向多模态 agents 的原生基础模型
SWE-chat:来自真实用户在自然环境下编码智能体交互的研究
AdaExplore:面向高效内核生成的失败驱动自适应与多样性保持搜索
通过再生进行优化:扩展修改空间可提升统一多模态模型中的图像优化效果
AutoResearchBench: 在复杂科学文献发现中评估AI代理的基准测试
Meta-CoT:增强图像编辑的粒度与泛化能力
DV-World:在真实世界场景中基准测试数据可视化智能体
使用数据进行编程:来自原始语料的自我改进大型语言模型的测试驱动数据工程
递归多智能体系统
面向智能体 AI 的技能检索增强
SketchVLM:视觉语言模型能够对图像进行注释以解释思维过程并引导用户
RSRCC:通过检索增强最佳-N排序构建的遥感区域变化理解基准
LongSpeech:一个用于长语音转录、翻译与理解的可扩展基准
ClawMark:面向多轮、多日、多模态协作智能体的真实世界基准测试
Tuna-2:像素嵌入在多模态理解与生成中优于视觉编码器
视觉-语言-动作安全:威胁、挑战、评估与机制
ReVSI: 重建视觉空间智能评估,以实现对VLM 3D推理的准确评估
从技能到人才:组织异质代理作为真实世界的公司
World-R1: 强化三维约束以实现文生视频生成
基于语义进展函数的视频分析与生成
SmartPhotoCrafter:面向自动摄影图像编辑的统一推理、生成与优化框架
上下文永远不够长:针对大规模长文档集的结构化推理可扩展问答研究
AgentSearchBench:一种针对野外场景下 AI agent 搜索能力的基准测试
FlowAnchor:通过稳定编辑信号实现无反转视频编辑
从内部视角审视 LLM 安全性:利用内部表示检测有害内容
DiffNR:用于稀疏视图 3D 断层扫描重建的扩散增强神经表示优化
Agentic 世界建模:基础、能力、定律及其延伸
ClawGym:构建高效Claw代理的可扩展框架
扭转局势:扩散大型语言模型的跨架构知识蒸馏
大语言模型通过潜在蒸馏进行探索
GLM-5V-Turbo:迈向面向多模态 agents 的原生基础模型
SWE-chat:来自真实用户在自然环境下编码智能体交互的研究
AdaExplore:面向高效内核生成的失败驱动自适应与多样性保持搜索
通过再生进行优化:扩展修改空间可提升统一多模态模型中的图像优化效果
AutoResearchBench: 在复杂科学文献发现中评估AI代理的基准测试
Meta-CoT:增强图像编辑的粒度与泛化能力
DV-World:在真实世界场景中基准测试数据可视化智能体
使用数据进行编程:来自原始语料的自我改进大型语言模型的测试驱动数据工程
递归多智能体系统
面向智能体 AI 的技能检索增强
SketchVLM:视觉语言模型能够对图像进行注释以解释思维过程并引导用户
RSRCC:通过检索增强最佳-N排序构建的遥感区域变化理解基准
LongSpeech:一个用于长语音转录、翻译与理解的可扩展基准
ClawMark:面向多轮、多日、多模态协作智能体的真实世界基准测试
Tuna-2:像素嵌入在多模态理解与生成中优于视觉编码器
视觉-语言-动作安全:威胁、挑战、评估与机制
ReVSI: 重建视觉空间智能评估,以实现对VLM 3D推理的准确评估
从技能到人才:组织异质代理作为真实世界的公司
World-R1: 强化三维约束以实现文生视频生成
基于语义进展函数的视频分析与生成
SmartPhotoCrafter:面向自动摄影图像编辑的统一推理、生成与优化框架
上下文永远不够长:针对大规模长文档集的结构化推理可扩展问答研究
AgentSearchBench:一种针对野外场景下 AI agent 搜索能力的基准测试
FlowAnchor:通过稳定编辑信号实现无反转视频编辑
从内部视角审视 LLM 安全性:利用内部表示检测有害内容
DiffNR:用于稀疏视图 3D 断层扫描重建的扩散增强神经表示优化
Agentic 世界建模:基础、能力、定律及其延伸