Command Palette
Search for a command to run...
论文
每日更新的前沿人工智能研究论文,帮助您紧跟最新的人工智能趋势

RE-IMAGINE:用于推理评估的符号基准合成

SonicVerse:基于音乐特征的多任务学习字幕生成































RE-IMAGINE:用于推理评估的符号基准合成

SonicVerse:基于音乐特征的多任务学习字幕生成






























并非一切尽失:无需检查点的LLM恢复
日晷:一系列功能强大的时间序列基础模型
ADRD:基于规则决策系统的LLM驱动自主驾驶
改进的迭代精炼方法用于通过结构化指令实现图表到代码的生成
Show-O2:改进的原生统一多模态模型
从跨领域视角重新审视强化学习在大语言模型推理中的应用
Raptor:利用预训练2D基础模型实现可扩展的无训练3D医学体积嵌入
EmoNet-Voice:用于语音情感检测的细粒度、专家验证基准数据集
s1:简单测试时缩放
Search-o1:代理增强型搜索大推理模型
LLaVA-Mini:仅用一个视觉token实现高效图像与视频大型多模态模型
MAmmoTH-VL:通过大规模指令微调激发多模态推理
ShowUI:面向GUI视觉Agent的统一视觉-语言-动作模型
OS-ATLAS:用于通用GUI Agent的基础动作模型
GPT-4o 系统卡
SAM2Long:通过无训练记忆树增强SAM 2的长视频分割能力
Aria:一个开放的多模态原生专家混合模型
Qwen2-VL:在任意分辨率下提升视觉-语言模型对世界的感知能力
VGGT:视觉几何接地 Transformer
通过单步奖励实现多轮代码生成
重新审视大型语言模型的组合泛化能力及其指令遵循能力
具身网络代理:弥合物理-数字领域以实现集成代理智能
语义感知奖励在自由形式生成中的开放式R1训练
BUT系统用于MLC-SLM挑战赛
GenRecal:从大模型到小模型的重新校准生成视觉-语言模型
ProtoReasoning:原型作为LLM中可泛化推理的基础
Sekai:一个面向世界探索的视频数据集
基于数据驱动的二次与天然胶凝前驱体材料筛选
QFFT,无问题微调以适应推理
大语言模型能否生成高质量的算法问题测试用例? TestCase-Eval:故障覆盖率和暴露的系统性评估
并非一切尽失:无需检查点的LLM恢复
日晷:一系列功能强大的时间序列基础模型
ADRD:基于规则决策系统的LLM驱动自主驾驶
改进的迭代精炼方法用于通过结构化指令实现图表到代码的生成
Show-O2:改进的原生统一多模态模型
从跨领域视角重新审视强化学习在大语言模型推理中的应用
Raptor:利用预训练2D基础模型实现可扩展的无训练3D医学体积嵌入
EmoNet-Voice:用于语音情感检测的细粒度、专家验证基准数据集
s1:简单测试时缩放
Search-o1:代理增强型搜索大推理模型
LLaVA-Mini:仅用一个视觉token实现高效图像与视频大型多模态模型
MAmmoTH-VL:通过大规模指令微调激发多模态推理
ShowUI:面向GUI视觉Agent的统一视觉-语言-动作模型
OS-ATLAS:用于通用GUI Agent的基础动作模型
GPT-4o 系统卡
SAM2Long:通过无训练记忆树增强SAM 2的长视频分割能力
Aria:一个开放的多模态原生专家混合模型
Qwen2-VL:在任意分辨率下提升视觉-语言模型对世界的感知能力
VGGT:视觉几何接地 Transformer
通过单步奖励实现多轮代码生成
重新审视大型语言模型的组合泛化能力及其指令遵循能力
具身网络代理:弥合物理-数字领域以实现集成代理智能
语义感知奖励在自由形式生成中的开放式R1训练
BUT系统用于MLC-SLM挑战赛
GenRecal:从大模型到小模型的重新校准生成视觉-语言模型
ProtoReasoning:原型作为LLM中可泛化推理的基础
Sekai:一个面向世界探索的视频数据集
基于数据驱动的二次与天然胶凝前驱体材料筛选
QFFT,无问题微调以适应推理
大语言模型能否生成高质量的算法问题测试用例? TestCase-Eval:故障覆盖率和暴露的系统性评估