6 个月前

多模态表征

Hongyan Wu Peijian Zeng Weixiong Zheng Lianxi Wang Nankai Lin Shengyi Jiang Aimin Yang

摘要

跨模态文本-分子检索任务旨在连接分子结构与自然语言描述。现有方法主要关注文本模态与分子模态之间的对齐，却忽视了在不同训练阶段自适应调整学习状态以及提升训练效率的问题。为应对这些挑战，本文提出一种基于课程学习的跨模态文本-分子训练框架（Curriculum Learning-based Cross-modal text-molecule training framework, CLASS），该框架可与任意主干网络（backbone）集成，显著提升性能表现。具体而言，我们综合考虑文本模态与分子模态，量化样本难度，并设计样本调度器，按照由易到难的策略逐步引入训练样本，显著减少了训练初期的样本规模，从而有效提升训练效率。此外，我们引入自适应强度学习机制，随着训练进程动态增强训练强度，实现对各课程阶段学习强度的自适应调控。在ChEBI-20数据集上的实验结果表明，所提方法不仅取得了更优的性能表现，同时实现了显著的时间节省。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

多模态表征

Hongyan Wu Peijian Zeng Weixiong Zheng Lianxi Wang Nankai Lin Shengyi Jiang Aimin Yang

摘要

跨模态文本-分子检索任务旨在连接分子结构与自然语言描述。现有方法主要关注文本模态与分子模态之间的对齐，却忽视了在不同训练阶段自适应调整学习状态以及提升训练效率的问题。为应对这些挑战，本文提出一种基于课程学习的跨模态文本-分子训练框架（Curriculum Learning-based Cross-modal text-molecule training framework, CLASS），该框架可与任意主干网络（backbone）集成，显著提升性能表现。具体而言，我们综合考虑文本模态与分子模态，量化样本难度，并设计样本调度器，按照由易到难的策略逐步引入训练样本，显著减少了训练初期的样本规模，从而有效提升训练效率。此外，我们引入自适应强度学习机制，随着训练进程动态增强训练强度，实现对各课程阶段学习强度的自适应调控。在ChEBI-20数据集上的实验结果表明，所提方法不仅取得了更优的性能表现，同时实现了显著的时间节省。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供