4 个月前

多模态准自回归:预测新时尚产品的视觉受欢迎程度

多模态准自回归:预测新时尚产品的视觉受欢迎程度

摘要

估计消费者的偏好对时尚行业至关重要,因为恰当地利用这些信息可以带来利润上的好处。时尚趋势检测是一项具有挑战性的任务,原因在于时尚行业的变化速度非常快。此外,由于缺乏历史数据,预测新服装设计的视觉受欢迎程度更加困难。为此,我们提出了一种多模态准自回归深度学习架构MuQAR(Multimodal Quasi-AutoRegressive),该架构结合了两个模块:(1) 多模态多层感知器,用于处理产品的类别、视觉和文本特征;(2) 准自回归神经网络,用于建模产品属性的“目标”时间序列以及所有其他属性的“外生”时间序列。我们利用计算机视觉、图像分类和图像描述生成技术,从新产品的图片中自动提取视觉特征和文本描述。在时尚行业中,产品设计最初以视觉形式表达,这些特征代表了产品的独特特性,而不会干扰设计师的创意过程(例如要求额外的手动输入文本)。我们使用产品的目标属性时间序列作为其时间受欢迎模式的代理,从而缓解了历史数据不足的问题;同时,外生时间序列有助于捕捉相关属性之间的趋势。我们在两个大规模图像时尚数据集Mallzee和SHIFT15m上进行了广泛的消融分析,以评估MuQAR的有效性,并使用Amazon Reviews: Home and Kitchen数据集来评估其在其他领域的泛化能力。通过对VISUELLE数据集进行的比较研究显示,在WAPE(加权绝对百分比误差)和MAE(平均绝对误差)指标上,MuQAR分别能够与当前领域的最先进方法竞争并超过4.65%和4.8%。

基准测试

基准方法指标
new-product-sales-forecasting-on-visuelleMuQAR
MAE: 28.75
WAPE: 52.63

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
多模态准自回归:预测新时尚产品的视觉受欢迎程度 | 论文 | HyperAI超神经