
摘要
书封传达了潜在读者所需的信息,但这些信息是否也能被计算机所学习?我们提出使用深度卷积神经网络(CNN)根据书封提供的视觉线索来预测书籍的类型。本研究的目的是探讨书籍与其封面之间的关系是否可以被机器学习。然而,确定一本书的类型是一项艰巨的任务,因为封面可能具有模糊性,而类型则可能是广泛的。尽管如此,我们的研究表明,卷积神经网络能够提取特征并学习设计者为定义某一类型而设定的基本设计规则。通过运用机器学习技术,我们可以将大量可用资源引入到书封设计过程中。此外,我们还介绍了一个新的具有挑战性的数据集,该数据集可用于多种模式识别任务。
代码仓库
akshaybhatia10/Book-Genre-Classification
tf
GitHub 中提及
uchidalab/book-dataset
官方
GitHub 中提及
SeaOfFrost/BookCoverClassifier
pytorch
GitHub 中提及
adamjeanlaurent/Book-Recommender
GitHub 中提及
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| genre-classification-on-book-cover-dataset | LeNet | Top 1 Accuracy: 13.5% |
| genre-classification-on-book-cover-dataset | AlexNet | Top 1 Accuracy: 24.7% |