3 个月前

壳理论:现实的统计模型

壳理论:现实的统计模型

摘要

机器学习的基础假设是,所考虑的数据可被划分为不同的类别;尽管这一假设在直觉上合理,但将其数学化表述为可分离性约束却极为困难。我们认为,这一难题的根源在于现有统计方法与实际常见数据之间的不匹配:物体的表示通常具有高维度特征,而现有的统计技术往往将高维情形视为一种退化情况。为解决这一问题,我们提出了一种专为高维机器学习设计的统计框架。该框架基于一个核心观察:物体之间的关系天然呈现出层次结构。由此,我们将物体建模为高维、分层生成过程的实例。通过本文所提出的基于距离的统计技术,我们证明,在此类生成过程中,层次结构中每一层级的实例几乎总是被一个独特的“壳层”所包围,而该壳层几乎不包含其他层级的实例。由此发展出的“壳层理论”(Shell Theory),是一种形式化的统计机器学习框架,其中可分离性约束(即“独特壳层”)可从所假设的生成过程出发,严格推导得出。

基准测试

基准方法指标
anomaly-detection-on-assira-cat-vs-dogShell-based Anomaly (supervisered)
ROC AUC: 99.9
anomaly-detection-on-fashion-mnistShell-based Anomaly (supervised)
ROC AUC: 92.1
anomaly-detection-on-stl-10Shell-based Anomaly (supervised)
ROC AUC: 99.2
unsupervised-anomaly-detection-with-specifiedShell-Renormalized
AUC-ROC: 0.999
unsupervised-anomaly-detection-with-specified-1Shell-Renormalized
AUC-ROC: 0.617
unsupervised-anomaly-detection-with-specified-12Shell-Renormalized
AUC-ROC: 0.866
unsupervised-anomaly-detection-with-specified-15Shell-Renormalized
AUC-ROC: 0.829
unsupervised-anomaly-detection-with-specified-16Shell-Renormalized
AUC-ROC: 0.756
unsupervised-anomaly-detection-with-specified-20Shell-Renormalized
AUC-ROC: 0.997
unsupervised-anomaly-detection-with-specified-21Shell-Renormalized
AUC-ROC: 0.895
unsupervised-anomaly-detection-with-specified-24Shell-Renormalized
AUC-ROC: 0.953
unsupervised-anomaly-detection-with-specified-26Shell-Renormalized
AUC-ROC: 0.996
unsupervised-anomaly-detection-with-specified-5Shell-Renormalized
AUC-ROC: 0.999
unsupervised-anomaly-detection-with-specified-6Shell-Renormalized
AUC-ROC: 0.896
unsupervised-anomaly-detection-with-specified-7Shell-Renormalized
AUC-ROC: 0.894
unsupervised-anomaly-detection-with-specified-8Shell-Renormalized
AUC-ROC: 0.803
unsupervised-anomaly-detection-with-specified-9Shell-Renormalized
AUC-ROC: 0.740

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供
壳理论:现实的统计模型 | 论文 | HyperAI超神经