
摘要
正态流通过一个可逆神经网络将潜在分布转换为一种灵活且简洁的生成建模方法,同时保留了精确的似然性。我们提出了FlowGMM,这是一种基于正态流的端到端生成半监督学习方法,使用了一个潜在高斯混合模型。FlowGMM 的独特之处在于其简洁性、对有标签和无标签数据的统一处理以及精确的似然性、可解释性和广泛的应用范围,不仅限于图像数据。我们在多种应用中展示了 FlowGMM 的良好效果,包括 AG-News 和 Yahoo Answers 文本数据、表格数据以及半监督图像分类。此外,我们还展示了 FlowGMM 可以发现可解释的结构、提供无需优化的实时特征可视化,并指定具有良好校准的预测分布。
代码仓库
sadrasafa/FlowGMM-Julia
pytorch
GitHub 中提及
izmailovpavel/flowgmm
官方
pytorch
基准测试
| 基准 | 方法 | 指标 |
|---|---|---|
| semi-supervised-text-classification-on-ag-1 | FlowGMM | Accuracy (%): 82.1 |
| semi-supervised-text-classification-on-ag-1 | 3 Layer MLP | Accuracy (%): 77.5 |
| semi-supervised-text-classification-on-ag-1 | Pi Model | Accuracy (%): 80.2 |
| semi-supervised-text-classification-on-yahoo | FlowGMM | Accuracy (%): 57.9 |
| semi-supervised-text-classification-on-yahoo | Pi Model | Accuracy (%): 56.3 |
| semi-supervised-text-classification-on-yahoo | 3 Layer MLP | Accuracy (%): 55.7 |