3 个月前

基于深度内部-外部递归自编码器的无监督潜在树结构诱导

基于深度内部-外部递归自编码器的无监督潜在树结构诱导

摘要

我们提出了一种完全无监督的深度内外递归自编码器(Deep Inside-Outside Recursive Autoencoder, DIORA),用于同时发现句法结构并学习所生成句法树中各成分的表示。该方法通过条件化地预测输入句子中的每个词(以其余词为上下文)来建模语言结构。在训练过程中,我们采用动态规划算法枚举句子的所有可能二叉树结构;在推理阶段,则使用CKY算法提取得分最高的句法分析结果。在标准WSJ数据集上的实验表明,DIORA在无监督二叉句法分析任务上的表现优于此前报道的各类方法。

基准测试

基准方法指标
constituency-grammar-induction-on-ptbDIORA (+PP)
Max F1 (WSJ): 56.2
Max F1 (WSJ10): 60.55
Mean F1 (WSJ): 55.7
constituency-grammar-induction-on-ptbDIORA
Max F1 (WSJ): 49.6
Max F1 (WSJ10): 68.5
Mean F1 (WSJ): 48.9
Mean F1 (WSJ10): 67.7

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供