《Bottom-Up Abstractive Summarization》笔记

基于神经网络的抽象摘要方法产生的输出比其他技术更流畅,但在内容选择方面表现不佳。这项工作提出了一种解决这个问题的简单技术:使用数据高效的内容选择器在源文档中多个角度确定短语,这些短语应该是摘要的一部分。我们使用这个选择器作为自底向上的注意力机制,将模型约束为可能的短语。我们的实验表明,这种方法提高了压缩文本的能力,同时仍然能够生成流畅的摘要。这两个步骤的过程比其他端到端内容选择模型更加简单、且更高性能,在CNN-DM和NYT语料库在ROUGE指标上有显著的改进。此外,内容选择器只需训练1000个句子,就可以轻松地将训练好的摘要器转换到新的领域。

Bottom-Up Abstractive Summarization给出两阶段任务,第一阶段先做序列标注,找出和Summarization相关单词;第二阶段,使用相关的词汇做Summarization.

论文地址:https://arxiv.org/pdf/1808.10792.pdf
git地址:https://github.com/sebastianGehrmann/bottom-up-summary.git

参考:
https://zhuanlan.zhihu.com/p/85363175
https://zhuanlan.zhihu.com/p/126481252

原文地址:https://www.cnblogs.com/xuehuiping/p/14072642.html