《Bottom-Up Abstractive Summarization》笔记

基于神经网络的抽象摘要方法产生的输出比其他技术更流畅，但在内容选择方面表现不佳。这项工作提出了一种解决这个问题的简单技术:使用数据高效的内容选择器在源文档中多个角度确定短语，这些短语应该是摘要的一部分。我们使用这个选择器作为自底向上的注意力机制，将模型约束为可能的短语。我们的实验表明，这种方法提高了压缩文本的能力，同时仍然能够生成流畅的摘要。这两个步骤的过程比其他端到端内容选择模型更加简单、且更高性能，在CNN-DM和NYT语料库在ROUGE指标上有显著的改进。此外，内容选择器只需训练1000个句子，就可以轻松地将训练好的摘要器转换到新的领域。

Bottom-Up Abstractive Summarization给出两阶段任务，第一阶段先做序列标注，找出和Summarization相关单词；第二阶段，使用相关的词汇做Summarization.

论文地址：https://arxiv.org/pdf/1808.10792.pdf
git地址：https://github.com/sebastianGehrmann/bottom-up-summary.git

参考：
https://zhuanlan.zhihu.com/p/85363175
https://zhuanlan.zhihu.com/p/126481252