atitit 知识压缩的总结学习方法总结v2 t55.docx 目录 1.1. 压缩目的 1 1.2. 压缩分类无损压缩有损压缩 1 2. 功能指标 2 2.1. 压缩比：有损压缩一般1

PS：VBR是variablebitrate的缩写，意思是可变比率，就是MP3文件压制的时候声音元素较多，比率较高时，将自动减低压缩比特率，在比特率需求比较低时自动升高比特率，这样做的目的是在保证音质基本不被损害的情况下增加文件在线播放时的速度，和减少在本机播放时所占的系统资源……这是Xing发展的算法，他们将一首歌的复杂部分用高Bitrate编码，简单部分用低Bitrate编码。主意虽然不错，可惜Xing编码器的VBR算法很差，音质与CBR相去甚远。幸运的是，Lame完美地优化了VBR算法，使之成为MP3的最佳编码模式。这是以质量为前提兼顾文件大小的方式，推荐编码模式。

压缩的还原
1. 填充

主流的文本摘要方式抽取式（extractive），另一种是生成式（abstractive）。
1. 抽取式（extractive）简单
2. 生成式（abstractive）意思的基础上重新生成概要。

目前主流的文本摘要自动生成有两种方式，一种是抽取式（extractive），另一种是生成式（abstractive）。

抽取式顾名思义，就是按照一定权重，从原文中寻找跟中心思想最接近的一条或几条句子。而生成式是计算机通读原文，在理解整篇文章意思的基础上，重新生成概要。

抽取式摘要目前已经相对成熟，但抽取质量及内容流畅度均差强人意。伴随着深度学习的研究，生成式摘要对质量和流畅度都有很大的提升，但目前也涉及到原文本长度过长、抽取内容不佳等问题的限制。

文本摘要的发展概况

抽取式摘要是一种比较成熟的方案，其中Text rank排序算法以其简洁、高效的特点被工业界广泛运用。大体思想就是先去除文章中的一些停用词，之后对句子的相似度进行度量，计算每一句相对另一句的相似度得分，迭代传播，直到误差小于0.0001，再对上述方法得到的关键语句进行排序，即可获得摘要。抽取式摘要主要考虑单词词频，并没有过多的语义信息，像“猪八戒”、“孙悟空”这样的词汇都会被独立对待，无法建立文本段落中完整的语义信息。

入门_ 文本摘要自动生成技术的前世今生 - 简书.html

atitit 知识压缩的总结 学习方法总结v2 t55.docx 目录 1.1. 压缩目的 1 1.2. 压缩分类 无损压缩 有损压缩 1 2. 功能指标 2 2.1. 压缩比：有损压缩一般1

atitit 知识压缩的总结学习方法总结v2 t55.docx 目录 1.1. 压缩目的 1 1.2. 压缩分类无损压缩有损压缩 1 2. 功能指标 2 2.1. 压缩比：有损压缩一般1