分享 MSDN 下载工具(Word/PDF)

给大伙分享一个最近出炉的 MSDN 到 Word/PDF 转换器。我已经用它转换了 WPF、VSPackage、WWF 等 MSDN 章节为 PDF。

  • 介绍
  • 下载
  • 使用要求
  • 使用方法
  • 结语

介绍


现在的 MSDN 已经做得非常好了,章节非常清晰,从入门到精通各个层次都有。我常常会把 MSDN 当作一个系统的学习书籍来看。有时候,特别想把 MSDN 下载下来,转换为 PDF,放到平板电脑上看。

最近急于研究 VS-Package 的使用,所以花了一整个晚上写了这个转换器。

软件功能描述:

用于从 MSDN 网站上下载指定章节下的所有文章,读取内容中的文本及图片等。读取完成后,转换为 Word 文件,并生成相应的目录。(有了 word 文件,Word 2010 就可以把它导出为 pdf 等其它格式了。)

软件截图

MSDNConverter1[1]

下载


下载地址:

online_icon[1]1.5 版下载地址 (支持中文版本的 MSDN 下载)。
online_icon[1]1.4 版下载地址 (修复带版本号的地址直接报错的问题)。
online_icon[1]1.3 版下载地址 。

使用要求


使用本软件,需要安装 .NET4.0 以及 Office 软件。由于我使用的是 office 2010,较低的版本我没有尝试过。

使用方法


例如,我期望转换 MSDN 中 online_icon[2]《Windows Workflow Fundation》 中的所有内容到 PDF。

步骤
  1. 打开你要下载的 MSDN 页面,查看该页面的标识。如下图,其中标识为 dd489441。

    MSDNConverter0[1]

  2. 编辑配置文件

    打开 MSDNConverter.exe.config,编辑以下配置:
    <configuration> 
        <appSettings> 
            <add key="RootId" value="dd489441"/> 
            <add key="ExcludeSubIdList" value="dd483375,dd489447"/> 
        </appSettings> 
    </configuration>

  3. 把页面的标识“RootId”设置为上面的 dd489441。

    有时候,你不想下载某一些子章节,例如大量类型的 API 说明。你可以把这些不想下载的子章节标识,都加入到 “ExcludeSubIdList” 配置中,以逗号分隔即可。

  4. 运行软件即可

    MSDNConverter1[2]

    点击回车,开始全自动运行……

    先下载整本书的目录结构……

    MSDNConverter2[1]

    目录下载完毕后,会开始下载每一篇文章的文本内容:

    MSDNConverter3[1]

    文本下载完毕,会开始下载所有的图片:

    MSDNConverter4[1]

    文本和图片,会下载到程序对应文件夹下缓存着。防止中途中断不再重复下载。

    待文本和图片下载完成后,程序会打开 Word,开始把内容输出到 Word 文档中。在转换过程中,打开 Word 只是方便查看,不要去人为编辑 Word 文档,否则会影响转换。

    MSDNConverter5[1]

  5. 输出完成

    转换完成后,程序为整个文档生成了目录和导航。这时,保存为 Word、或者 PDF 即可。:)

    MSDNConverter6[1]

  6. 输出

    MSDNConverter7

结语


目前软件是 1.3 版本,还有一些问题没有解决。例如没识别表格、列表、许多样式等。这两天比较懒,反正能看了,以后有时间再加吧。

Enjoy it. :)

原文地址:https://www.cnblogs.com/zgynhqf/p/3064584.html