[转]java平台,使用openoffice将word转换为html

转自:http://hi.baidu.com/trstones/blog/item/7fca145426436c57d0090663.html

java环境下将word转换为html目前没有很简单的方法。使用openOffice实现应该算是“矬子里面拔大个”。

1,首先下载openOffice。这是个第三方开源的项目,专门用于在java环境中进行类似word文档编写(要是连个word编辑都做不出来,那java在外行心目中地位就蹭蹭地下去了)。我下载的是OpenOffice.org 3.2版本。

2,下载后安装。通过cmd进入“安装目录\OpenOffice.org 3\program”文件夹下。运行一下命令

soffice -headless -accept="socket,host=127.0.0.1,port=8100;urp;" -nofirststartwizard

意思是启动openoffice的一个服务,以备为其他程序使用(看看咱们的开源领袖多大方,不像微软那么小气,生怕自己的用)。

3,测试一下8100端口是否能使用。cmd命令“telnet localhost 8100”,如果开启了,就会有黑的不能再黑的屏幕显现,如果没开启,就会出现连接不上的消息。

4,下载jodconverter项目,我下的是2.2.2版本。(咱就不重复制造轮子了,直接就上车吧!)

5,自己创建项目,把jodconverter文件夹lib中的所有jar包都引用一下。然后写下以下代码

public static void main(String args[]) {
   File inputFile = new File("D:\\test\\广告测试.doc");
   File outputFile = new File("D:\\test\\广告测试.html");
   OpenOfficeConnection connection = new SocketOpenOfficeConnection(8100);
   try{
   connection.connect();
   }catch(Exception e){
    e.printStackTrace();
   }
   DocumentConverter converter = new OpenOfficeDocumentConverter(connection);
   converter.convert(inputFile, outputFile);
   connection.disconnect();
}

然后就运行一下,应该没什么问题。当然“D:\\test\\广告测试.doc”得事先存在(程序再厉害也不能自产自销吧)。

6,其他。上面的代码 doc->html;
     如果是xls->html,那就直接把“D:\\test\\广告测试.doc”改成“D:\\test\\****.xls”;
     如果是doc->pdf,那就把“广告测试.html”改成“广告测试.pdf”。
    就测了这两个,其他的大家自己摸索吧。可以打开openoffice客户端程序,看看支持那些文件,保存时可以以那些格式保存。乖乖好傻瓜啊!

原文地址:https://www.cnblogs.com/evlon/p/1938592.html