Linux系统下Java 转换Word到PDF时,结果文档内容乱码的解决方法

本文分享在Linux系统下,通过Java 程序代码将Word转为PDF文档时,结果文档内容出现乱码该如何解决。具体可参考如下内容:

1.问题出现的背景

Windows系统中,使用Spire.Doc for Java将Word文档转换为PDF格式时(如下代码),结果文档内容正常;但是在Linux系统中,转出来PDF文档出现乱码或方框。

import com.spire.doc.*;

public class WordtoPDF {
    public static void main(String[] args) {
        Document document = new Document();
        document.loadFromFile("Sample.docx");
        document.saveToFile("out/toPDF.pdf", FileFormat.PDF);

    }
}

2. 问题出现的原因

这个问题是由于Linux服务器缺少字体所导致。通过Spire.Doc for Java转换Word到PDF时,需要从系统中查找对应的字体绘制字形,如果系统中没有安装文档使用的字体,那么会先从系统安装了的字体匹配出能支持这个字形的字体,如果无法匹配出相应的字体,那么就会出现乱码方框。若遇到这类问题,建议先确认Word文档中使用了哪些字体,将这些字体安装到Linux系统

3. 问题解决办法

关于如何查看和安装字体的详细指令:

步骤1开启root权限:

输入指令: su root ;不行时,需要先输入指令: sudo passwd root, 根据步骤输入密码,然后再重新输入指令: su root 

步骤2将字体文件先放到某一个文件夹下,然后进入文件夹:

输入指令: cp simsun.ttc /usr/share/fonts/

然后依次输入下面的指令:

mkfontscale     //字体扩展

mkfontdir         //新增字体目录

fc-cache-fv       //刷新缓存

步骤3查看安装的字体文件:

查看系统中的字体

指令:fc-list

查看系统中的中文字体:

指令:fc-list:lang=zh

以上是本次关于“在Linux系统下,通过Java程序将Word转为PDF后,出现内容乱码的解决办法”的全部内容。如果问题未解决,可留言或添加 QQ:2790765778 。

原文地址:https://www.cnblogs.com/Yesi/p/14676898.html