记一个 中文乱码问题

中文乱码问题, 一直陪伴着我,时不时这里出现,那里出现!

这回的问题 跟记事本有关, Windows记事本, 你懂的, 酸爽的一比。

源文件的 是记事本创建的,当然,也是记事本保存的(公司有些同事 竟然喜欢记事本, 我无语凝噎) 我平时都是使用 notepadd++。 编码格式不同,导致的问题。网上也有很多人吐槽这个记事本。

如下:

用notepadd++ 打开记事本创建的txt文件, 都是正常的, 也没有乱码,但是文件上传之后,默认以 UTF-8存储, 然后再次预览、下载下来查看 就出现问题了:

这样的文件 蛋疼。

怎么办呢? 其实很简单,需要进行编码探测,EncodingDetect 搞一下就好了! 仔细测试一下,发现还有问题, 发现, 编码问题似乎是好了,但是 内容长度有所减少,而且 后面出现了一个 奇怪的 乱码符合:

后面发现,注意到, 重新编码之后, 其长度也发生了变化,

            String name = downloadFilename(request, filename);
            response.addHeader(HttpHeaders.CONTENT_DISPOSITION, "attachment;filename="" + name + """);
            if (contentLength != null) {
                response.addHeader(HttpHeaders.CONTENT_LENGTH, "" + contentLength);
            }
            if (StringUtils.isNotBlank(contentType)) {
                response.setContentType(contentType);
            }
            out = new BufferedOutputStream(response.getOutputStream());
            out.write(buffer);
            out.flush();

上面的 contentLength 是bytes 的长度, 应该是重新编码后的  bytes 的长度 !!

终于好了!

不过, 另外 需要注意的是, 这个时候, 如果用浏览器的 控制台查看,发现是乱码,

估计跟 响应头有关:

可以考虑设置 ContentType 或者  ;charset=

这个其实是不要紧的, 暂时 忽略即可。。

原文地址:https://www.cnblogs.com/FlyAway2013/p/11474039.html