吐槽下《Hadoop权威指南(第二版)》的翻译

这本书里翻译方面问题较多,对于错别字等简单问题就不说了,这里仅列些我发现的比较严重的问题:

1. 391页:

“一般来说,面向的存储格式对于那些只访问表中一小部分行的查询比较有效。相反,面向的存储格式适合同时处理一行中很多列的情况。”

读到这句话感觉很不对劲,首先“相反” 前后都是关于“面向行的存储”适合的地方,这哪有相反的地方;其次,有点面向行或者列存储知识的人都知道他们的优缺点。于是对照《Hadoop The Definitive Guide 2nd Edition》中对应的地方,果不其然:

这么低级的错误,column在什么情况中的意思是“行”呢,用本山的话就是“在答错的情况下”!

2. 190页:

“类型擦除(type erasure)”导致运行过程中类型信息并非一直可见,所以Hadoop不得不明确进行设定。”

这句读着就不太通顺,英文原文:

“海燕呐,你可长点心吧!别老欺压学生给你翻译,完事还死不要脸挂个自己的名字!”

3. 第八章表8-1. 内置计数器 的列“计数器名称”不需要翻译;另外就算翻译第五行也应该是“map输出的字节”;“combine输入的记录”的说明中“相异码分组数”让人摸不着头脑,其实原话很简单“the number of distinct key groups”。

原文地址:https://www.cnblogs.com/aprilrain/p/2947664.html