《统计陷阱》读书笔记

一. 内在有偏的样本:
  1. 一个以抽样为基础的报告如果要有价值, 就必须使用具有代表性的样本, 这种样本排除了各种误差。 这就是耶鲁毕业生的收入数据失真的原因, 也是许多你在报纸或杂志上读到的报道毫无意义的原因。
  2. 无形的误差与有形的误差一样容易破坏样本的可信度。 也就是说 , 即使你找不到任何破坏性的误差来源,但只要有产生误差的可能性,你就有必要对结果保留一定的怀疑。
  3. 样本有偏的趋势可以自动地操纵结果, 使其变得扭曲。
二. 精心挑选的平均数:
我的诡计是每次使用了不同的平均数。“ 平均数” 这个词有很广泛的涵义,当被告知某个数是平均数时, 除非你能很明确地说出它具体的种类—— 均值、 中位数还是众数。这三个种类,在面对不同的样本时,值可能会相差很大。
三. 没有披露的数据:
当一个平均数、一张图表或者某种趋势遗漏了这些重要的数据,请对它们保留一些怀疑。
否则, 你会和一个仅根据平均气温选择野营地点的人一样盲目。 也许你会认为 61 华氏度是个不错的年平均气温, 而在加利福尼亚州, 如果你仅根据平均气温进行选择, 而忽略了气温波动范围, 你可能会选择内陆沙漠或远离南海岸线的圣· 尼古拉斯群岛, 那么, 你不是被烤焦就是被冻僵。 因为, 圣· 尼古拉斯群岛气温的波动范围是 47~ 87 华氏度, 而沙漠的气温波动范围是 15~ 104 华氏度。
四. 毫无意义的工作:
比较相差不大的两个数据毫无意义。你必须记住这个加减号, 即使(特别是)它没有明确指出。(比如智商测试,香烟中有害物质的含量等)
五. 惊人的统计图形:
当使用图形表示数据变化时,省略掉一些刻度或者数据,使图像效果看起来趋近于‘完美“,带来的视觉效果,比全部显示要强烈的多。
六. 平面图形:
用动画代替折线柱状的形式来表现差异性,带来比实际情况更夸大的效果。
 
 
七. 不相匹配的资料:
如果你想证明某事,却发现没有能力办到,那么试着解释其他事情并假装它们是一回事。在统计资料与人类思维冲撞所引起的耀眼光芒中, 几乎没有人会发现它们的区别。 不相匹配的数据是保证你处在有利位置上的武器, 而且通常如此。
在运用交通意外事故的数据时, 如果不牢记它们是极其不匹配的数据, 那么, 无论哪种交通手段的事故记录都会将你吓个半死。“ 去年飞机失事造成的人员死亡比 1910 年多” ,这是否意味着现在乘飞机要比过去危险?认为更危险的说法是不合理的,因为选择飞机作为交通工具的人已经是以前的几百倍了。
八. 相关关系与因果关系:
但这是一个古老的谬误, 然而它仍频繁地出现在统计资料中, 并被大量让人印象深刻的数据所伪装。 这个谬误是: 如果 B 紧跟着 A 出现, 那么 A 一定导致 B。 在上例中, 当抽烟与低分同时出现时, 人们得到了一个未经证实的假设, 抽烟导致低分。 难道就不能是相反的解释吗?也许低分促使学生不喝酒而变得爱抽烟。 这种说法与前一种一样能得到证据很好的支撑。 只是它不能够满足宣传人员的要求。
然而, 更大的可能性是两个周素并不互为因果, 而同为第三个因素的产物。 是否那些不把读书当回事的爱社交的学生更爱抽烟?又或者是否可以在有人曾经建立的性格外向与成绩之间的相关关系(其相关性比成绩和智力的相关性更高)上找到线索?也许, 性格外向的学生比性格内向的更爱抽烟。 问题的关键在于, 当有许多合理的解释时, 你几乎没有权利选择对口味的解释并坚持认为它是正确的。
 
所谓的“ 相关” , 往往是通过相关系数这个精确的数据来证明两件事物具有关联关系, 它可以有多种不同的类型。
一种相关是由于机缘巧合而产生的。 由于机会的存在, 你或许可以通过一组数据来证明一些根本不存在的结论。 但换一组数据也许又无法证明。 就像自称能防止蛀牙的牙膏生产厂商, 你只需将对自己不利的资料扔到一边而公开你需要的结论就能达到目的。 利用小样本,任意两个你能想到的事件或两组特性之间都能建立显著的相关。
另一个需要留意的是, 超过了推断相关关系的数据范围而得出的结论。 从常理来说, 雨下得越多, 谷物则长得越高, 收成越多。 雨是农民的福音。 但一季暴雨则可能破坏甚至毁灭庄稼。 正相关到了一定的程度后便急剧地转化为负相关。 超过了一定的降雨量, 雨越多, 收成越少。
 
当你发现某些人— 他们往往是当事人, 在胡乱使用相关性时, 请注意分辨相关是否是事件变迁的产物或时代趋势的产物。
 
九. 如何操作统计操控:
许多统计资料的歪曲和被控制并不是资深统计学家所为, 出自统计学家之手的完善资料也许最终会被销售人员、 关系专家、 记者或者广告撰稿人扭曲、 夸张、 简化或是刻意地进行了挑选。
为了使最声名狼藉的统计资料看上去更有分量、 更精确, 你应该考虑使用小数。
人们平均每晚睡眠 7.831 小时。 听上去, 你似乎对正在讨论的话题胸有成竹。 但如果你竟傻乎乎地宣布, 人们平均每晚休息 7.8 小时(或者“ 差不多 8 小时”), 数据就失去了动人的精确性。
所有这些都在提醒大家, 在报纸、 杂志和书籍中看到统计材料、 结论以及数据时, 应该经过认真的思考后再接受它们。 有时候, 更仔细的一瞥有利于进一步了解真相。 但武断地拒绝统计方法也是因噎废食, 不值得提倡。 这类似于仅仅因为作者有时会使用词汇来隐藏而不是揭露事实就拒绝阅读一样。
 
十. 对统计资料提出的五个问题:
1.谁说的?
2.他是如何知道的?
3.遗漏了什么?
4.是否有人偷换了概念?
5.这个资料有意义吗?
 
1. 首先要寻找的是偏差—— 出于学说、 名誉或收入的考虑而需要证明某些结论的实验室,希望获得一篇好报道的报界, 工资已岌岌可危的工人和管理部门都有可能制造偏差。
先寻找有意识的偏差,再仔细寻找无意识偏差—— 通常,它更危险。 1928 年, 这种偏差使得统计专家和经济学家在制作的图表和进行的预测中得出了惊人的结论。经济结构的不合理被喜悦的情绪忽略了, 各种各样的迹象被罗列出来, 它们都从统计上支持了这个结论: 我们只不过刚刚开始致富。
当某个权威人士被引用时, 请弄清楚到底资料的内容是权威的, 还是仅仅与权威人士沾边。
“ 调查显示, ” 该刊物得出结论(当看到类似的字眼时请格外留意)。
 
2. 注意样本的有偏. 是由于选择不当, 还是像这个例子一样, 由刻意挑选有利的样本造成的。 问一个我们前几章曾经提过的问题: 样本是否足够大到能够保证结论值得信赖?对于相关系数也可以提同样的问题: 数值是否足够大从而能说明问题? 案例是否足够多? 是否具有一定的显著性?作为一个不经意的读者, 你也许不会运用显著性检验或根据样本的多少判断结论的准确性。 但对于许多报告中的内容, 你至少可以进行仔细的观察或许是一个长时间的观察, 从而发现由于缺乏足够多的案例, 报告的内容不足以说服任何人。
 
3. 你无法了解样本包含了多少案例。 这个数据的缺失, 特别当信息的来源存在着利害关系时, 已足以使你对整件事情提出质疑。 同样, 对一个没有经过可信度(可能误差、 标准误差)检验的相关也不用太当真。
当均值与中位数相差甚远时, 注意那些没有标明类型的平均数。
很多数据因为缺乏比较而变得没有意义。 卫生部(The Ministry of Health)最近公布的数据表明. 在大雾的一周内, 伦敦市郊的死亡人数猛增至 2800 人。 我们能否认为该周的死亡率高于平常只是个意外?所有类似的事情都在变动当中, 天气在变, 死亡人数也在变。 接下来几周的情况又如何呢?是否这周的死亡人数低于平均水平就能说明因雾而死的是那些不久于人世的人呢?这个数据是惊人的, 但由于缺乏其他数据与之比较, 因此就显得毫无意义。
有时仅给出百分数却缺少原始数据也能造成欺骗。 一家公司可以这样公告, 该公司有 3003 名股东, 平均每人持股 660 股, 的确如此。 但下面的说法更清楚, 公司总共有 200 万股股票, 其中 3 名大股东持有 3/ 4, 而剩下的 3000 人只持有 1/ 4。
当看到一个指数时, 你或许会觉得遗漏了什么,巧妙之处在于基期,一个经过挑选的基期将会扭曲事实。 某个全国性的劳工组织曾经证明: 经济大萧条之后生产和利润指数上升得比工资指数要快, 于是提出增加工资的要求。 利润指数上升得快的原因是因为萧条时期利润指标几乎达到了谷底,于是基期相对较小。
有时文章中遗漏了引起变化的原因, 这容易让读者认为其他的因素才应对变化负责。
 
4. 分析统计资料时, 请留心从搜集原始资料到形成结论的整个过程中, 是否存在着概念的偷换。
 
“5 岁以上的英国男子在冬天平均每周洗澡 1. 7 次, 而夏天为 2.1 次。 ” 一篇新闻报道如是说, “ 英国妇女的相应数据为: 冬天 1. 5 次, 夏天 2. 0 次。 ” 该资料来源于英国劳工部(The Ministry of Works)对“6000 户有代表性的英国家庭” 所做的调查。然而, 主要的问题还不在于此, 而在于概念的偷换。 劳工部所得到的数据只能反映调查者所说的洗澡次数, 并不能反映实际洗澡的频率。 一个类似洗澡这么私人的问题, 并且涉及到英国洗澡的传统时, 说的和做的很可能不一致。 也许英国的“ 他” 并不比“ 她” 洗澡频繁, 一个较安全的结论是他们说的是这样。
如果数据是建立在人们口头的回答(即使有一些听上去十分客观)基础之上,将发生许多怪事。
在相关事宜中自命不凡的胡说也是一种偷换概念的手法,即将“ 相关关系” 偷换成“ 因果关系”。《 电力世界》 (Electrical World)杂志曾经在某篇社论中, 公布了一张极其复杂的图表, 标题为“ 电力对美国到底意味着什么?”
当“ 工厂的用电马力” 上升时,“ 平均每小时工资” 也在上升, 但同时“ 每周平均工作时间” 减少。 当然。 所有这些都是长期趋势, 但并没有证据表明它们当中的某个因素是另一个的起因。
偷换概念会使你在准备借钱时很难比较直接借款与分期付款的成本。 6% 听起来就是 6% —— 但它又有可能是另一回事。 如果你以每月等额分期付款的形式从银行以 6% 的利率借了 1OO 美元, 应支付的利息是3 美元。 但如果是另一种 6%, 有时也称为借 100 美元还 6 美元, 你就需要偿还前者的 2 倍即 6 美元。 大多数汽车贷款采用后一种方法, 实在是狡猾。关键在于分期还款时,100 美元你并没有用到一年, 6 个月过去后。 你已经偿还了一半
的贷款。 如果采用第二种形式计算利息, 即借款额的 6%, 你实际承担的利率应该是 12%。
人们有时会通过玩文字游戏以达到偷换概念的目的。 下面是摘自《 商业周刊》(Business Week)杂志的一段话:
会计人员往往认为“ 盈余” 是一个会引起诸多争议的词,他们提议把它从公司的资产负债表中抹去。 美国会计师协会会计程序委员会建议: …… 可以使用“ 留存利润” 或者“ 固定资产增值” 这种描述性的术语。
下面这段话摘自一篇报道标准石油公司破记录的收益和一天 100 万净利润的新闻故事:可能董事会会花一点时间来考虑股票分割,因为那会带来一些好处…… 如果每股利润看上去不那么大的话……
 
5. 当所接触到的资料是建立在未经证实的假设基础之上时, 你可以发问, “ 这个资料有意义吗? ”
外推法是十分有用的, 特别当预测趋势时。 但是, 当看到利用外推法计算出来的数据和图表时,请记住这点:到目前为止的趋势都是事实.而未来的趋势只不过是受教育者的猜测。该方法暗含“ 其他所有条件都相同”, 以及“ 现有趋势将继续下去” 的前提。 但实际上, 条件总是在变化的。
原文地址:https://www.cnblogs.com/momo798/p/11188493.html