历史上的今天:编程语言中null引用的十亿美元错误

这是Jerry 2021年的第 10 篇文章,也是汪子熙公众号总共第 281 篇原创文章。

今天是2021年1月17日,星期日,腊月初五。

Jerry之前收到CSDN社区赠送的新年礼物,一本台历:《了不起的程序员》,

其中1月16日,17日两天的篇幅,都在介绍托尼·霍尔(Tony Hoare), 计算机科学家,因程序设计语言定义与设计方面的杰出贡献获得1980年的图灵奖。快速排序算法的发明者。

如果想查看用ABAP实现的8种排序算法的源代码,可以查看Jerry之前的文章:

Jerry 2017年的五一小长假:8种经典排序算法的ABAP实现

本文不会讨论霍尔发明的快速排序算法,而是介绍另一个来自霍尔,如今仍然被程序员在编程语言中广泛使用的一个设计:null引用。

null引用被霍尔称为"十亿美元错误",是霍尔1965年设计ALGOL W语言时提出的。

《Java实战》中提到,在Java程序开发中使用null会带来理论和实际操作上的种种问题:

  • 它是错误之源
  • 会使你的代码膨胀
  • 自身毫无意义
  • 破坏了Java的哲学
  • 在Java的类型系统上开了口子

霍尔的名言:

我把它叫做我的“十亿美元错误”,就是在1965年发明了空引用...... 我无法抵挡放进一个空引用的诱惑,仅仅是因为实现起来非常容易。

引入了空引用的编程语言,在访问引用之前,需要显式检查引用是否有效。

Java

下图第46行代码定义的print方法,输入参数是一个类型为Integer的引用。在调用引用之前,需要先判断其是否是空引用,否则程序执行时就会出现运行时异常。

ABAP

使用CHECK X IS NOT INITIAL进行防御,如果X为空引用,则不会执行CHECK语句的下一条语句。

严谨的德国人,在霍尔教授null引用的基础上,又设计出IS BOUND, IS NOT INITIAL和IS ASSIGNED这几种判断逻辑:

SAP ABAP一组关键字 IS BOUND, IS NOT INITIAL和IS ASSIGNED的用法辨析

JavaScript

第10行的print方法内部,用&&操作符的短路逻辑(short-circuit)特性来实现空引用的检测:如果传入的oPrinter是空引用,则不会执行&&后面的print调用。

而TypeScript提供的可选链(Optional Chaining),则可以在语言层面优雅地避免这个问题。

下面的TypeScript代码,使用问号构造了一个可选链。如果a为空,则表达式a?.b直接返回undefined给变量val,而不会试图去执行a.b

上图TypeScript代码,编译之后生成的JavaScript代码如下图所示,我们可以把TypeScript的可选链看成JavaScript用三元表达式实现的语法糖。

为了减轻Java程序员每次使用引用之前,显式进行非空检查的工作量,Java 8引入了一个新的工具类:Optional.

Optional仅仅是一个不含任何业务逻辑的包裹类,其value字段指向了真正的业务类。

下图是一个使用Optional工具类的例子,第11行的filter方法,传入的是一个通过Lambda Function实现的过滤条件。这行语句的语义是,对anotherName包含的字符串,进行过滤操作,检查another实例的value字段存储的引用,是否满足过滤条件(字符串长度小于6):

Optional.filter方法,无论过滤条件是否满足,返回的类型均为Optional,便于链式调用。

我第10行传入Optional对象的字符串,显然长度远远大于6,所以filter方法返回一个新的Optional对象,其value字段为null.

对于filter调用返回的Optional对象,我们可以继续调用orElse,设置一个默认值。下图第14行用orElse实现的逻辑,语义是:如果shortName包裹的value字段为空,则返回orElse方法传入的默认值。

Java 8的Optional工具类并不像TypeScript的可选链一样,后者是语言层面提供的特性,而Optional仅仅是开发包里的一个工具类。

比如Optional的静态方法of,其实现仅仅是新建一个Optional对象,去包裹传入的value引用:

orElse方法,内部实现也是一个简单的三元表达式。

看这样一个极端的例子:

Outer类有一个字段nested,类型为Nested类。Nested类有一个字段inner,类型为Inner类。Inner类包含了字段foo,类型为String,值为Jerry:

如果想从Outer类的实例出发,写一段比较健壮的代码,打印出深藏在Inner类里的foo字段,常规的写法和使用Optional的写法分别位于下图test1和test2方法,大家可以比较下,更喜欢哪一种?

值得一提的是,类似Java Optional.orElse方法,在ABAP里也存在基于语言层面的支持。

下图是ABAP 740的新语法:

上面的新语法,翻译成传统的ABAP代码如下:

由此可见,新的ABAP内表读取的语法比较简洁,能少写3行代码。

但是新语法有一个缺陷:如果it_data内表,不存在object_ext的值为cl_crm_prodil_bo_names=>gc_prod_root的记录,此时程序执行会被终止,抛出异常CX_SY_ITAB_LINE_NOT_FOUND:

当然针对这种情况,ABAP也有对应的解决方案。

下图测试代码第17行会抛出异常,而19行不会。从语义上容易理解:如果内表lt_data里不存在name为Spring2的记录,则返回开发者使用DEFAULT VALUE关键字指定的一个结构,作为默认值。

第19行执行完毕后,结构ls3的name字段为SpringInvalid, value为999.

本文从霍尔教授1965年提出的null引用作为切入点,向大家分享了Jerry工作中同空引用打交道的一些经历,感谢阅读。

ABAP专题

更多Jerry的原创文章,尽在:"汪子熙":

原文地址:https://www.cnblogs.com/sap-jerry/p/14344498.html