JavaScript函数式编程(二)

上一篇文章 JavaScript函数式编程(一)   里我们提到了纯函数的概念,所谓的纯函数就是,对于相同的输入,永远会得到相同的输出,而且没有任何可观察的副作用,也不依赖外部环境的状态(我偷懒复制过来的)。

但是实际的编程中,特别是前端的编程范畴里,“不依赖外部环境”这个条件是根本不可能的,我们总是不可避免地接触到 DOM、AJAX 这些状态随时都在变化的东西。所以我们需要用更强大的技术来干这些脏活。



一、容器、Functor

如果你熟悉 jQuery 的话,应该还记得,$(...) 返回的对象并不是一个原生的 DOM 对象,而是对于原生对象的一种封装:

1 var foo = $('#foo');
2  
3 foo == document.getElementById('foo');
4 //=> false
5 
6 foo[0] == document.getElementById('foo');
7 //=> true

这在某种意义上就是一个“容器”(但它并不函数式)。

接下类我们会看到,容器为函数式编程里普通的变量、对象、函数提供了一层极其强大的外衣,赋予了它们一些很惊艳的特性,就好像 Tony Stark 的钢铁外衣,Dva 的机甲,明日香的2号机一样。

下面我们就来写一个最简单的容器吧:

 1 var Container = function(x) {
 2  
 3 this.__value = x;
 4  
 5 }
 6  
 7 Container.of = x => new Container(x);
 8  
 9  
10  
11 //试试看
12  
13 Container.of(1);
14  
15 //=> Container(1)
16  
17  
18  
19 Container.of('abcd');
20  
21 //=> Container('abcd')

我们调用 Container.of 把东西装进容器里之后,由于这一层外壳的阻挡,普通的函数就对他们不再起作用了,所以我们需要加一个接口来让外部的函数也能作用到容器里面的值:

1  
2 Container.prototype.map = function(f){
3  
4 return Container.of(f(this.__value))
5  
6 }

我们可以这样使用它:

1 Container.of(3)
2  
3 .map(x => x + 1) //=> Container(4)
4  
5 .map(x => 'Result is ' + x); //=> Container('Result is 4')

没错!我们仅花了 7 行代码就实现了很炫的『链式调用』,这也是我们的第一个 Functor。

Functor(函子)是实现了 map 并遵守一些特定规则的容器类型。

也就是说,如果我们要将普通函数应用到一个被容器包裹的值,那么我们首先需要定义一个叫 Functor 的数据类型,在这个数据类型中需要定义如何使用 map 来应用这个普通函数。

把东西装进一个容器,只留出一个接口 map 给容器外的函数,这么做有什么好处呢?

本质上,Functor 是一个对于函数调用的抽象,我们赋予容器自己去调用函数的能力。当 map 一个函数时,我们让容器自己来运行这个函数,这样容器就可以自由地选择何时何地如何操作这个函数,以致于拥有惰性求值、错误处理、异步调用等等非常牛掰的特性。

举个例子,我们现在为 map 函数添加一个检查空值的特性,这个新的容器我们称之为 Maybe(原型来自于Haskell):

 1  
 2 var Maybe = function(x) {
 3  
 4 this.__value = x;
 5  
 6 }
 7  
 8  
 9  
10 Maybe.of = function(x) {
11  
12 return new Maybe(x);
13  
14 }
15  
16  
17  
18 Maybe.prototype.map = function(f) {
19  
20 return this.isNothing() ? Maybe.of(null) : Maybe.of(f(this.__value));
21  
22 }
23  
24  
25  
26 Maybe.prototype.isNothing = function() {
27  
28 return (this.__value === null || this.__value === undefined);
29  
30 }
31  
32  
33  
34 //试试看
35  
36 import _ from 'lodash';
37  
38 var add = _.curry(_.add);
39  
40  
41  
42 Maybe.of({name: "Stark"})
43  
44 .map(_.prop("age"))
45  
46 .map(add(10));
47  
48 //=> Maybe(null)
49  
50  
51  
52 Maybe.of({name: "Stark", age: 21})
53  
54 .map(_.prop("age"))
55  
56 .map(add(10));
57  
58 //=> Maybe(31)

看了这些代码,觉得链式调用总是要输入一堆 .map(...) 很烦对吧?这个问题很好解决,还记得我们上一篇文章里介绍的柯里化吗?

有了柯里化这个强大的工具,我们可以这样写:

 1  
 2 import _ from 'lodash';
 3  
 4 var compose = _.flowRight;
 5  
 6 var add = _.curry(_.add);
 7  
 8  
 9  
10 // 创造一个柯里化的 map
11  
12 var map = _.curry((f, functor) => functor.map(f));
13  
14  
15  
16 var doEverything = map(compose(add(10), _.property("age")));
17  
18  
19  
20 var functor = Maybe.of({name: "Stark", age: 21});
21  
22 doEverything(functor);
23  
24 //=> Maybe(31)

二、错误处理、Either

现在我们的容器能做的事情太少了,它甚至连做简单的错误处理都做不到,现在我们只能类似这样处理错误:

 1  
 2 try{
 3  
 4 doSomething();
 5  
 6 }catch(e){
 7  
 8 // 错误处理
 9  
10 }

try/catch/throw 并不是“纯”的,因为它从外部接管了我们的函数,并且在这个函数出错时抛弃了它的返回值。这不是我们期望的函数式的行为。

如果你对 Promise 熟悉的话应该还记得,Promise 是可以调用 catch 来集中处理错误的:

1  
2 doSomething()
3  
4 .then(async1)
5  
6 .then(async2)
7  
8 .catch(e => console.log(e));

对于函数式编程我们也可以做同样的操作,如果运行正确,那么就返回正确的结果;如果错误,就返回一个用于描述错误的结果。这个概念在 Haskell 中称之为 Either 类,Left 和 Right 是它的两个子类。我们用 JS 来实现一下:

 1  
 2 // 这里是一样的=。=
 3  
 4 var Left = function(x) {
 5  
 6 this.__value = x;
 7  
 8 }
 9  
10 var Right = function(x) {
11  
12 this.__value = x;
13  
14 }
15  
16  
17  
18 // 这里也是一样的=。=
19  
20 Left.of = function(x) {
21  
22 return new Left(x);
23  
24 }
25  
26 Right.of = function(x) {
27  
28 return new Right(x);
29  
30 }
31  
32  
33  
34 // 这里不同!!!
35  
36 Left.prototype.map = function(f) {
37  
38 return this;
39  
40 }
41  
42 Right.prototype.map = function(f) {
43  
44 return Right.of(f(this.__value));
45  
46 }

下面来看看 Left 和 Right 的区别吧:

 1  
 2 Right.of("Hello").map(str => str + " World!");
 3  
 4 // Right("Hello World!")
 5  
 6  
 7  
 8 Left.of("Hello").map(str => str + " World!");
 9  
10 // Left("Hello")

Left 和 Right 唯一的区别就在于 map 方法的实现,Right.map 的行为和我们之前提到的 map 函数一样。但是 Left.map 就很不同了:它不会对容器做任何事情,只是很简单地把这个容器拿进来又扔出去。这个特性意味着,Left 可以用来传递一个错误消息。

 1  
 2 var getAge = user => user.age ? Right.of(user.age) : Left.of("ERROR!");
 3  
 4  
 5  
 6 //试试
 7  
 8 getAge({name: 'stark', age: '21'}).map(age => 'Age is ' + age);
 9  
10 //=> Right('Age is 21')
11  
12  
13  
14 getAge({name: 'stark'}).map(age => 'Age is ' + age);
15  
16 //=> Left('ERROR!')

是的,Left 可以让调用链中任意一环的错误立刻返回到调用链的尾部,这给我们错误处理带来了很大的方便,再也不用一层又一层的 try/catch。

Left 和 Right 是 Either 类的两个子类,事实上 Either 并不只是用来做错误处理的,它表示了逻辑或,范畴学里的 coproduct。但这些超出了我们的讨论范围。



三、IO

下面我们的程序要走出象牙塔,去接触外面“肮脏”的世界了,在这个世界里,很多事情都是有副作用的或者依赖于外部环境的,比如下面这样:

1  
2 function readLocalStorage(){
3  
4 return window.localStorage;
5  
6 }

这个函数显然不是纯函数,因为它强依赖外部的 window.localStorage 这个对象,它的返回值会随着环境的变化而变化。为了让它“纯”起来,我们可以把它包裹在一个函数内部,延迟执行它:

function readLocalStorage(){
 
return function(){
 
return window.localStorage;
 
}
 
}

这样 readLocalStorage 就变成了一个真正的纯函数! OvO为机智的程序员鼓掌!

额……好吧……好像确实没什么卵用……我们只是(像大多数拖延症晚期患者那样)把讨厌做的事情暂时搁置了而已。为了能彻底解决这些讨厌的事情,我们需要一个叫 IO 的新的 Functor:

 
import _ from 'lodash';
 
var compose = _.flowRight;
 
 
 
var IO = function(f) {
 
this.__value = f;
 
}
 
 
 
IO.of = x => new IO(_ => x);
 
 
 
IO.prototype.map = function(f) {
 
return new IO(compose(f, this.__value))
 
};

IO 跟前面那几个 Functor 不同的地方在于,它的 __value 是一个函数。它把不纯的操作(比如 IO、网络请求、DOM)包裹到一个函数内,从而延迟这个操作的执行。所以我们认为,IO 包含的是被包裹的操作的返回值。

1  
2 var io_document = new IO(_ => window.document);
3  
4  
5  
6 io_document.map(function(doc){ return doc.title });
7  
8 //=> IO(document.title)

注意我们这里虽然感觉上返回了一个实际的值 IO(document.title),但事实上只是一个对象:{ __value: [Function] },它并没有执行,而是简单地把我们想要的操作存了起来,只有当我们在真的需要这个值得时候,IO 才会真的开始求值,这个特性我们称之为『惰性求值』。(培提尔其乌斯:“这是怠惰啊!”)

是的,我们依然需要某种方法让 IO 开始求值,并且把它返回给我们。它可能因为 map 的调用链积累了很多很多不纯的操作,一旦开始求值,就可能会把本来很干净的程序给“弄脏”。但是去直接执行这些“脏”操作不同,我们把这些不纯的操作带来的复杂性和不可维护性推到了 IO 的调用者身上(嗯就是这么不负责任)。

下面我们来做稍微复杂点的事情,编写一个函数,从当前 url 中解析出对应的参数。

 1  
 2 import _ from 'lodash';
 3  
 4  
 5  
 6 // 先来几个基础函数:
 7  
 8 // 字符串
 9  
10 var split = _.curry((char, str) => str.split(char));
11  
12 // 数组
13  
14 var first = arr => arr[0];
15  
16 var last = arr => arr[arr.length - 1];
17  
18 var filter = _.curry((f, arr) => arr.filter(f));
19  
20 //注意这里的 x 既可以是数组,也可以是 functor
21  
22 var map = _.curry((f, x) => x.map(f));
23  
24 // 判断
25  
26 var eq = _.curry((x, y) => x == y);
27  
28 // 结合
29  
30 var compose = _.flowRight;
31  
32  
33  
34  
35  
36 var toPairs = compose(map(split('=')), split('&'));
37  
38 // toPairs('a=1&b=2')
39  
40 //=> [['a', '1'], ['b', '2']]
41  
42  
43  
44 var params = compose(toPairs, last, split('?'));
45  
46 // params('http://xxx.com?a=1&b=2')
47  
48 //=> [['a', '1'], ['b', '2']]
49  
50  
51  
52 // 这里会有些难懂=。= 慢慢看
53  
54 // 1.首先,getParam是一个接受IO(url),返回一个新的接受 key 的函数;
55  
56 // 2.我们先对 url 调用 params 函数,得到类似[['a', '1'], ['b', '2']]
57  
58 // 这样的数组;
59  
60 // 3.然后调用 filter(compose(eq(key), first)),这是一个过滤器,过滤的
61  
62 // 条件是 compose(eq(key), first) 为真,它的意思就是只留下首项为 key
63  
64 // 的数组;
65  
66 // 4.最后调用 Maybe.of,把它包装起来。
67  
68 // 5.这一系列的调用是针对 IO 的,所以我们用 map 把这些调用封装起来。
69  
70 var getParam = url => key => map(compose(Maybe.of, filter(compose(eq(key), first)), params))(url);
71  
72  
73  
74 // 创建充满了洪荒之力的 IO!!!
75  
76 var url = new IO(_ => window.location.href);
77  
78 // 最终的调用函数!!!
79  
80 var findParam = getParam(url);
81  
82  
83  
84 // 上面的代码都是很干净的纯函数,下面我们来对它求值,求值的过程是非纯的。
85  
86 // 假设现在的 url 是 http://xxx.com?a=1&b=2
87  
88 // 调用 __value() 来运行它!
89  
90 findParam("a").__value();
91  
92 //=> Maybe(['a', '1'])

四、总结

如果你还能坚持看到这里的话,不管看没看懂,已经是勇士了。在这篇文章里,我们先后提到了 Maybe、Either、IO 这三种强大的 Functor,在链式调用、惰性求值、错误捕获、输入输出中都发挥着巨大的作用。事实上 Functor 远不止这三种,但由于篇幅的问题就不再继续介绍了(哼才不告诉你其实是因为我还没看懂其它 Functor 的原理)

但依然有问题困扰着我们:

1. 如何处理嵌套的 Functor 呢?(比如 Maybe(IO(42)))

2. 如何处理一个由非纯的或者异步的操作序列呢?

在这个充满了容器和 Functor 的世界里,我们手上的工具还不够多,函数式编程的学习还远远没有结束,在下一篇文章里会讲到 Monad 这个神奇的东西(然而我也不知道啥时候写下一篇,估计等到实习考核后吧OvO)。


五、参考

1、

2、

3、《JavaScript函数式编程》【美】迈克尔·佛格斯

原文地址:https://www.cnblogs.com/wangking/p/10869439.html