【实数系统】 04

　　我们一直在不自觉地使用着十进制小数（decimal fraction）表示实数，小数运算方便、容易理解，让实数使用起来更加自如。但小数却不能提供更多关于实数本身的性质，尤其是对无理数、超越数的研究，小数表示完全无法胜任。有人会感到困惑，什么叫实数本身的性质？实数本身还有什么需要进一步研究的？比如说吧，无理数周边的有理数是如何分布的？超越数和其它无理数有什么本质区别？这些问题的回答都超出了本篇的范围，但我觉得可以从一个简单的入口来洞悉里面的世界，为今后的学习提供工具和精神上的准备。

1. 一般连分数

　　在正式给出定义之前，先来欣赏一下下面漂亮的表达式：

　　(sqrt{2}+1=2+cfrac{1}{2+cfrac{1}{2+cdots}})

　　(dfrac{sqrt{5}+1}{2}=1+cfrac{1}{1+cfrac{1}{1+cdots}})

　　(dfrac{4}{pi}=1+cfrac{1^2}{2+cfrac{2^2}{2+cfrac{3^2}{2+cfrac{4^2}{cdots}}}})

　　(dfrac{e-1}{e+1}=cfrac{1}{2+cfrac{1}{6+cfrac{1}{10+cfrac{1}{14+cdots}}}})

　　(sqrt{a^2+b}=a+cfrac{b}{2a+cfrac{b}{2a+cfrac{b}{2a+cdots}}})

　　这里要介绍的就是连分数（Continued Fractions），它是实数的另一种表示方法，在数论等学科中有着很惊奇的应用。简单说连分数就是具有以下左边形式的表达式，其中(a_i,b_i)可以是任何数（甚至复数），省略号可以是有限或无穷的。右边的表达式叫一般连分数，如果(a_0)为整数、(a_k(k>0))为正整数，它又叫简单连分数，本篇只介绍一般连分数和简单连分数。

[a_0+cfrac{b_0}{a_1+cfrac{b_1}{a_2+cdots}};quadquad a_0+cfrac{1}{a_1+cfrac{1}{a_2+cdots}}]

　　这种书写方式虽然直观，但稍显繁琐，我们可以把一般连分数写成([a_0,a_1,a_2,cdots])。值得一提的是，有限连分数显然都是一个数，但无限连分数却还只是个记号，它能不能表示数还需要进一步的结论。另外，(s_k=[a_0,a_1,cdots,a_k])称为连分数的节，(r_k=[a_k,a_{k+1},cdots])称为连分数的余式，显然有下式成立：

[[a_0,a_1,a_2,cdots]=[a_0,a_1,cdots,a_{k-1},r_k] ag{1}]

　　显然连分数的每个节(s_k)都可以展开为一般的分数形式(dfrac{p_k}{q_k})，它称为连分数的渐进分数（convergents），由数学归纳法可以推得如下公式。其中(p_{-2},p_{-1},q_{-2},q_{-1})是补充进来的，它们可以使公式统一。这个公式非常漂亮，(p_k,q_k)居然独立地只与(a_k)相关，它是连分数理论的基本公式。

[p_k=a_kp_{k-1}+p_{k-2};quad (p_{-2}=0,p_{-1}=1) ag{2}]

[q_k=a_kq_{k-1}+q_{k-2};quad (q_{-2}=1,q_{-1}=0)]

　　直觉可能已经告诉你，渐进分数可能是实数的一种逼近序列，研究渐进分数之间的关系就能知道这个逼近的趋势。将上式分别乘上(q_{k-1},p_{k-1})并相减得到(p_kq_{k-1}-q_kp_{k-1}=p_{k-2}q_{k-1}-q_{k-2}p_{k-1})，迭代计算得到公式（3），并进而有公式（4），用类似的方法和已有结论容易有公式（5）（6）。它们都表示了渐进分数的逼近情况，以后会经常用到。

[q_kp_{k-1}-p_kq_{k-1}=(-1)^k ag{3}]

[dfrac{p_{k-1}}{q_{k-1}}-dfrac{p_k}{q_k}=dfrac{(-1)^k}{q_kq_{k-1}} ag{4}]

[q_kp_{k-2}-p_kq_{k-2}=(-1)^{k-1}a_k ag{5}]

[dfrac{p_{k-2}}{q_{k-2}}-dfrac{p_k}{q_k}=dfrac{(-1)^{k-1}a_k}{q_kq_{k-2}} ag{6}]

　　你可能注意到，余式(r_k)完全可以当做(a_k)看待，所以可以有表达式（7）。这个表达式将余式和连分数的值联系了起来，对研究逼近很有用处。另外，结合公式（2）很容易得到以下有趣的表达式（8）。它们不仅漂亮，对今后的证明也都很有用。

[[a_0,a_1,a_2,cdots]=dfrac{p_{k-1}r_k+p_{k-2}}{q_{k-1}r_k+q_{k-2}} ag{7}]

[dfrac{p_k}{p_{k-1}}=[a_k,a_{k-1},cdots,a_0];quad quad dfrac{q_k}{q_{k-1}}=[a_k,a_{k-1},cdots,a_1] ag{8}]

2. 简单连分数

　　以上的讨论都是针对一般连分数进行的，得出的结论也都是关于表达式形式的。如果想得到关于值的性质，看来必须限制(a_k)的值，现在就假设(a_k)为正数（比简单连分数条件弱一些）。由公式（4）可知偶（奇）数项渐进分数是递增（减）的，而且奇数项皆大于偶数项。从图像上看感觉就是两条逐渐靠近的曲线，我们自然会问：它们会收敛于同一个值吗？对于有限连分数，答案是显然的，最后一项会等于分数值。但对于无限连分数，极限的知识告诉我们它们不一定相遇，所以还需要研究它们相遇的条件。

　　首先，渐进分数序列收敛时称连分数是收敛的，它本质上是说两条曲线收敛于同一值，该值称为连分数的值。容易看出连分数收敛和它的余式收敛是等价的，那么无穷连分数收敛的条件是什么呢？由公式（4）可知收敛的等价条件是(q_kq_{k+1} o+infty)，下面来证它的充要条件是(sum{a_k})发散。先证必要性，即由极限为无穷证明级数发散。首先容易有(q_k>q_{k-2})，从而(q_k>q_{k-1},q_{k-1}>q_{k-2})有一个成立，结合公式（2）可有(q_k<dfrac{1}{1-a_k}q_{k-1})或(q_k<dfrac{1}{1-a_k}q_{k-2})。如果级数收敛，由级数理论可知(prodlimits_{k=0}^infty{(1-a_k)})有非零值，从而(q_k)有限，与极限为无穷矛盾，所以级数必收敛。再证充分性，即由级数发散可证极限为无穷。现由(q_kgeqslant q_{k-2}+ca_k)分别对奇偶项进行估值，合并有(q_k+q_{k+1}>csumlimits_{i=0}^k{a_i})，然后很容易有(q_kq_{k+1} o+infty)。证明完成。

　　可以猜想，不同的连分数可能收敛到同一个实数，这样实数的连分数表示就没有唯一性。为达到唯一性，并获得更多的结论，从现在开始我们仅讨论简单连分数，并简称为连分数。连分数的(a_k)称为局部商（partial quotient），(a_0)可为负数，为保持结论的处处成立，我们再限定它必须非负，这并不影响结论对所有连分数的适用性。另外，对有限连分数有([a_0,cdots,a_{n-1},1]=[a_0,cdots,a_{n-1}+1])，连分数表示仍然不唯一，但容易证明，如果限制(a_n>1)，则实数有唯一的连分数表示（十进制小数表示也要剔除掉(dot{9})才有唯一表示）。

　　比较自然地可以想到，实数的唯一连分数表示可以用类似辗转相除的方法逐步得到。每次(a_k)取余式(r_k)的整数部分，余式的小数部分取倒数得到新的余式(r_{k+1})，依次类推，比如由下表可得到(pi=[3,7,15,1,292,1,cdots])。显然有理数在有限步后余式为0，结束流程得到有限连分数，而无理数则会一直进行下去，得到无限连分数。

(r_0=3.1415926)	(r_1=7.0625)	(r_2=15.99659)	(r_3=1.0034)	(r_4=292.634)	(r_5=1.575)
(a_0=3)	(a_1=7)	(a_2=15)	(a_3=1)	(a_4=292)	(a_5=1)

　　由公式（7）可知(alpha=[a_0,cdots,a_n,r_{n+1}]=dfrac{p_kr_{k+1}+p_{k-1}}{q_kr_{k+1}+q_{k-1}})，其中(a_{n+1}leqslant r_{n+1}<a_n+1)，从而得到渐进分数的误差估计公式（9）。该误差公式可以继续得到误差比较式（10）（11），即渐进分数越来越接近连分数的值。

[dfrac{1}{q_k(q_k+q_{k+1})}<left|{alpha-dfrac{p_k}{q_k}} ight|leqslantdfrac{1}{q_kq_{k+1}} ag{9}]

[left|{alpha-dfrac{p_{k+1}}{q_{k+1}}} ight|<left|{alpha-dfrac{p_k}{q_k}} ight| ag{10}]

[left|{q_{k+1}alpha-p_{k+1}} ight|<left|{q_kalpha-p_k} ight| ag{11}]

3. 逼近的度量

　　实数的连分数表示不依赖于进制，(a_k)的大小一定程度上表示了逼近的程度，它是研究无理数的有力工具。连分数的渐进分数可以由公式（2）递推得到，(p_k,q_k)都是整数，由公式（3）得到(p_k,q_k)又是互质的，所以公式（2）推导出的渐进分数都是既约分数。

　　关于用有理数逼近无理数，我们有这样一个基本问题：怎样用尽量小分母的分数来逼近已知无理数？这个问题不仅有实际应用价值，还能考察一个无理数的性质。首先我们可以有这样的粗略感觉，对选定的分母可有一个最逼近的分数，随着分母的递增，必然有某个分数更加逼近，然而这些分母之间可能是有间隔的。先对这样的逼近作一个明确的定义，对任意实数(alpha)，若既约分数(dfrac{n}{m})比任何分母不大于(m)的分数都更逼近(alpha)，(cfrac{n}{m})称为(alpha)的最佳逼近。即若(m'leqslant m)，(n')任意，则有表达式（12）。一个实数可能有很多的最佳逼近，它们分母递增，且值逐渐逼近(alpha)直至收敛。

[left|{alpha-dfrac{n}{m}} ight|<left|{alpha-dfrac{n'}{m'}} ight| ag{12}]

　　由前面的分析知道，渐进分数逐步靠近收敛值，而且它们的分母也逐渐增大，那它们是不是就是我们要找的最佳逼近呢？答案让人惊喜，但也有点让人失望，渐进分数都是最佳逼近，但不是所有最佳逼近都是渐进分数。在得到更细致的结论之前，我们需要引入中位数的概念。分数(dfrac{a+c}{b+d})称为(dfrac{a}{b})和(dfrac{c}{d})的中位数，容易证明它的值介于(dfrac{a}{b})和(dfrac{c}{d})之间（中位数定理）。

　　考察如下序列，它们和(dfrac{p_{k-1}}{q_{k-1}})之间都是中位数关系，所以这是一个单调序列，且位于收敛值的同一侧。这个序列如果再前进一步，就是(dfrac{p_{k-1}}{q_{k-1}})和(dfrac{p_k}{q_k})的中位数，同样推理，它必和(dfrac{p_{k-1}}{q_{k-1}})在同一侧。这个有趣的过程可以启发我们如何计算(a_k)，已知前两个渐进分数和收敛值(alpha)时，可以在中位数跨越(alpha)时确定(a_k)。

[dfrac{p_{k-2}}{q_{k-2}},dfrac{p_{k-2}+p_{k-1}}{q_{k-2}+q_{k-1}},dfrac{p_{k-2}+2p_{k-1}}{q_{k-2}+2q_{k-1}},cdots,dfrac{p_{k-2}+a_kp_{k-1}}{q_{k-2}+a_kq_{k-1}}=dfrac{p_k}{q_k}]

　　继续回到前面的问题，现在知道渐进分数和中位数分布在收敛值的两侧，且每侧都是单调的。每侧相邻两个分数可以表示为(dfrac{P(r)}{Q(r)}=dfrac{p_kr+p_{k-1}}{q_kr+q_{k-1}})和(dfrac{P(r+1)}{Q(r+1)})，它们的差为(dfrac{1}{Q(r)Q(r+1)})，分子为1表明它们之间不可能有分母大于(Q(r+1))的分数，否则该分数与(dfrac{P(r)}{Q(r)})的差必然大于(dfrac{1}{Q(r)Q(r+1)})。所以最佳逼近必然只能取渐进分数及其中位数，显然渐进分数必然是最佳逼近，但中位数就不一定是了，它甚至都不一定是既约分数。

　　仔细比较公式（10）和（11），（11）明显比（10）更严格，如果把公式（12）也换成较严格的条件，会发生什么呢？为区别这两种逼近，满足公式（12）的称为第一类型最佳逼近，而满足公式（13）的称为第二类型最佳逼近。第二类型的最佳逼近当然肯定也是第一类型的，反之则不一定成立，第二类型将剔除掉所有中位数，得到让我们心怡的结论。

[left|{malpha-n} ight|<left|{m'alpha-n'} ight| ag{13}]

　　证明的重点都在于对公式（4）（9）的深度理解，相邻连分数之间再也插不进比它们分母小的分数。如果第二类型最佳逼近(dfrac{n}{m})在(dfrac{p_{k-1}}{q_{k-1}})和(dfrac{p_{k+1}}{q_{k+1}})之间，它必然在(dfrac{p_{k-1}}{q_{k-1}})和(dfrac{p_k}{q_k})之间，所以(m>q_k)且(left|{malpha-n} ight|<left|{q_kalpha-p_k} ight|<dfrac{1}{q_{k+1}})。而另一方面(left|{alpha-dfrac{n}{m}} ight|geqslantleft|{dfrac{p_{k+1}}{q_{k+1}}-dfrac{n}{m}} ight|geqslantdfrac{1}{mq_{k+1}})，矛盾，所以第二类型逼近只能是渐进分数。反之如果(k>s)，则利用误差估计（9）有(left|q_kalpha-p_k ight|leqslantdfrac{1}{q_{k+1}}<q_s+q_{s+1}<left|q_salpha-p_s ight|)，也就是说所有渐进分数都是第二类型逼近。所以除了特殊情况(alpha=x.5)外，第二类型渐进逼近和渐进分数是等价的。

　　渐进分数可以寻找最佳的有理逼近，它可以被用于齿轮制造、日历编撰等，另外还可以求对数的近似值（想想怎么算？）。

　　渐进分数是实数的逼近表示，那么局部商(a_i)的大小能否说明什么呢？笼统地说，它表示渐进分数离实数究竟有多近，即可以用来度量逼近。如何度量一个有理数对实数的逼近程度？研究误差和分母的关系是一个比较可行的方法，根据公式（9）有关系式（14）。这个关系式是对所有渐进分数都成立的，欲构造单个无限接近该误差的连分数是很容易的，所以该式不能被加强。该结论有两个扩展结论：（1）相邻两个渐进分数必有一个满足（15）式；（2）相邻三个渐进分数必有一个满足（16）式。而且考察([1,1,1,cdots])可知，该结论已经不能再扩展。

[left|{alpha-dfrac{p_k}{q_k}} ight|<dfrac{1}{q_k^2} ag{14}]

[left|{alpha-dfrac{p_k}{q_k}} ight|<dfrac{1}{2q_k^2} ag{15}]

[left|{alpha-dfrac{p_k}{q_k}} ight|<dfrac{1}{sqrt{5}q_k^2} ag{16}]

　　利用公式（9）容易得到以下估计式（17），该式说明了(a_k)越大，它所对应的渐进分数就“更好地”逼近连分数的值，而([1,1,1,cdots])则是最坏的数。关于逼近的度量还有很多结论，这里只是抛砖引玉，让大家有个概念，具体内容请参考相关资料。

[left|{alpha-dfrac{p_k}{q_k}} ight|<dfrac{1}{a_{k+1}q_k^2} ag{17}]

　　现在来看一个逼近度量的应用，由此窥见连分数理论在高等理论中的作用。考察(n)次代数数(alpha)，设它满足有理系数多项式(f(x)=(x-alpha)g(x))。易证(g(alpha) e 0)，取使(g(x) e 0)的区间，并设(left|{g(x)} ight|>M)。在区间上讨论(dfrac{p}{q}-alpha=dfrac{f(dfrac{p}{q})}{g(dfrac{p}{q})})，容易有(left|{dfrac{p}{q}-alpha} ight|>dfrac{1}{Mq^n})。进一步讨论既有刘维尔（Liouville）定理：对(n)次代数数(alpha)，存在正数(C)使得（18）式总成立。该定理指出了代数数的有理逼近性质，可以用它来轻松构造超越数（取适当(a_k)），刘维尔用它构造了第一个超越数(sumlimits_{k=1}^infty{10^{- k!}})。

[left|{alpha-dfrac{p}{q}} ight|>dfrac{C}{q^n} ag{18}]

4. 循环连分数

　　十进制循环小数是有理数，你可能好奇循环（periodic）连分数会有什么性质呢？首先，模仿循环小数，我们把循环连分数记作([a_0,cdots,a_{s-1},dot{a}_s,a_{s+1},cdots,dot{a}_k])。对于循环连分数，在进入循环节后总有(r_k=r_{k+l})，容易由归纳式得到一个二次方程，并进而知道该连分数是2次代数数。反过来，2次代数数的连分数，也必然是循环的，这个定理最初由拉格朗日证明。大概思路是考察余式的二次方程，发现它的系数有界，从而余式的个数有限，所以必然会出现循环。这里打算从另一个角度来证明这个定理，因为我们可以得到更多有趣的东西。

　　我们先从最简单的情况开始考虑，连分数(alpha=[dot{a}_0,cdots,dot{a}_n])称为纯循环连分数，并记(eta=[dot{a}_n,cdots,dot{a}_0])。考察由归纳公式形成的二次方程，并使用公式（8），容易证明(alpha)和(overline{alpha}=-dfrac{1}{eta})是同一整系数二次方程的根，它们互为共轭且满足条件（19）。容易知道二次代数数都有形式(r+ssqrt{D})，满足（19）的二次代数数称为既约的。可以证明(alpha)的余式(r_1)也是即约的，也容易知道对某个(D)即约二次代数数是有限的，故必有某个余式满足(r_k=alpha)，这就证明了即约二次代数数必是纯循环连分数。综合得到纯循环连分数和即约二次代数数是等价的。对于一般的二次代数数，用(alpha)的表达式来表示(r_k)，可以证明它迟早会成为即约的，所以循环节必将出现，故循环连分数和二次代数数也是等价的。

[alpha>1,quad -1<overline{alpha}<0 ag{19}]

　　容易证明(alpha=sqrt{D}+a_0)是即约的（(a_0)为(sqrt{D})的首项），记(alpha=[dot{2a}_0,cdots,dot{a}_n])。由以上结论可有(eta=-dfrac{1}{overline{alpha}}=[dot{a}_n,cdots,dot{2a}_0])，而(eta=dfrac{1}{alpha-2a_0}=[dot{a}_1,cdots,a_n,dot{2a}_0])，所以(a_1,cdots,a_n)对称。故有(alpha=[dot{2a}_0,a_1,a_2,cdots,a_2,dot{a}_1])，进而有表达式（20）。

[sqrt{D}=[a_0,dot{a}_1,a_2,cdots,a_2,a_1,dot{2a}_0] ag{20}]

【全篇完】