我猜题主是想问高阶微分的含义。二阶导数写成 \frac{\mathrm{d}^2y}{\mathrm{d}x^2} 这种形式确实跟高阶微分有一定关系,但又有它的局限性。我在下面的解释中会介绍无穷分阶数域、高阶微分的含义和完整形式、以及完整形式下高阶微分的形式不变性等内容。看完就明白了。
首先,我们要搞清楚无穷小的概念。牛顿和莱布尼茨当年创立微积分时,都把无穷小当成一种数。他们的意思是, 无穷小是一种无限靠近0而又不是0的数 。但这个说法不够精确,令人难以理解。他们有时把无穷小当作0舍去,有时又用无穷小来做分母,所以当时很多人搞不清楚无穷小到底和0有什么区别,觉得无穷小是一种不可捉摸的东西。也正是因为这个原因,使得微积分在创立之初,便受到贝克莱大主教等人的攻击。
直到19世纪,德国数学家魏尔斯特拉斯提出ε-δ语言,才使无穷小得到了严格的定义。
定义 设函数f(x)在x0的某一去心邻域内有定义(或|x|大于某一正数时有定义)。如果对于任意给定的正数ε(不论它多么小),总存在正数δ(或正数X),使得对于适合不等式0<|x-x0|<δ(或|x|>X)的一切x,对应的函数值f(x)都满足不等式
|f(x)|<ε,
那么称函数f(x)当x→x0(或x→∞)时为无穷小。
ε-δ定义也就是说:「如果x向x0奔跑时f(x)向0奔跑,那么f(x)就是一个无穷小。」如果我们令f(x) = x,并令x0 = 0,那么显然f(x)满足ε-δ定义,因此当x→x0时,f(x)是一个无穷小,或者说当x→0时,x是一个无穷小。这就是说,任何一个向0奔跑的变量都是一个无穷小。因此,ε-δ定义本质上是说: 无穷小是一个向0奔跑的变量 。
我们知道,变量之间可以具有函数关系。既然无穷小是一种变量,那么无穷小之间也可以具有函数关系。设两个无穷小x和y之间具有单调函数关系,那么在它们向0奔跑的过程中,它们的取值是一一对应的。例如,当x = 0.12时,y可能等于0.08;当x = 0.06时,y可能等于0.002;等等。而我们真正关心的是,在x和y无限逼近0的过程中,它们的比例关系所趋向的极限。有以下四种情形:
●情形1:如果x/y→0,那么x是y的「高阶无穷小」,y是x的「低阶无穷小」。此时,在向0奔跑的过程中,x在y面前变得越来越微不足道。打个比方,当y相当于一个西瓜大小时,x相当于一个核桃大小,当y缩小到核桃那么大时,x已经缩小到一个细菌那么大了。也就是说,越接近0,x和y的相对大小就越悬殊,并且这种悬殊差距会无限拉大。
●情形2:如果y/x→0,那么x是y的「低阶无穷小」,y是x的「高阶无穷小」。此时,在向0奔跑的过程中,y在x面前变得越来越微不足道。
●情形3:如果x/y→B,其中B为非零常数,那么x和y是「同阶无穷小」。此时,在向0奔跑的过程中,x和y的比值趋向于常数B。
●情形4:如果x/y→1,那么x和y是「等价无穷小」。这是同阶无穷小的特例。此时,在向0奔跑的过程中,x和y的比值趋向于1。
也就是说,虽然我们考察的是变量向0奔跑的过程,但这只是一种辅助手段,我们真正关心的是两个无穷小变量在奔跑终点处的比例关系。如果直接在奔跑终点处计算比例关系的话,那么就是0比0,没法计算,所以只能通过考察变量向0奔跑的过程来求极限处的比例关系。
既然x和y在向0奔跑的终点处可以具有比例关系,那么x和y的奔跑终点应该不是0,而是一种无限靠近0的数。这样一来,无穷小又成了牛顿和莱布尼茨描述的那种无限靠近0而又不是0的数。我们借助向0奔跑的变量,在这种不可捉摸的数之间建立起了比例关系,从而使得这种数互相之间可以定量地比较大小。这样一来,这些数不再是不可捉摸的了,完全可以建立起一个新的数域来!
根据x和y的四种大小关系可以知道,这种无穷小数域中的数应该具有「阶」和「权」两个属性。例如,当x→0时,2sinx、3.5tanx、5x都是x的同阶无穷小,它们的大小比例为2 : 3.5 : 5,而2(1-cosx)和 -2x^2 则都是x的高阶无穷小。如果规定x是权值为1的一阶无穷小,那么2sinx、3.5tanx、5x分别是权值为2、3.5、5的一阶无穷小,2(1-cosx)和 -2x^2 分别是权值为1和-2的二阶无穷小, 6x^3 是权值为6的三阶无穷小, 7x^{2.8} 是权值为7的2.8阶无穷小。这些无穷小都是无限靠近0而又不是0的数。这样,通过「阶」和「权」这两个属性,就建立起了一个无穷小数域,将所有的无穷小都包括了进来。
既然无穷小不是0,那么它们可以取倒数。无穷小的倒数就是无穷大。如果规定x是权值为1的一阶无穷小,那么1/x、3.5/x、-2/x分别是权值为1、3.5、-2的一阶无穷大,1/(1-cosx)是权为2的二阶无穷大, 4.3/x^3 是权为4.3的三阶无穷大, 2.2/x^{3.6} 是权值为2.2的3.6阶无穷大。这样一来,我们又得到一个无穷大数域,它可以和上述无穷小数域合并成一个数域。也就是说,把无穷大看作阶为负数的无穷小,把无穷小看作阶为负数的无穷大。
我们还可以把有限实数也包括到这个新数域中,也就是说,把实数看作0阶无穷大或0阶无穷小,而实数的数值就是它的权值。
这种新数域可以命名为「 无穷分阶数域 」。因为其中的数都具有阶和权两个属性,所以可以用平面直角坐标系来描述这个数域,如图1所示。图1中的点A到点H都代表无穷分阶数域中的数,点A、B、C、D、E是无穷小,点F、G、H是无穷大。通过它们的纵坐标和横坐标可以知道它们各自的阶和权。
我们还可以建立起一套符号系统。将权值为 a 的m阶无穷小记为 a(0)^m ,它也可以看成权值为 a 的-m阶无穷大。将权值为 a 的m阶无穷大记为 a(\infty)^m ,它也可以看成权值为 a 的-m阶无穷小。
图2左边是一个边长为1的正立方体,我们将它均匀地切成无穷多片,右边展示了其中一片。那么,每一片的体积可以规定为权值为1的一阶无穷小,即 (0)^1 ,于是总片数就是权值为1的一阶无穷大,即 (\infty)^1 。这无穷多片的体积之和,就是正立方体的体积。也就是说,权值为1的一阶无穷小乘以权值为1的一阶无穷大,结果为1,即
(0)^1\times(\infty)^1=1 。
因为图2中每一片的体积是权值为1的一阶无穷小 (0)^1 ,所以如果将每一片再均匀切成无穷多条,如图3左边所示,那么每一条的体积就是一个权值为1的二阶无穷小,即 (0)^2 。因为总片数和每一片被切成的条数都是权值为1的一阶无穷大,即 (\infty)^1 ,所以正立方体被切成的总条数是一个权值为1的二阶无穷大,即 (\infty)^1\times(\infty)^1=(\infty)^2 。正立方体的体积等于这无穷多个切条的体积之和。也就是说,权值为1的二阶无穷小乘以权值为1的二阶无穷大等于1,即
(0)^2\times(\infty)^2 =1 。
如图3右边所示,如果继续将每一条均匀切成无穷多块,那么每一块的体积是权值为1的三阶无穷小 (0)^3 ,正立方体被切成的总块数是权值为1的三阶无穷大 (\infty)^3 。这无穷多块的体积之和,就是正立方体的体积。因此,权值为1的三阶无穷小乘以权值为1的三阶无穷大等于1,即
(0)^3\times(\infty)^3=1 。
因为无穷小是无限靠近0的数,所以有限值和无穷小相加时,无穷小不起作用。例如,图2中正立方体的体积加上一个切片的体积,仍然等于正立方体的体积,即
1+(0)^1 = 1 。
类似地,低阶无穷小和高阶无穷小相加时,高阶无穷小不起作用。例如图3左边,切片的体积是 (0)^1 ,将这个切片均匀切成 (\infty)^1 个切条,则每个切条的体积是 (0)^2 。如果给这个切片增加一个切条,那么切片的体积并不会增加,即
(0)^1 + (0)^2 = (0)^1 。
类似地,无穷大和有限值相加时,有限值不起作用。例如,图3左边一个切片被分成 (\infty)^1 个切条,如果再加上一个切条,那么总共还是 (\infty)^1 个切条,即
(\infty)^1+1=(\infty)^1 。
无穷小与实数0是不同的,因为一阶无穷大个0加起来还是0,例如
0\times(\infty)^1 = 0 ,
而一阶无穷大个一阶无穷小求和却得到一个有限值,例如
(0)^1\times(\infty)^1 = 1 。
在图1所示的无穷分阶数域中,将相同阶上的点连成数轴,便得到各阶无穷大数轴和各阶无穷小数轴,如图4所示。这些数轴都与实数轴平行,且每一条数轴上的数都具有与实数类似的运算性质,只不过每一条数轴上的单位不同。例如,二阶无穷大数轴上的数都以 (\infty)^2 为单位;一阶无穷大数轴上的数都以 (\infty)^1 为单位;一阶无穷小数轴上的数都以 (0)^1 为单位;二阶无穷小数轴上的数都以 (0)^2 为单位;实数轴上的数都以1为单位,1也可以看作零阶无穷大 (\infty)^0 或零阶无穷小 (0)^0 。
这样,无穷小和无穷大都彻底变成了数,不仅可以进行它们的运算,而且还可以用它们来解释定积分的含义。如图5所示,如果想求曲线CD下方的面积,那么可以将该面积切分成无穷多个竖直的窄条,然后再对所有窄条的面积求和。图中阴影部分示意了其中一个窄条。如果认为每个窄条的宽度都相等,那么可以规定每个窄条的宽度都是权值为1的一阶无穷小,即 (0)^1 。于是每个窄条的面积都是一个一阶无穷小,权值等于曲线CD上对应点的纵坐标。因为这无穷多个窄条的宽度之和等于图中点B和点A的x坐标之差,也就是3,所以总共有 3/(0)^1 = 3(\infty)^1 个窄条,这是一个权值为3的一阶无穷大。因此曲线CD下方的面积等于一阶无穷大个权值互不相同的一阶无穷小之和,这就是定积分的含义。
用无穷分阶数域将无穷小和无穷大都变成数之后,接下来就可以研究微分和高阶微分了。
我们都知道,微分是一种无穷小。设y=f(x),x=h(t),那么当以x为自变量时,y的微分为
dy = f'(x)dx ;(1)
当以t为自变量时,x的微分为
dx = h'(t)dt ,(2)
y的微分为
dy = f'(x)h'(t)dt = f'(x)dx 。(3)
式(1)中的dx代表x自身的无穷小增量,而式(2)和式(3)中的dx则代表由t的无穷小增量引起的x的微分,即h'(t)dt。因此,在这三个式子中,dx具有两种不同的含义。同理,dy也具有两种不同的含义:式(1)中的dy代表由x的无穷小增量引起的y的微分,而式(3)中的dy则代表由t的无穷小增量引起的y的微分。
如果用ε-δ定义来理解无穷小,也就是将无穷小看成向0奔跑的变量,那么式(1)和式(3)中的dy都是向0奔跑的变量,并且这两个dy在向0奔跑的过程中一般是不相等的。同理,式(1)中的dx和式(3)中的dx在向0奔跑的过程中一般也是不相等的。但是式(1)和式(3)中的dy都可以表示成f'(x)dx这种形式,这种现象被称作「微分形式的不变性」。言外之意就是,微分的含义改变了,只是形式不变而已。
然而,式(1)中的dy和式(3)中的dy在向0奔跑的过程中,比值是趋向于1的,也就是说它们是等价无穷小。在奔跑到终点之后,作为无限靠近0而又不等于0的数,或者说作为无穷分阶数域中的数,这两个dy是完全相等的,具有相同的阶和权。同理,式(1)中的dx和式(3)中的dx也是等价无穷小,它们到达奔跑终点后,也是无穷分阶数域中相等的数,具有相同的阶和权。这样一来, 有了无穷分阶数域之后,微分不光具有形式的不变性,而且具有了含义的不变性! 微分可以看作一阶无穷小数轴上的数。在这个观点下,任何一个变量的微分,都等于它自身的无穷小增量,与谁是自变量无关!
作为实数轴上的变量,x在每一个点处产生的微分dx都是一阶无穷小数轴上的数,这些不同位置上的dx可以具有相同的权值,也可以具有不同的权值。如果不同点处的dx具有不同的权值,那么dx就成为x的函数,例如可以设dx = u(x)(0)^1 。这样一来,当x再次在各处产生无穷小增量时,作为x的函数,dx当然也会随之产生无穷小增量,而这个无穷小增量很自然地就位于图4中的二阶无穷小数轴上。这就是x的二阶微分 \mathrm{d}^2x 啊!
也就是说,变量的一阶微分可以成为变量自身的函数。在此基础上,一阶微分的微分,就是变量的二阶微分,它位于图4中的二阶无穷小数轴上。
再回过头来看dy = f'(x)dx这个式子。当dx是x的函数时,dy也是x的函数。比如,当dx = u(x)(0)^1 时,dy = f'(x)u(x)(0)^1 。因此,当x再次在各处产生无穷小增量时,等式dy = f'(x)dx两边都随之产生无穷小增量。根据微分的运算法则d(uv) = vdu + udv,可知 \mathrm{d}^2y = d(dy) = d(f'(x)dx) = dxdf'(x) + f'(x)d(dx) = f''(x)\mathrm{d}x^2+f'(x)\mathrm{d}^2x 。因此有
\mathrm{d}^2y=f''(x)\mathrm{d}x^2+f'(x)\mathrm{d}^2x 。 (4)
这就是二阶微分 \mathrm{d}^2y 的完整形式,它是具有形式不变性的!即使以t做自变量,存在x = h(t)这一层关系,等式(4)仍然是成立的!
传统上,人们总是规定自变量在各处产生的微分相等。如果以x为自变量,规定dx在各处相等,那么dx就成为一阶无穷小数轴上的常数,从而 \mathrm{d}^2x = d(dx) = 0。这样一来,等式(4)就变成了
\mathrm{d}^2y=f''(x)\mathrm{d}x^2 。 (5)
于是,等式(5)两边同除以 \mathrm{d}x^2 ,就得到了
f''(x) = \frac{\mathrm{d}^2y}{\mathrm{d}x^2} (6)
这个式子。
在数学分析教科书上,直接把等式(5)作为二阶微分 \mathrm{d}^2y 的定义式,如图6所示。并不只是某一个版本的数学分析教科书这样写,几乎所有的数学分析教科书上都是这样写的。就连1958年出版的吉米多维奇的【数学分析习题集】里,也是这样定义高阶微分的,如图7、图8、图9所示。可见,这是一个传统的定义。
但是显然,这个定义是有局限性的,因为它只在「dx在各处相等」这个前提下成立,在一般情况下是不成立的。所以数学分析教科书上认为高阶微分不具有形式的不变性。
问题就出现在「dx在各处相等」这个假设上。事实上,dx在各处完全可以不相等。如果以t为自变量,设x = h(t),并令dt在各处相等,不妨规定dt = (0)^1 ,那么dx = h'(t)dt = h'(t)(0)^1 。显然,此时dx在各处一般是不相等的。此时等式(5)不再成立,而等式(4)仍然成立。事实上,即使以t为自变量,也完全可以令dt在各处不相等,在这种情况下,等式(4)仍然是成立的。因此,等式(4)才是二阶微分 \mathrm{d}^2y 的完整表达形式,它是具有形式不变性的。
数学分析教科书上之所以对高阶微分采用了等式(5)这样的有局限性的定义方法,是历史遗留下来的问题。一方面,当年莱布尼茨祖师是这样推导的。另一方面,自从魏尔斯特拉斯提出ε-δ语言后,无穷小就被当成向0奔跑的变量来研究了,而在这种框架下,想研究「微分的微分」是非常困难的。
因此二阶导数写成 \frac{\mathrm{d}^2y}{\mathrm{d}x^2} 这种形式,只能看成是一种历史遗留下来的习惯。在这种习惯表达下, \frac{\mathrm{d}^2y}{\mathrm{d}x^2} 必须看作一个整体符号,上下不可拆分。如果要考虑二阶微分 \mathrm{d}^2y 的独立意义,那么y对x的二阶导数 f''(x) 应该表示为
f''(x) = \frac{\mathrm{d}^2y}{\mathrm{d}x^2} - \frac{\mathrm{d}y}{\mathrm{d}x}\frac{\mathrm{d}^2x}{\mathrm{d}x^2} 。 (7)
事实上,等式(7)和等式(4)是等价的。只需在等式(4)两边同除以 \mathrm{d}x^2 即可得到等式(7)。等式(7)中的\frac{\mathrm{d}^2y}{\mathrm{d}x^2} 和\frac{\mathrm{d}^2x}{\mathrm{d}x^2} 才是上下可拆分的。
顺便说一句,高阶微分同微分一样,不仅具有形式的不变性,而且具有含义的不变性。关于无穷分阶数域和高阶微分的详细研究,请看知乎文章【具有形式不变性的高阶微分】:https:// zhuanlan.zhihu.com/p/70 866374
这篇文章更全面深入,不仅讨论了高阶微分在实际问题中的几何意义,甚至还讨论了直接由高阶微分构成的微分方程。
-----------------------------------------
补充说明两点:
(1)我是昨天(2019年6月29日)才知道,原来早在1960年,德国数学家鲁滨逊就严谨地提出了超实数域,并在此基础上创立了「非标准分析」这个数学分支。我对非标准分析了解得还太少,目前仅凭从百度和知乎上搜到的描述性信息来看,超实数域是一种将无穷小、无穷大与实数统一到一起的数域。单从这一点上来看,或许无穷分阶数域就是超实数域的一种。超实数域和非标准分析是建立在严格的数学论证和一系列的定理基础上的,好像有点像康托教授的集合论。相比之下,无穷分阶数域则简单又直观。但是感觉上,无穷分阶数域应该属于非标准分析的范畴。
无穷分阶数域和高阶微分这套东西,是我在北航读本科时冥思苦想搞出来的,当时是2002年末。这么多年,我一直以为这是一个孤立的创造,现在看来是找到组织了。下一步准备拜读一下鲁滨逊的非标准分析著作,向组织靠拢。
(2)关于高阶微分,我只能自不量力地呼吁一下,现有的数学分析教科书中那种不具有形式不变性的高阶微分定义方法早该淘汰了。不具有形式不变性的高阶微分,放在数学分析教科书中,简直是一个败笔。为了微积分的完整性和优美性,该为高阶微分正名了。
---------------------
2019年7月7日补充:
(3)对无穷分阶数域里的运算律感兴趣的同学,可以看看文章【具有形式不变性的高阶微分】https:// zhuanlan.zhihu.com/p/70 866374 。其中有一节专门讲运算律。这些运算律都是从微积分的计算中抽象出来的。在定积分中,略去高阶项,只对最低阶的无穷小进行累加,其原理就是「异阶相加」这条运算律。
(4)有数学专业的同学指出,「无穷分阶数域」里的运算律,特别是「等价相减」,并不满足数学里对「域」的定义,所以不能叫做域。我想也许改称「无穷分阶数集」更合适。
2019年7月29日补充:
(5)莱布尼茨把二阶导数写为二阶差商的极限。他对自变量 x 考察三个值: x 、 x_1=x+h 、 x_2=x_1+h ,对应的函数值分别为 f(x) 、 f(x_1) 、 f(x_2) . 记 h=\Delta x 、 y_1-y=\Delta y 、 y_2-y_1=\Delta y_1 . 记 (y_2-y_1)-(y_1-y) =\Delta y_1-\Delta y =\Delta(\Delta y)=\Delta ^2y . 那么,二阶差商为
\frac{1}{h}\left ( \frac{y_2-y_1}{h} -\frac{y_1-y}{h}\right) =\frac{1}{h^2}\left[ (y_2-y_1)-(y_1-y) \right] =\frac{\Delta ^2y}{(\Delta x)^2} .
从而二阶导数为 f''(x)=\lim_{\Delta x \rightarrow 0}{\frac{\Delta ^2y}{(\Delta x)^2}} . (8)
在这个推导过程中,莱布尼茨将x在不同位置的增量都设为h,这也就是说,他将不同位置的dx看成是相等的,所以才得到了等式(8)。而「相等」是「不相等」的特例,因此只有假设不同位置的dx不相等,才具有一般意义。此时,该推导过程应该做如下修改。
对自变量x考察三个值: x 、 x_1=x+h 、 x_2=x_1+(h+\Delta h) . 也就是说,不同位置具有不同的增量:从 x 到 x_1 ,增量为 h ;从 x_1 到 x_2 ,增量为 h+\Delta h ,其中 \Delta h 是增量的增量。此时,二阶差商为
\frac{1}{h}\left ( \frac{y_2-y_1}{h+\Delta h} -\frac{y_1-y}{h}\right) . (9)
根据 \frac{1}{x+\mathrm{d}x}-\frac{1}{x}=\mathrm{d}\left( \frac{1}{x} \right)=\frac{-1}{x^2}\mathrm{d}x 可知,当x位于分母上时,x的无穷小增量dx会使分式 \frac{1}{x} 产生无穷小增量 \frac{-1}{x^2}\mathrm{d}x 。也就是说, \frac{1}{x+\mathrm{d}x}=\frac{1}{x}-\frac{1}{x^2}\mathrm{d}x 。 将x换成h,将dx换成 \Delta h ,就得到当 \Delta h \to 0 时,
\frac{y_2-y_1}{h+\Delta h} \to (y_2-y_1)\left( \frac{1}{h}-\frac{1}{h^2}\Delta h \right) .
因此,当 \Delta h \to 0 时,式(9)所表示的二阶差商趋向于
\frac{1}{h}\left ( (y_2-y_1)\left( \frac{1}{h}-\frac{1}{h^2}\Delta h \right) -\frac{y_1-y}{h} \right) ,
即 \frac{1}{h}\left ( \frac{y_2-y_1}{h} -\frac{y_1-y}{h} \right) -\frac{y_2-y_1}{h} \cdot \frac{\Delta h}{h^2} ,
即 \frac{\Delta ^2y}{h^2}-\frac{\Delta y_1}{h} \cdot \frac{\Delta h}{h^2} . (10)
因为 h=\Delta x ,所以 \Delta h=\Delta(\Delta x)=\Delta ^2 x ,从而式(10)即
\frac{\Delta ^2y}{(\Delta x)^2}-\frac{\Delta y_1}{\Delta x} \cdot \frac{\Delta ^2x}{(\Delta x)^2} .
于是,将二阶导数表示为二阶差商的极限,则立得
f''(x) =\lim_{\Delta x \to 0}{\left (\frac{\Delta ^2y}{(\Delta x)^2}-\frac{\Delta y_1}{\Delta x} \cdot \frac{\Delta ^2x}{(\Delta x)^2} \right)} =\lim_{\Delta x \to 0}{ \frac{\Delta ^2y}{(\Delta x)^2} } - \lim_{\Delta x \to 0}{ \frac{\Delta y_1}{\Delta x} } \cdot \lim_{\Delta x \to 0}{ \frac{\Delta ^2x}{(\Delta x)^2} } =\frac{\mathrm{d} ^2y}{\mathrm{d} x^2}-\frac{\mathrm{d} y}{\mathrm{d}x} \cdot \frac{\mathrm{d} ^2x}{\mathrm{d} x^2} .
可见,我们又一次得到了等式(7),这才是具有一般意义的二阶导数表达式。
可能有同学对上式中的 \lim_{\Delta x \to 0}{ \frac{\Delta y_1}{\Delta x} } = \frac{\mathrm{d} y}{\mathrm{d}x} 感到疑惑。因为 \Delta y_1=y_2-y_1 ,所以按导数定义来讲,应该是 \lim_{x_2 \to x_1}{ \frac{\Delta y_1}{x_2-x_1} } = \frac{\mathrm{d} y}{\mathrm{d}x} . (11)
但是注意到 x_1-x=h 和 x_2-x_1=h+\Delta h 都是无穷小,并且它们相差一个高阶无穷小 \Delta h ,所以 x_1-x 和 x_2-x_1 是等价无穷小,所以式(11)中分母上的 x_2-x_1 可以用 x_1-x 替换。因此也有 \lim_{x_1 \to x}{ \frac{\Delta y_1}{x_1-x} } = \frac{\mathrm{d} y}{\mathrm{d}x} ,即 \lim_{\Delta x \to 0}{ \frac{\Delta y_1}{\Delta x} } = \frac{\mathrm{d} y}{\mathrm{d}x} .
注意这里得到的 \frac{\mathrm{d} y}{\mathrm{d}x} 其实是点 x_1 处的导数值。但是因为当 \Delta x \to 0 时 x_1 \to x ,所以在导数连续的前提下,当 \Delta x \to 0 时,这个 \frac{\mathrm{d} y}{\mathrm{d}x} 也就趋向于点 x 处的导数值。