导数

一个实值函数的图像曲线。函数在一点的导数等于它的图像上这一点处之切线斜率

导数(英語:derivative)是微积分学中的一個概念。函数在某一点的导数是指这个函数在这一点附近的变化率(即函数在这一点的切线斜率)。导数的本质是通过极限的概念对函数进行局部的线性逼近。当函数的自变量在一点上产生一个增量时,函數输出值的增量與自變量增量的比值在趋于0时的極限如果存在,即為处的导数,记作。例如在运动学中,物体的位移对于时间的导数就是物体的瞬时速度[1]:153

导数是函数的局部性质。不是所有的函数都有导数,一个函数也不一定在所有的点上都有导数。若某函数在某一点导数存在,则称其在这一点可导(可微分),否则称为不可导(不可微分)。如果函数的自变量和取值都是实数的话,那么函数在某一点的导数就是该函数所代表的曲线在這一点上的切线斜率

对于可导的函数也是一个函数,称作导函数。寻找已知的函数在某点的导数或其导函数的过程称为求导(英語:differentiation)。反之,已知导函数也可以倒过来求原来的函数,即不定积分微积分基本定理说明了求原函数与积分是等价的[1]:372。求导和积分是一对互逆的操作,它们都是微积分学中最为基础的概念。

定义[编辑]

一般定义[编辑]

一個動畫,給出了一個直觀的導數概念,因為參數變化時函數的“擺動”會改變。

直觀上 代表函數值從 的變化量,那這樣,

代表的是從 的平均變化率,如果把 趨近於 ,似乎就可以更能貼切的描述函數值在 附近的變化。

以此為動機,若实函数 实数 有定義,且以下極限(注意這個表達式所定義的函數定義域不含

存在則称 可导,并称这个极限为 处的导数[2]:117-118,记为也可记作 [1]:154

根據函數極限的定義,導數定義部分的 "存在 使所有的 ,只要 都有...." 可以直觀的理解為 "當 趨近於 都有....",但要把它寫成嚴謹的定義,會碰到 "存在 對所有的實數 ,只要 都有...."這段敘述無法直接套入極限定義的問題,對此必須把以下的表達式

定義為導數原始極限表達式的簡記,而非另一種自動合法的導數定義。但如果存在 ,使 裡都有定義,那定義 為以

為定義域,然後以

為對應規則的函數,那以下的極限式

就可以把以 為自變數的偏差,將之趨近於零求導數的想法納入正式的運算裡。

几何意义[编辑]

当函数定义域和取值都在实数域中的时候,导数可以表示函数的曲线上的切线斜率。如右图所示,设为曲线上的一个定点,为曲线上的一个动点。当沿曲线逐渐趋向于点时,并且割线的极限位置存在,则称为曲线在处的切线。

若曲线为一函数的图像,那么割线(粉紅色)的斜率为:

处的切线(橘紅色),即的极限位置存在时,此时,则的斜率为:

上式与一般定义中的导数定义完全相同,也就是说,因此,导数的几何意义即曲线在点处切线的斜率。[2]:117[1]:153

导数、导函数与微分算子[编辑]

若函数 在其定义域包含的某区间 内每一个点都可导,那么也可以说函数区间 内可导,这时对于 内每一个确定的 值,都对应着 的一个确定的导数值,如此一来就构成了一个新的函数,这个函数称作原来函数 导函数[1]:155,记作: 或者 。值得注意的是,导数是一个数,是指函数 在点 处导函数的函数值。但在不至于混淆的情况下,通常也可以说导函数为导数。

由于对每一个可导的函数 ,都有它的导函数 存在,我们还可以定义将函数映射到其导函数的算子。这个算子称为微分算子,一般记作 [3]。例如:

由于微分算子的输出值仍然是函数,可以继续求出它在某一点的取值。比如说对于函数

所以

导数与微分[编辑]

微分也是一种线性描述函数在一点附近变化的方式。微分和导数是两个不同的概念。但是,对一元函数来说,可微与可导是完全等价的。可微的函数,其微分等于导数乘以自变量的微分,换句话说,函数的微分与自变量的微分之商等于该函数的导数。因此,导数也叫做微商。函数的微分又可记作[4]

历史[编辑]

导数和积分的发现是微积分发明的关键一步。17世纪以来,光学透镜的设计以及炮弹弹道轨迹的计算促使欧洲的数学家对曲线的切线进行研究。1630年代,法国数学家吉尔·德·罗伯瓦尔作出了最初的尝试[5]。与此同时,同是法国人的费马在计算切线时已经使用了无穷小量的概念[註 1][6]:52

如右图,费马考虑曲线 处的切线。他声称,对于切线,有以下的关系成立:

对上式变形后得到:

对于具体的函数 ,比如 ,费马计算 的值,并将 设为0,就得到 ,从而确定切线的斜率。可以看出,费马的方法实质上已经是求导。费马还给出了 多项式时切线的公式。英国的巴罗、荷兰的于德(Johnann Van Waveren Hudde)和瓦隆斯卢兹(René Francoiss Walther de Sluze)继续了费马的工作[7]。然而,费马和巴罗等人并没有将求导归纳为一种独立的工具,只是给出了具体的计算技巧[5]

1660年代,英国人伊萨克·牛顿提出了“流数”的概念。牛顿在写于1671年的《流数法与无穷级数》中对流数的解释是:“我把时间看作是连续的流动或增长,而其他的量则随着时间而连续增长。我从时间流动性出发,把所有其他量的增长速度称为流数。”也就是说,流数就是导数。牛顿将无穷小的时间间隔定义为“瞬间”(moment),而一个量的增量则是流数与瞬间的乘积。求导数时,牛顿将自变量和因变量两边展开,同时除以瞬间,再将剩下的项中含有瞬间的项忽略掉[6]:72。而在他的第三篇微积分论文中,牛顿使用了新的概念:最初比和最后比。他说:

相比于牛顿,德国数学家莱布尼兹使用了更清晰的记号来描述导数(见导数的记法一节)。他利用了巴罗的“微分三角形”概念,将自变量和因变量的增量记为 。他把 理解为“比任何给定的长度都要小”,而 则是 移动时 “瞬刻的增长”[6]:89。而导数则是两者之间的比例。他还研究了函数之和、差、积、商的求导法则。

伊萨克·牛顿爵士

牛顿和莱布尼兹的差别在于,牛顿将无穷小量作为求流数或导数的工具,而莱布尼兹则用无穷小量的比值来表示导数。这与二人的哲学思想差异有关[6]:92

微积分的理论面世后,遭到了有关无穷小量定义的攻击与质疑。导数的定义自然也包括在内。莱布尼兹和牛顿对无穷小量的认识都是模糊的。不仅如此,莱布尼兹甚至引入了,称其为“未消失的量”,用以进行求导前部的计算。在完成计算后再用“消失的量”来代替它们,并假定前两者之比等于后两者之比,认为这是一个不容置疑的真理[6]:102

许多数学家,包括伯努利兄弟、泰勒麦克劳林达朗贝尔拉格朗日欧拉都想要对微积分的严密性辩护或将微积分严密化。但受限于对无穷小量的认识,十八世纪的数学家并没有做出太大的成果。微积分的强烈抨击者,英国的乔治·贝克莱主教在攻击无穷小量时认为,流数实际上是“消失的量的鬼魂”,是0与0之比。欧拉承认后者,并认为0与0之比可以是有限值。拉格朗日则假定函数都可以展开为幂级数,并在此基础上定义导数[6]:154-156

十九世纪后,随着对函数连续性和极限的更深刻认识,微积分终于趋于严谨。波尔查诺是首先将导数定义为函数值的改变量与自变量增量之比在自变量增量无限接近0时趋向的量。波尔查诺强调导数不是0与0之比,而是前面的比值趋向的数[8]:10柯西在他的著作《无穷小分析教程概论》中也使用了同样的定义,并定义 为导数与 的乘积。这样,导数和微分的概念得到了统一[8]:11

导数的记法[编辑]

从微积分发轫至如今,不同的数学家都曾使用过不同的记号来表示函数的导数。部分记号至今仍然使用,成为现代的通用记法。

牛顿的记法[编辑]

作为微积分的发明人之一,牛顿在1704年著作中将导数用函数符号上方的点来表示。例如 的导数就记作,而二阶导数则记为[9]:193-196。他以后的数学家也会将用来表示函数的微分。牛顿的记法中没有明确自变量,因此 的导数在牛顿的著作中也会被记成,因为这可以理解为两个函数 对于另一个变量 的导数比[9]:196。而这个导数比(使用莱布尼兹的记号):

牛顿的记号多见于物理学或与之有关的方面,如微分方程中。以及直到现在,使用函数符号上加一点来表示某一变量的变化率(即对时间的导数)依然常见于各类物理学教材中(如使用来表示加速度等)。注意到对于高阶的导数,这种记法就无法表示了。

莱布尼兹的记法[编辑]

戈特弗里德·威廉·莱布尼茨

莱布尼兹在他的研究中分别使用 来表示函数自变量和應变量(输出值)的有限变化量,而使用 来表示“无限小”的变化量(即所谓的“无穷小量”)[10]。如果将函数记为的话,那么在莱布尼兹的记法下,其导数记为:

这个记法最早出现在莱布尼兹1684年的论文中[9]:204,莱布尼兹在之前的文章中会将 记成 ,把 记成 。莱布尼兹记法的好处是明确了自变量和應变量[11]。要注意的是记号是一个整体,也是,而可以看成一个整体,也可以不严谨地看成的比值[10]。此外, 表示的是导函数,在某一点 的导数则记为: 对于更高阶的导数(比如说n阶,见高阶导数一节),莱布尼兹的记法是:

这种记法是在1695年出现的[9]:205。这里的分子和分母不再具有单独的意义。莱布尼兹的记法中使用 来表示微分算子,比如说二阶的导数 就可以看成:

[11]

莱布尼兹记法的另一个好处是便于记忆导数计算的法则。例如链式法则(见导数的计算一节)应用莱布尼兹的记法就是:

可以想象为右边是两个分式的乘积,消去之后就变成左边[11]

由于牛顿和莱布尼兹之间关于微积分创始人称号的持久纠纷,在十八世纪早期的很长时间里,英国数学界与欧洲大陆的数学界分别采用牛顿和莱布尼兹的记号,泾渭分明。这种情况直到十八世纪后期才开始改变,随着拉格朗日记法的出现而变得多样化起来[9]:197-200

拉格朗日的记法[编辑]

另一种现今常见的记法是十八世纪拉格朗日于1797年率先使用的,以在函数的右上角加上一短撇作为导数的记号。函数 的导数就记作 [12]。二阶和三阶导数记为[9]:207。如果需要处理更高阶的导数,则用括号内的求导阶数n来代替短撇,记为:。当十九世纪的数学家柯西处理微分学时,他认为莱布尼兹的记法“模糊不便”,而采用更为“紧凑”的记法,将 记为。这种记法可说是拉格朗日记法的变种[9]:218。后来这种记法曾继续被精简为[13]

其它记法[编辑]

十九世纪以前,尽管大部分数学家会选择采用牛顿、莱布尼兹或拉格朗日的记号来表示导数,但也有很多的数学家希望使用自己的方法来记录。在不同数学家的著作中可以看到各种主流记法的混合或变体。数学家之间关于什么样的记法最为简便和严谨也是各执一词。同时,由于函数的微分、导数、偏导数以及无穷小量等概念尚未成熟,记号的不统一更增加了数学家之间相互理解的难度[9]:214-234。十九世纪初期的德国数学家马尔丹·欧姆采用来表示导数,而同时期的雅可比则采用来表示偏导数。同时许多数学家采用[14][15][16]表示偏导数。

用大写字母表示导数从十八世纪末就开始。1800年,法国数学家路易斯·弗朗索瓦·安托内·阿伯加斯特Louis François Antoine Arbogast)使用表示函数 的m阶导数或全微分[17]。而其后本杰明·佩尔斯也使用表示 的导数[18]。而柯西也采用类似的记号,用表示函数 的m阶偏导数[19]

函数可导的条件[编辑]

如果一个函数定义域为全体实数,即函数在上都有定义,那么该函数是不是在定义域上处处可导呢?答案是否定的。函数在定义域中一点可导需要一定的条件。首先,要使函数在一点可导,那么函数一定要在这一点处连续。换言之,函数若在某点可导,则必然在该点处连续。这个结论来自于连续性的定义。

证明

设函数上一点,函数在这一点可导,即存在,其中

所以: 即函数处连续。[2]:118

符号函数(sgn函数)是一个不连续的函数在断点处不可导的例子:

符号函数

首先注意到这个函数在处不连续。作为验证,可以求出函数在处附近的变化率,根据函数可导的条件再进行判断:

该函数在左侧附近的变化率为:
时,上面的比值趋于正无穷大发散,不存在,故这个符号函数在处不可导。

然而,连续性并不能保证可导性。即使函数在一点上连续,也不一定就在这一点可导。事实上,存在着在每一点都连续,但又在每一点都不可导的“病态函数”。1931年,斯特凡·巴拿赫甚至证明,事实上“绝大多数”的连续函数都属于这种病态函数(至少在一点可导的连续函数在所有连续函数中是贫集[20]。在连续而不可导的函数里,一种常见的情况是,函数在某一点连续,并且可以定义它的左导数和右导数:

左导数:[2]:118[1]:155
右导数:[2]:118[1]:155

然而左导数和右导数并不相等,因而函数在该处不可导。实际上,若函数导数存在,则必然可以推出左右导数相等,这是由极限的性质(极限存在则左右极限相等)得来:

下面以绝对值函数作为例子:

绝对值函数

该函数在处的左导数为:

该函数在处的右导数为:

绝对值函数在处的左右导数皆存在,但由于左右导数不相等,故绝对值函数在处不可导。[2]:118-119

如果函数在一点的左右导数都存在并且相等,那么函数在该处可导。[1]:155

导数与函数的性质[编辑]

通过认识可导函数的导数,可以推断出不少函数本身的性质。

单调性[编辑]

x变化时函数(蓝色曲线)的切线变化。函数的导数值就是切线的斜率,绿色代表其值为正,红色代表其值为负,黑色代表值为零。

根据微积分基本定理,对于可导的函数,有:

如果函数的导函数在某一区间内恒大于零(或恒小于零),那么函数在这一区间内单调递增(或单调递减),这种区间也称为函数的单调区间。导函数等于零的点称为函数的驻点(或极值可疑点),在这类点上函数可能会取得极大值或极小值。进一步判断则需要知道导函数在附近的符号。对于满足 的一点 ,如果存在 使得 在区间 上都大于等于零,而在区间 上都小于等于零,那么 是一个极大值点,反之则为极小值点[2]:170。如果 並且 改變加減號,則称这个点是拐点;否則这个点不是拐点[21]:200

如果函数在 处的二阶导数 存在,极值点也可以用它的正负性判断(已确定)。如果,那么 是一个极小值点,反之为极大值点[2]:170-171

凹凸性[编辑]

可导函数的凹凸性与其导数的单调性有关。如果函数的导函数在某个区间上单调递增,那么这个区间上函数是向下凸的,反之则是向上凸的。如果二阶导函数存在,也可以用它的正负性判断,如果在某个区间上 恒大于零,则这个区间上函数是向下凸的,反之这个区间上函数是向上凸的[2]:176-178

导数的计算[编辑]

原则上,函数的导数可以通过考虑差商和计算其极限来从定义计算。在实践中,一旦知道了一些简单函数的导数,就可以使用从更简单的函数获得更复杂函数的导数的规则,来更容易地计算其他函数的导数。

基本函数的导数[编辑]

所谓基本函数是指一些形式简单并且容易求出导数的函数。这些基本函数的导函数可以通过定义直接求出。

其中是任意实数,那么

函数的定义域可以是整个实数域,但导函数的定义域则不一定与之相同。例如当 时:

[2]:119

导函数的定义域只限所有正实数而不包括0。需要注意的是,不会有多项式函数的导数为。当 时,常函数的导数是0。

  • 底数为指数函数 的导数还是自身: 而一般的指数函数 的导数还需要乘以一个系数:[2]:122

自然对数函数的导数则是 [2]:123 同样的,一般的对数函数导数则还需要乘以一个系数:

  • 三角函数的导数仍然是三角函数,或者由三角函数构成[2]:122:

导数的求导法则[编辑]

由基本函数的和、差、积、商或相互复合构成的函数的导函数则可以通过函数的求导法则来推导。基本的求导法则如下:

  • 求导的线性性:对函数的线性组合求导,等于先对其中每个部分求导后再取线性组合。
(其中为常数)[2]:121
  • 两个函数的乘积的导函数,等于其中一个的导函数乘以另一者,加上另一者的导函数与其的乘积
[2]:125
  • 两个函数的商的导函数也是一个分式。其中分子是分子函数的导函数乘以分母函数减去分母函数的导函数乘以分子函数后的差,而其分母是分母函数的平方。
(在处方有意义)[2]:126
[2]:128

若要求某个函数在某一点的导数,可以先运用以上方法求出这个函数的导函数,再看导函数在这一点的值。

例子[编辑]

欲求函数

处的导数。可以先求出其导函数:

其中第二项使用了复合函数的求导法则,而第三项则使用了乘积的求导法则。求出导函数后,再将代入,得到导数为:

高阶导数[编辑]

二阶导数[编辑]

如果函数的导数处可导,则称的二阶导数。记做:[2]:132

二阶导数可用于求解函数凹凸性问题。 函数在x上凹。 函数在x下凹。

高阶导数[编辑]

二阶导数的导数称为三阶导数,记做

三阶导数的导数称为四阶导数,记做

一般的阶导数的导数称为阶导数,记为[2]:133

高阶导数的求法[编辑]

一般来说,高阶导数的计算和导数一样,可以按照定义逐步求出。同时,高阶导数也有求导法则:

  • 莱布尼兹公式[2]:134

因此,可以利用已知的高阶导数求导法则,通过四则运算, 变量代换等方法,求出阶导数。一些常见的有规律的高阶导数的公式如下[2]:133

多元函数的导数[编辑]

向量值函数的导数[编辑]

当函数 的取值不再是实数,而是一般的中的向量时,仍然可能对其求导。这时的函数值是:。每个 都是一个实数值的函数。具体的例子如二维或者三维空间里的参数方程。因此,对 求导实际上是对每个分量函数 求导。

[2]:191

这也符合定义

的一组,那么对函数:

其导函数为:

偏导数[编辑]

如果有函数 其自变量不是单个实数,而是多于一个元素,例如:

这时可以把其中一个元素(比如 )看做参数,那么 可以看做是关于另一个元素的参数函数:

也就是说,对于某个确定的 ,函数 就是一个关于 的函数。在 固定的情况下,可以计算这个函数 关于 的导数。

这个表达式对于所有的 都对。这种导数称为偏导数,一般记作:

这里的符号 ∂ 是字母 的圆体变体,一般读作 的首音节或读“偏”,以便与 区别。

更一般地来说,一个多元函数