微积分基础知识

概述

导数和偏导数都是微积分中的基本概念,它们用于描述函数在某一点的变化率。

  1. 导数:当我们讨论一个函数的导数时,通常指的是这个函数在某一点上的瞬时变化率。如果函数是单变量函数(例如y=f(x)),那么它的导数f'(x)表示的是当x发生微小变化时,y的相应变化量与x的变化量之比的极限。换句话说,导数给出了函数图形在某点的切线斜率。导数的概念对于理解函数的增减性、极值、凹凸性等性质非常重要。

  2. 偏导数:偏导数是在多变量函数中引入的概念。当函数依赖于两个或更多个变量时(例如z=f(x,y)),我们可以通过固定其他变量,只让其中一个变量变化来计算该变量对函数值的影响。这种影响的度量就是偏导数。偏导数表示了函数在某一特定点上,当仅考虑其中一个自变量变化时的瞬时变化率。例如,如果我们要计算函数z=f(x,y)关于x的偏导数,我们保持y不变,只让x变化,然后计算z相对于x的变化率。

导数和偏导数都是微积分的核心工具,广泛应用于数学、物理、工程、经济学等多个领域,帮助我们理解和预测各种现象的变化规律。

导数

导数

求一个函数的导数是微积分中的基本操作之一,它表示函数在某一点上的瞬时变化率。导数的几何意义是在该点处的切线斜率。

函数 $f(x)$ 在点 $x=a$ 处的导数 $f'(a)$ 定义为当 $h$ 趋向于0时,差商 $\frac{f(a+h)-f(a)}{h}$ 的极限,如果这个极限存在的话。即,

$$ f'(a) = \lim_{h \to 0} \frac{f(a+h) - f(a)}{h} $$

这个定义被称为导数的“极限定义”。但是,在实际计算中,我们通常使用一些导数的基本规则和公式,因为直接使用极限定义求导数往往是繁琐的。

让我们以一个具体的函数为例,比如 $f(x) = x^2$。我们将先使用极限定义来求 $f(x)$ 在任意点 $x$ 的导数,然后使用导数的基本规则来验证这个结果。

首先,使用极限定义求 $f(x) = x^2$ 在任意点 $x$ 的导数。使用极限定义,我们得到函数 $f(x) = x^2$ 在任意点 $x$ 的导数为 $2x$

接下来,我们将使用导数的基本规则——在这个案例中是幂规则——来验证这个结果。幂规则指出,如果 $f(x) = x^n$,那么 $f'(x) = nx^{n-1}$。让我们应用这个规则来看看是否得到相同的结果。使用导数的幂规则,我们同样得到函数 $f(x) = x^2$ 的导数为 $2x$。这与我们使用极限定义得出的结果一致。

这表明,对于函数 $f(x) = x^2$,其导数 $f'(x) = 2x$,意味着函数的瞬时变化率随 $x$ 的值线性增加。例如,当 $x=3$ 时,函数的瞬时变化率为 $6$。这就是求函数导数的基本方法及示例过程。

偏导数

对于二元或更高维度的函数,单个的“导数”概念不再适用,取而代之的是“偏导数”和“梯度”的概念。

当我们有一个二元函数 $ f(x, y) $,我们可以分别对 $ x $$ y $ 求偏导数。偏导数 $\frac{\partial f}{\partial x}$ 描述了当仅改变 $ x $ 而保持 $ y $ 不变时,函数 $ f $ 的变化率;类似地,$\frac{\partial f}{\partial y}$ 描述了仅改变 $ y $ 而保持 $ x $ 不变时,函数 $ f $ 的变化率。

对于多元函数 $ f(x_1, x_2, ..., x_n) $,每个自变量 $ x_i $ 都有其对应的偏导数 $\frac{\partial f}{\partial x_i}$

这些偏导数组成的向量称为梯度向量,记作 $\nabla f$ 或者 $\text{grad } f$。梯度向量的定义如下:

$$ \nabla f = \left( \frac{\partial f}{\partial x_1}, \frac{\partial f}{\partial x_2}, ..., \frac{\partial f}{\partial x_n} \right) $$

梯度向量的几何意义是,在给定点上的梯度方向是函数增加最快的方向,而梯度的模(或长度)给出了沿这个方向函数变化的速率。在优化问题中,我们通常希望找到使函数最小化的点,因此我们会使用梯度的反方向来更新参数,这就是梯度下降法的基本思想。

链式法则

链式法则是微分学中的一个基本规则,用于求解复合函数的导数。当一个函数是由两个或更多个函数复合而成时,比如 (y = f(g(x))),链式法则允许我们通过分别求出每个函数的导数来找到复合函数的导数。

链式法则表述为:

$$ \frac{dy}{dx} = \frac{df}{dg} \cdot \frac{dg}{dx} $$

这意味着,我们首先需要找到外层函数 (f) 相对于内层函数 (g) 的导数,然后再找到内层函数 (g) 相对于自变量 (x) 的导数,最后将这两个导数相乘得到最终的复合函数导数。

现在,让我们通过一个具体的例子来说明链式法则的应用。

考虑函数:

$$ y = \sin(3x^2 + 1) $$

我们可以将这个函数看作是两个函数的复合:

$$ f(u) = \sin(u) \quad \text{和} \quad u = g(x) = 3x^2 + 1 $$

我们需要做的是找到 (f(u)) 相对于 (u) 的导数和 (g(x)) 相对于 (x) 的导数,然后将它们相乘。

  1. 外层函数的导数($(f(u) = \sin(u)$) 相对于 $(u)$):

    $$ \frac{df}{du} = \cos(u) $$

  2. 内层函数的导数((g(x) = 3x^2 + 1) 相对于 (x)):

    $$ \frac{dg}{dx} = 6x $$

  3. 现在,我们将两个导数相乘:

    $$ \frac{df}{du} \cdot \frac{dg}{dx} = \cos(u) \cdot 6x $$

  4. 最后,我们将 (u = 3x^2 + 1) 代入上述表达式中,得到 (y) 关于 (x) 的导数:

    $$ \frac{dy}{dx} = \cos(3x^2 + 1) \cdot 6x $$