跳过正文

NetworkSystemChapter2

·2775 字·6 分钟
作者
KeJi

矩阵相关的知识点

Lectures On Network Systems Chapter 2 Notes
#

线性系统与约当标准形
#

离散时间线性系统
#

一个方阵定义了一个离散时间线性系统

$$ x(k+1)=Ax(k),\space x(0)=x_0 $$

序列\({x(k)}_{k\in Z_{\ge 0}}\)定义了一个轨迹,也就是系统的演化过程。我们关心的问题是,一个动力系统的解,随着时间趋于无穷大时,是否会收敛到某个极限值,以及最终收敛值是多少。即研究解的渐进行为

  • 是否存在极限
  • 极限是多少

数学定义: 矩阵\(A\in R^{n \times n}\)是

  1. 半收敛的,如果\(lim_{k \rightarrow \infin}A^k\)存在
  2. 收敛的或Schur稳定矩阵,如果A半收敛且\(lim_{k \rightarrow \infin}A^k=0_{n\times n}\)

如果A半收敛,那么显然有\(lim_{k \rightarrow \infin}x(k)=A_{\infin}x_0\)。

接下来,我们来刻画收敛与半收敛矩阵的集合。

约当标准形
#

对于任意一个 $n \times n$ 的复方阵 $A$,总存在一个可逆矩阵 $P$,使得:

$$ P^{-1}AP = J = \begin{bmatrix} J_1 & 0 & \cdots & 0 \\ 0 & J_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & J_k \end{bmatrix} $$

其中 $J$ 称为 约当标准型(Jordan标准型),$J_1, J_2, …, J_k$ 是约当块。

每个约当块 $J_i$ 是一个形如下的方阵:

$$ J_i = \begin{bmatrix} \lambda_i & 1 & 0 & \cdots & 0 \\ 0 & \lambda_i & 1 & \cdots & 0 \\ 0 & 0 & \lambda_i & \ddots & 0 \\ \vdots & \vdots & \vdots & \ddots & 1 \\ 0 & 0 & 0 & \cdots & \lambda_i \end{bmatrix} $$

其中:

  • $\lambda_i$ 是矩阵 $A$ 的特征值
  • 主对角线上全是相同的特征值 $\lambda_i$
  • 超对角线(主对角线上方的第一条对角线)上全是 1
  • 其余元素均为 0
  1. 存在性与唯一性

    • 任何复方阵都相似于一个约当标准型
    • 在不考虑约当块排列顺序的前提下,约当标准型是唯一的
  2. 相似不变性

    • 约当标准型与原始矩阵 $A$ 相似,保持特征值不变
    • 对角化是约当标准型的特例(当所有约当块都是 $1 \times 1$ 时)
  3. 结构特征

    • 约当块的个数等于线性无关特征向量的个数
    • 每个特征值对应的约当块大小和个数由该特征值的代数重数和几何重数决定

通过转换成约当标准形,

关于矩阵 $A$ 的特征向量,定理 2.4 意味着存在一个可逆矩阵 $T$,使得

$$ A = T J T^{-1} \iff A T = T J \iff T^{-1} A = J T^{-1}. $$

令 \(t_1,\ldots,t_n\) 和 \(r_1,\ldots,r_n\) 分别表示 T 的列和 \(T^{-1}\) 的行。如果 A 的所有特征值都是半单的,那么方程 (2.4) 和 (2.5) 意味着,对于所有 \(i \in \{1,\ldots,n\}\),

$$ A t_i = \lambda_i t_i \quad \text{且} \quad r_i A = \lambda_i r_i. $$

换句话说,T 的第 i 列是 A 对应于特征值 \(\lambda_i\) 的右特征向量(或简称特征向量),而 \(T^{-1}\) 的第 \(i\) 行是 A 对应的左特征向量

如果一个特征值不是半单的,那么它的代数重数大于几何重数。对于这样的特征值,矩阵 T 的列是 A 的右特征向量和广义右特征向量,而 \(T^{-1}\) 的行是 A 的左特征向量和广义左特征向量

在动态流系统中,左右特征向量协同作用实现对系统行为的完整刻画:右特征向量定义了流量演化的基本模式与稳态分布(如网络节点的最终占比),而左特征向量作为投影算子将初始状态分解到各模态上,计算其权重与贡献度。二者结合不仅支撑稳定性分析与收敛速率预测(通过主导特征值对应的向量),还能量化节点影响力、评估参数扰动敏感性,是理解瞬态响应与长期行为的核心数学工具。

矩阵A的收敛性可以通过判断矩阵A的约当标准形的收敛性来了解。约当标准形反映了矩阵A的特征向量和特征值,完整反映了矩阵A的谱结构,约当标准形将抽象的矩阵收敛问题转化为具体的特征值位置与约当块大小的判定问题。

为了研究当 \(k \to \infty\) 时通用块 \(J_i^k\) 的极限,我们研究形如 \(k^h \lambda_i^k\) 的项在 \(k \to \infty\) 时的极限。因为指数衰减因子主导多项式增长项,我们知道:

$$ \lim_{k\to\infty} k^h \lambda^k = \begin{cases} 0, & \text{若 } |\lambda| < 1, \\ 1, & \text{若 } \lambda = 1 \text{ 且 } h = 0, \\ \text{不存在或无界}, & \text{若 } (|\lambda| = 1 \text{ 且 } \lambda \neq 1) \text{ 或 } (|\lambda| > 1) \\ & \text{或 } (\lambda = 1 \text{ 且 } h = 1,2,\ldots) \end{cases} \tag{2.7} $$

综上所述,对于具有特征值 \(\lambda_i\) 的每个块 $J_i$,我们可以推断:

(i) 大小为 1 的块 \(J_i\) 收敛当且仅当 \(|\lambda_i| < 1\);

(ii) 大小为 1 的块 \(J_i\) 半收敛当且仅当 \(|\lambda_i| < 1\) 或 \(\lambda_i = 1\);

(iii) 大小大于 1 的块 \(J_i\) 半收敛且收敛当且仅当 \(|\lambda_i| < 1\)。

可以看到,特征值在动态流系统中是刻画各模态演化速率与稳定性的核心标量.

矩阵的谱系统与谱半径
#

对于一个方阵A,有如下定义

  • A的谱,记作 spec(A) 是A的特征值集合
  • A的谱半径是特征值的最大值 \(\rho(A)=max\{|\lambda|\|\lambda \in spec(A)\}\)

收敛性与谱半径 (i) A 是收敛的(即 \(\lim_{k\to+\infty} A^k = 0_{n\times n}\))当且仅当 \(\rho(A) < 1\),
(ii) A 是半收敛的但不是收敛的(即 \(\lim_{k\to+\infty} A^k\) 存在且不同于 \(0_{n\times n}\))当且仅当
a) 1 是特征值,
b) 1 是半单特征值,且
c) 所有其他特征值的模均小于 1。

格什戈林圆盘定理 现在我们介绍一种有用的通用方法来定位矩阵的谱,然后用它来刻画行随机矩阵的谱半径。

对于任意方阵 \(A \in \mathbb{R}^{n \times n}\),

$$ \operatorname{spec}(A) \subset \bigcup_{i\in\{1,\ldots,n\}} \left\{z \in \mathbb{C} \,\bigg|\, |z - a_{ii}| \leq \sum_{\substack{j=1\\j\neq i}}^n |a_{ij}| \right\} $$

即所有特征值都落在复平面上以 \(a_{ii}\) 为中心、半径为 \(\displaystyle \sum_{\substack{j=1\\j\neq i}}^n |a_{ij}|\) 的圆盘的并集中。

这样我们就可以得到行随机矩阵的谱性质。对于行随机矩阵:

  1. 1是特征值,且
  2. spec(A)是单位圆盘的子集,且\(\rho(A)=1\)

显然A矩阵的一个特征值是1,因此A不会是收敛的,但是可能半收敛。

Perron–Frobenius定理
#

随机行矩阵不收敛,那么如何确定它是否半收敛呢?现在我们使用Perron–Frobenius定理。

正矩阵 ⊂ 本原矩阵 ⊂ 不可约矩阵 ⊂ 非负矩阵 四个矩阵类型的定义

根据Perron-Frobenius理论,这四个矩阵类型的定义如下:

1. 非负矩阵 (Non-negative Matrix)
#

定义:一个矩阵 $A$ 称为非负矩阵,如果它的所有元素都大于或等于零

  • 数学表达:$A_{ij} \geq 0$ 对所有 $i, j$ 成立
  • 这是最广泛的类别

2. 正矩阵 (Positive Matrix)
#

定义:一个矩阵 $A$ 称为正矩阵,如果它的所有元素都严格大于零

  • 数学表达:$A_{ij} > 0$ 对所有 $i, j$ 成立
  • 正矩阵 ⊂ 非负矩阵(严格子集)

3. 不可约矩阵 (Irreducible Matrix)
#

定义(对于 $n \geq 2$ 的 $n \times n$ 非负矩阵 $A$): 矩阵 $A$ 称为不可约矩阵,如果从任意状态可以到达任意其他状态

  • 等价条件:$\sum_{k=0}^{n-1} A^k$ 是正矩阵(所有元素 > 0)
  • 直观理解:对任意 $(i, j)$,存在 $k \leq n-1$ 使得 $(A^k)_{ij} > 0$

可约矩阵:不满足上述条件的非负矩阵。


4. 本原矩阵 (Primitive Matrix)
#

定义:一个非负矩阵 $A$ 称为本原矩阵,如果存在某个正整数 $k$,使得 $A^k$ 是正矩阵

  • 关键特征:某个幂次后所有元素都变为严格正数
  • 本原矩阵 ⇒ 不可约矩阵(本原性更强)

严格层次关系 正矩阵 ⊂ 本原矩阵 ⊂ 不可约矩阵 ⊂ 非负矩阵

定理 2.12(佩龙–弗罗贝尼乌斯定理)。设 $A \in \mathbb{R}^{n \times n}$,$n \geq 2$。若 $A$ 是非负矩阵,则

(i) 存在一个实特征值 $\lambda$,使得对所有其他特征值 $\mu$ 都有 $\lambda \geq |\mu| \geq 0$;

(ii) $\lambda$ 的右特征向量 $v$ 和左特征向量 $w$ 可以取为非负向量。

若此外 $A$ 是不可约的,则

(iii) 特征值 $\lambda$ 是严格正且单的(代数重数为1);

(iv) $\lambda$ 的右特征向量 $v$ 和左特征向量 $w$ 在缩放意义下是唯一的且为正向量(所有分量 > 0)。

若此外 $A$ 是本原的,则

(v) 特征值 $\lambda$ 满足对所有其他特征值 $\mu$ 都有 $\lambda > |\mu|$。


层次关系总结

  • 非负矩阵:存在实主导特征值 $\lambda$,对应特征向量可取非负
  • 不可约矩阵:上述 $\lambda$ 严格正、单重,特征向量严格正且唯一
  • 本原矩阵:上述 $\lambda$ 严格大于其他所有特征值的模(严格主导)

本原矩阵能够立即预测到收敛性为