̄ : ^ r : U N I \crirv7瑪 VERS I T Y O F E L E C T R O N I C S C I E N C E A N D T 巨 C M N O L O G Y O F C H I NA 硕 ± 学 位 论 文 M A S T E RT H E S S I 论 文 题 目 H e rm i t i an 矩降 特 征值 扰动 界 的 妍究 学 科 专 业计 算 数 学  ̄  ̄ ̄ 学号2 0 1 1 2 1 1 00 1 1  ̄ ̄ " 作者姓名 9  ̄ 谭 指 导 教 师程 備 ■ —  ̄ 芹 副疆  ̄  ̄  ̄ Ji 独 创 性 声明 本人 声 明 所呈 交 的 学 位 论文 是 本 人 在 导 师 指导 下进 行 的 研 究 工 作 及取 得 的研 究成 果 方外 。 据 我所 知 , 除 了 文 中 恃 别 加 从 标注 和 致 谢 的 地 论 文 中 不包 含 其 他人 已 经 发 表 或 撰写 过 的 研 究 成果 , , 也 不 包含 为 获 得 电 子 科 技 大 学 或其 它 教 育机 构 的 学 位 或 证 书 而 使 用 过 的 材 料 与我 一 = 同 工 作 的 同 志 对本 研 究所 做 的 任 何 贡 献 均 已 在 论 文 中 作 了 明 确 的 说 明 并表示 谢意 作者 签 名 : 。 巧 节 __ 日 期 王。 : A f 年 月 巧 日 论 文使 用 授 权 本 学 位论 文 作 者 完 全 了 解 电 子 科技 大 学 有 关 保 留 使 用 学 位 论 文 、 的 规 定 有权 保 留 并 向 国 家 有 关 部 口 或 机 构 送 交 论 文 的 复 印 件 和 磁 盘 , 允 许 论 文 被 查 阀 和 借 阅 本 人 授 权 电 子 科 技大 学 可 将 学位 论 文 的 全 。 部 或 部 分 内 容 编入 有 关 数据 库 进行检 索 等 复制 手 段 保 存 ( 、 汇编 学位论 文 , 采用 影 印 可 ; 巧 节 缩 印 或扫 描 。 保 密 的 学 位 论 文在 解 密 后 应 遵 守 此 规 定 作者签名 、 导 师 曰 ) 签名 期 : : 寺 月 / 2 曰 , 分类号 密级 UDC 注 1 学 位 论 文 Hermitian 矩阵特征值扰动界的研究 (题名和副题名) 谭 芹 (作者姓名) 程光辉 指导教师 副教授 电子科技大学 成 都 (姓名、职称、单位名称) 硕士 申请学位级别 提交论文日期 学科专业 2014 年 5 月 16 日 学位授予单位和日期 计算数学 论文答辩日期 电子科技大学 答辩委员会主席 评阅人 注 1:注明《国际十进分类法 UDC》的类号。 2014 年 6 月 15 日 2014 年 6 月 27 日 THE RESEARCH ON THE PERTURBATION BOUNDS OF EIGENVALUES FOR THE HERMITIAN MATRIX A Master Thesis Submitted to University of Electronic Science and Technology of China Major: Author: Advisor: School : Computational Mathematics Tan Qin Cheng Guanghui School of Mathematical Sciences UESTC 摘要 摘 要 矩阵特征值扰动界问题是在给某类矩阵一定的扰动后,其特征值所表现出来 的变化程度,就称此变化程度为特征值的扰动界。特征值的估计可以由矩阵和与 特征值相对应的特征向量决定,因此,研究被扰动矩阵和扰动矩阵的结构特点, 以及特征向量的变化,将会是研究特征值扰动界的重要途径。那么眼于对 Hermitian 矩阵的特征值扰动界的研究,分析此类较特殊矩阵的扰动情况,并且给出较优化 的特征值扰动界,就显得尤为重要。 本文主要讨论了 2×2 块 Hermitian 单特征值扰动界问题和广义 Hermitian 矩阵 特征值的多重特征值扰动界问题。优化了 2×2 块 Hermitian 单特征值扰动界,推广 了 Hermitian 矩阵多重特征值扰动界以及广义 Hermitian 矩阵多重特征值扰动界。 研究内容如下: 2×2 块 Hermitian 矩阵的精确扰动界。在作者 Y. J. Nakatsukasa 的基础上对 Hermitian 矩阵单特征值扰动界进行了新的界定。主要是通过对特征向量进行更为 精确的界定来达到对特征值的界的精细化。先得出了特征向量的界是与二阶分块 扰动矩阵的分量的算子二范数有关的,然后再由特征向量的界来估计特征值的扰 动界。并且,进一步分析出单特征值间对扰动的敏感性取决于它所对应的特征向 量的的分量界的大小,也就是说与 2×2 块 Hermitian 扰动矩阵的分量有关。 一般特征值扰动问题。主要给出了多重特征值的扰动界的推广,改进以往相 应的 Hermitian 矩阵一般特征值扰动误差界,得到具有推广意义的扰动界。 广义特征值对称扰动问题。此时重新给出矩阵的形式,改进以往相应的广义 Hermitian 矩阵特征值扰动误差界,以期能够得到更一般的扰动界情况。 关键词:Hermitian 矩阵,特征值问题,特征值的扰动界,2×2 块 Hermitian 矩阵 I ABSTRACT ABSTRACT Matrix eigenvalue perturbation boundary problem is the change scope of eigenvalues when the matrix is perturbed, the degree of change is called the perturbation bounds of eigenvalue. Eigenvalue has the relationship with the matrix and the corresponding eigenvectors, therefore, studying the perturbed matrix and the perturbation matrix’ structure characteristic, and the change of the eigenvector, is an important approach to study the eigenvalue perturbation bounds. It is very important to focuse on the study of Hermitian matrix eigenvalue perturbation bounds, analyze the special matrix perturbation, and give the optimization of the eigenvalue perturbation bounds for Hermitian matrix. In this paper, we mainly talked about perturbation of partitioned Hermitian eigenvalue problem, the perturbation of multiple eigenvalues and perturbation bounds for generalized Hermitian matrix eigenvalues. The paper optimizes partitioned Hermitian eigenvalue perturbation bounds, popularized the multiple eigenvalues of Hermitian matrix and the multiple eigenvalues of generalized Hermitian matrix. This paper mainly studies the following contents. For the sharp perturbation bound of 2-by-2 block Hermitian matrix, we define the new perturbation bounds for the generalized Hermitian matrix multiple eigenvalues basing on author Y. J. Nakatsukasa. We mainly sharp the eigenvalue bounds through bounding the more accurate eigenvector, finding that the bounds of eigenvector are relactive to the spectral norm of component of 2-by-2 perturbation matrix, and then analysis the single eigenvalue’s sensitivity to perturbation depend on the eigenvector of the corresponding components of bounded size, that is associated with the 2-by-2 block perturbation matrix component. For the standard eigenvalue perturbation problem, we mainly generalize perturbation bounds of multiple eigenvalues, improve the corresponding Hermitian matrix eigenvalue perturbation error bound, obtain the more accurate perturbation bound. For the generalized eigenvalue problem of symmetric perturbation, we give a new form of a matrix, improve the corresponding Hermitian matrix generalized eigenvalue perturbation error bound, in order to get more general perturbation bounds. II ABSTRACT Keywords: Hermitian matrix, eigenvalue problems, perturbation bounds of eigenvalues, 2-by-2 block Hermitian matrix III 目录 目 录 第一章 绪论 .................................................................................................................... 1 1.1 选题背景 ................................................................................................................ 1 1.1.1 矩阵特征值的相关定义 ................................................................................. 2 1.1.2 Hermitian 矩阵特征值扰动的相关定理 ......................................................... 2 1.2 本文主要工作 ........................................................................................................ 4 第二章 对 2 2 块 Hermitian 矩阵特征值扰动界的优化 ........................................... 4 2.1 引言 ........................................................................................................................ 5 2.2 对 2 2 块 Hermitian 矩阵特征值扰动界的优化................................................. 9 2.3 数值例子 .............................................................................................................. 15 2.4 本章小结 .............................................................................................................. 16 第三章 广义 Hermitian 矩阵特征值扰动界的研究 .................................................. 17 3.1 引言 ...................................................................................................................... 17 3.2 Hermitian 正定矩阵的多重特征值扰动 .............................................................. 20 3.3 数值例子 .............................................................................................................. 23 3.4 广义 Hermitian 正定矩阵的特征值对称扰动界 ................................................ 24 3.5 数值例子 .............................................................................................................. 30 3.6 本章小结 .............................................................................................................. 30 第四章 论文总结和展望 .............................................................................................. 32 4.1 论文总结 .............................................................................................................. 32 4.2 工作展望 .............................................................................................................. 32 致 谢 .............................................................................................................................. 34 参考文献 ........................................................................................................................ 35 攻硕期间取得的研究成果 ............................................................................................ 37 IV 主要符号表 主要符号表 N 自然数集合 C ( R) 复(实)数集合 C n (Rn ) n 维复(实) 列向量集合 C n n (R n n ) n 阶复(实)矩阵集合 AH ( A ) 矩阵 A 的转置(复共轭)矩阵 det( A) 矩阵 A 的行列式 ( A) 矩阵 A 的特征值 r ( A) 矩阵 A 的谱半径 ( A) 矩阵 A 的奇异值 A 矩阵 A 的 2 范数 2 V 第一章 绪论 第一章 绪论 1.1 选题背景 矩阵扰动理论是矩阵论中重要组成部分,是解决很多实际问题的重要途径和 方法,在各个领域的研究上都起着举足轻重的作用。研究当给出的矩阵的某些元 素发生细小变化下所带来的相关结果的影响是矩阵扰动理论的主要研究方向。矩 阵扰动可细分为特征值扰动、奇异值扰动、极因子扰动、奇异空间扰动、特征空 间扰动等。而特征值扰动问题是矩阵论研究的重要课题,因此,对带扰动的特征 值误差界的探讨,一直是学者们乐于研究的方向。研究特征值的扰动的意义在于 可以解决非线性回归优化问题、常微分方程的解以及其他与计算数学相关的问题, 并且特征值扰动界研究还能拓展到其他领域里,比如量子力学、物理、天文等学 科研究,并对这些领域起了重要作用。由于矩阵与各种范数联系紧密,在研究中, 常谈及对矩阵(算子)范数的问题,也会将范数的相关理论用于特征值扰动界问 题中。此外,国内外学者对特征值的连续性问题也有深入研究,从而得出了重要 结论。 到目前为止,已有 Hoffaman,A.J. Hoffaman,Wieland,Fisher,Weyl 等学者 提出了有关特征值扰动界的理论和结果,例如著名的 Wielandt - Hoffaman 定理对 特征值的扰动和扰动矩阵的 Enclid 范数之间的联系建立了桥梁。这些结论无疑是 打开了对特征值扰动界的研究的大门,也为后续研究做了理论的支持。矩阵中有 一类较特殊的矩阵,即 Hermitian(正定)矩阵。由于此类矩阵的结构特殊,性质 明显,研究效果更明显。Ren-cang Li,Y. J. Nakatsukasa 等学者致力于 Hermitian(正 定)矩阵的研究。目前就 Hermitian 矩阵的特征值扰动界问题给出了许多好的结论。 学者们研究了 Hermitian 矩阵的对称非对角和对角扰动界,也研究了非 Hermitian 矩阵的扰动问题,并且对于多重特征值的扰动界也进行了相应的估计,给出了在 扰动下多重特征值的敏感性不同的解释。然而,在此基础上,仍有进一步拓展的 空间。 本文就在已取得的研究成果基础上,对 Hermitian(正定)矩阵的特征值扰动 界进一步探讨,并将矩阵进行二阶分块,这样可以减少计算量和提高研究成绩。 Ren-Cang Li ,Ji-Guang Sun 和 Y. J. Nakatsukas 等作者曾经就标准特征值和广义 特征值的扰动界进行了研究,给出了相关扰动界。本文就想在此基础上继续研究 标准 Hermitian 正定矩阵特征值扰动问题和广义 Hermitian 矩阵特征值问题。学者 们通过长期研究给出了对角扰动和非对角扰动情况的界,也分析了对 Hermitian 矩 阵带非对称扰动后的特征值的扰动界,文献较多且全面,得出的这些界都是比较 1 电子科技大学硕士毕业论文 好的,对于 Hermitian 矩阵特征值扰动界的研究相当细致,也为广大研究特征值扰 动问题的工作者提供了宝贵的理论参考资料。然而,在此基础上,还有研究空间, 可以考虑其中被扰动矩阵 A 和 B 的结构,可逆矩阵 X 的结构,以及扰动矩阵 E 和 F 的结构。那么应用之前的研究成果,就可以得到更一般化的特征值扰动界,达到 了将特殊变为一般化的目的。 此外,对于广义 Hermitian 矩阵的特征值研究有针对单特征值,也有多重特征 值的,那么文献中对广义 Hermitian 矩阵的单特征值扰动界进行了研究,对基于此 种方法下的多重特征值的研究还比较少,那么可以借鉴单特征值的扰动理论来估 计多重特征值的界。 1.1.1 矩阵特征值的相关定义 在研究 Hermitian 矩阵的特征值扰动问题之前,本文先给出一些与矩阵和矩阵 特征值相关的定义,以便为文章做理论的指导。 定义 1.1[1] 定义矩阵 A C nn 的特征值的全体为矩阵 A 的谱,符号记作 ( A) 。 定义 1.2[1] 假设 A C nn ,记 r ( A) max i 为矩阵 A 的谱半径。 i 定义 1.3 1] 矩阵正奇异值:设 A C n n ,其中矩阵 A 的秩为 r , AH A 的特征值 为 1 2 r r 1 n 0 , 则称 i i i 1, 2, , r 为矩阵 A 的正奇异值。 定义 1.4[1] 矩阵算子范数(谱范数):设 A C mn ,称 A 2 r ( AH A) 为矩阵 A 的算子范数(谱范数)。 n 定义 1.5[1] 矩阵 Frobenius 范数:设 A C mn ,那么 A F m ( aij ) 2 就为矩 2 1 i 1 j 1 阵 A 的矩阵 Frobenius 范数。 定义 1.6[2] 定义 (u, A) (u T Au ) / (uu T ) 为对称矩阵 A 和非零向量 u 的瑞利商 (Rayleigh quotient)。 定义 1.7[1] 定义标量 a 和扰动标量 a 的绝对误差界为 a a ,其中 满足 e 。 a 的相对误差定义为 a a a 。 1.1.2 Hermitian 矩阵特征值扰动的相关定理 有了一定的定义做支撑,下面我们将具体介绍些有关 Hermitian 矩阵特征值的 相关定理。以下定理都在研究矩阵特征值扰动界问题上奠定理论性支持。 (1)当矩阵 A 不带扰动时, A 的特征值范围或者精确表达式 2 第一章 绪论 定 理 1.1[1] 对 于 任 意 矩 阵 A (aij ) C nn , 那 么 A 的 任 一 特 征 值 i 都 满 足 n i S S j (i 1, 2, , n) ,称此定理为 Gerschgorin 圆盘定理。 j 定理 1.2[1] (Ostrowshi)设 A (aij ) C nn , a [0,1] 为给定的数,则 A 的所有 n 特征值位于 n 个圆盘的并集 {z C : z aii Ria Ci1 a } 中,其中 i n n j 1 j i j 1 j i Ri aij , Ci a ji . 定理 1.3[1](Brauer)设 A (aij ) C nn ,则 A 的所有特征值位都属于 n(n 1) 个 2 n Cassini 卵形的并集 {z C : z aii Ri R j } 之中。 i, j i j 定理 1.4[1] (Rayleigh-Ritz)设 A (aij ) C nn 为 Hermitian 矩阵, i eig ( A) , 且有 1 2 n ,那么则 n x H x x H Ax 1 x H x (x C n ) , max 1 max ( x, A) max x H Ax , x 0 x H x 1 min n min ( x, A) min x H Ax . x0 x H x 1 (2)带对称扰动的 Hermitian 矩阵特征值的相关定理 定理 1.5[2] 设 A, B A E C nn , A, B 和 E 皆为 Hermitian 阵,它们的特征值分 别为 1 n , 1 n , 1 n . 则 i n i i 1 , i 1, , n. 定理 1.6[2] (Weyl 定理)。设 A, B C nn 皆为 Hermitian 阵,它们的特征值如定 理 2.1[2] 所示,则 i i B A 2 , i 1, , n. 定理 1.7[2] 设 A, B A E C nn 皆为 Hermitian 阵, A , B 和 E 的特征值分别 如定理 1.6[2]所示。则 1 m n m 1 n 1 m 1 m 1 m , m 1, , n 定理 1.8[2](Hoffman-Wielandt 定理)设 A, B A E C nn 皆为 Hermitian 矩阵, 它们的特征值关系有 3 电子科技大学硕士毕业论文 ( A, B) n ( i 1 i i ) 2 B A F . (3)带非对称扰动的 Hermitian 矩阵特征值的相关定理 定理 1.9[2] (Kahan)设 A C nn 为 Hermitian 阵,其特征值为 1 2 n , 又设 B A E , ( B) k i k , 1 n . 令 Ex 和 E EH E EH , , Ey 2 2i k i C : i k E 2 , E y 2 , 则 n (B) k . k 1 定理 1.10[2] (Kahan)在定理 的假设条件下,有 1.1[2] n i 1 2 k Ey F 和 n ( i i )2 Ex i 1 F n Ey F k2 . k 1 1.2 本文主要工作 本文将主要讨论下列两类大问题:一、2×2 块 Hermitian 矩阵的单特征值扰动 界;二、 (广义)Hermitian 矩阵的特征值扰动问题。在单特征值的扰动界问题上, 将对已有的结论进行了优化,从而得出更精确的特征值扰动界。在多重特征值的 扰动问题基础上对扰动做一般性的分析与推广,并对多重特征值扰动行为进行研 究,得出了更一般化的扰动界。 4 第二章 对 2×2 块 Hermitian 矩阵特征值扰动界的优化 第二章 对 2×2 块 Hermitian 矩阵特征值扰动界的优化 2.1 引言 Hermitian 矩阵类型很多,并且均具有研究价值。本章主要研究 2×2 块 Hermitian 矩阵特征值扰动界问题,对此类较特殊矩阵进行特征值、特征向量讨论。2×2 块 Hermitian 矩阵特征值扰动界的优化问题在科学领域和工程领域都有广泛的应用, 下面我们将考虑以下 2×2 块 Hermitian 矩阵特征值扰动界模型 A A21H A 11 , A21 A22 E11 E21H E , E21 E22 A E11 A21H E21H A A E 11 , A21 E21 A22 E22 x x 1, x2 (2-1) 将 A , E 进行 2 阶分块,其中 A , E 均为 Hermitian 正定矩阵。向量 x 为矩阵 A 的 特征向量。 设存在实数 t [0,1] ,对矩阵 A 进行含参数 t 的扰动,扰动后的矩阵为 A tE , 则矩阵 A tE 为 Hermitian 矩阵。当参数 t 1 时, A tE A E , 那么就为一般的扰动。在研究问题时,可以先从特殊情况的研究开始,再推广到 一般情况,本章所采用的就是这种方法。 假设 x t 是 Hermitian 矩阵 A tE 的特征向量,且 x1 t 与 A11 有相同的行数。 那么就有如下模型 A11 tE11 A21H tE21H A tE , A21 tE21 A22 tE22 x (t ) x(t ) 1 , x2 (t ) 设 A, A , A tE (其中 t [0,1] )的特征值按降序排列为 (2-2) 1 2 m n , 1 2 m n , 1 (t ) 2 (t ) m n (t ) , 那么有 i i (0) , i i (1) 。 下面开始展开特征值扰动界的讨论。对于 i 1, 2, , m n ,在扰动矩阵 E 的范 5 电子科技大学硕士毕业论文 数很小的情况下(一般的, E 2 A 2 ),本文关心的是 i i 的界的大小。对此, [2] 有很多著名的扰动界,例如著名的 Weyl 不等式 i i E 2 , i 1, , m n . 此不等式阐述带扰动下矩阵的特征值的误差界是与扰动矩阵 E 的范数有关。 Weyl 定理为研究特征值扰动界奠定了基础,很多后续的理论都是 Weyl 定理的延 伸。 下面定义一种 Hermitian 矩阵带非对角扰动下的特征值扰动界的最小值,在 (2-1)式中,若 A21 , E11 , E22 是零矩阵,定义 min i 2 , i ( A11 ) ( A ) , i 2 22 i 1 , i ( A22 ) min 1 ( A11 ) min i min 1 2 . 1 i m n 1 ( A11 ), 2 ( A22 ) 本章是通过研究特征向量的范数界来估计特征值的扰动界,并且本章只研究 单特征值的扰动界。那么在研究 2×2 块 Hermitian 矩阵特征值扰动界的优化问题前, 首先给出单特征值的偏微分形式,此特征值偏微分形式是与扰动后的矩阵的特征 向量有关。以下引理是根据特征方程以及留数定理得到,是有关单特征值有关参 数 t 的微分形式。 [2,3] 引理 2.1 设 Hermitian 矩阵 A, E 定义如式(2-1),Hermitian 矩阵 A tE 定义 如式(2-1),且设 i (t ) 是 A tE 的第 i 个特征值。定义特征向量函数(有关 t 的函数) 为 x(t ) ,使得满足特征方程 ( A tE ) x(t ) i (t ) x(t ) ,其中对任意 t 0,1 ,有 x(t ) 2 1 成立。若 i (t ) 是单特征值,则存在一个数 t0 ,满足 , 0 , t t , t 0 ' 0 t t 2 0 且有 i (t ) ' t x(t ) H Ex(t ) . (2-3) t 本章就围绕引理 2.1 中式(2-3)展开的。在引理 2.1 中,本文关心的是在与矩阵 E 的主对角元相对应位置处的 xt 的某个分量的值会不会比较小,若某个分量的值 (t ) 很小, i 那么就会很小的。例如,假设 E 是除了第 j , j 元素是非零,其余元 t 素都是零的矩阵。那么就有 2 i (t ) E 2 x j (t ) t 其中 x j (t ) 是特征向量 x(t ) 的第 j 个元素,则此时特征值函数的偏微分的值就会比较 小。 因此,对于 t 0,1 ,如果知道了 x j (t ) 的一个界,那么结合(2-3)式,就可 以得到 ˆ (0) (1) 的一个界。 i i i i 6 第二章 对 2×2 块 Hermitian 矩阵特征值扰动界的优化 在引理 2.1 中是假设 i (t ) 是矩阵 A 的一个单特征值。由文献[3]知只要恰当的 选择 i (t ) 的特征向量 x(t ) ,即使 i (t ) 是多重特征值,式(2-3)也是成立的。下面就 根据引理 2.1,先估计特征向量的某一分量的范数界。 对于式(2-1)和(2-2)中定义的矩阵,令 A11 与 E11 为 k k 阶矩阵。将(2-3)式在 t 0,1 上积分为 1 i (t ) dt x(t ) H Ex(t )dt , 0 0 t 1 等式两边取绝对值: i i 1 0 x(t ) H Ex(t ) dt 1 H 0 x1 (t ) 1 0 E x2 (t ) H 11 E21 E21H x1 (t ) dt E22 x2 (t ) 1 x1 (t ) H E11 x1 (t ) d t 2 x2 (t ) H E21 x1 (t ) d t 0 1 x2 (t ) H E22 x2 (t ) d t 0 1 0 1 0 x1 (t ) H E11 x1 (t ) d t 2 1 0 x2 (t ) H E21 x1 (t ) d t x2 (t ) H E22 x2 (t ) d t , (2-4) 其中 x (t ) x(t ) 1 , x2 (t ) 并且 x1 (t ) 与 A11 有相同的行数, x2 (t ) 与 A22 有相同的行数。如果 x2 (t ) 2 很小,那么 (2-4)式的后两个式子的值就会很小,反之亦然。因此,本文需要通过下面的引理 来得到 x2 (t ) 2 的一个上界。 首先,考虑简单情况,先给出有关 Hermitian 矩阵 A 的特征向量 x 的界。 根据文献[3],可将特征方程 Ax i x 等价变形为 A11 A12 x1 x 1 A 21 A22 x2 x2 A x A x x1 , 11 1 12 2 A21 x1 A22 x2 x2 则得出方程组的第一个方程为 A21 x1 A22 x2 i x2 , 将上式变形得到 x2 i I A22 A21 x1 , 1 对等式两边同时取范数,并令 x1 2 x 2 1 有 7 电子科技大学硕士毕业论文 x2 i I A22 2 A21 1 A21 x1 2 2 min i ( A22 ) 2 , 所以,就可以得到了特征向量 x 的一个分量 x2 的范数上界,以下就简称范数界。 引理 2.2 [3] 设 i ( A22 ) 是式(2-1)中 A 的第 i 个最小特征值, x 是属于特征值 x i ( A22 ) 的特征向量,满足 x 2 1 ,并且将 x 分块为 x 1 。那么就满足特征 x2 方程 Ax i x ,那么,就有 x2 2 A21 2 min i ( A22 ) . (2-5) 如果假设 i (A11 ) ,同理可得 x1 2 的上界,此时只需要将式(2-5)中的 x2 换成 x1 ,将 A22 改成 A11 ,即 x1 2 A21 2 min i ( A11 ) 引理 2.2 是有关矩阵 A 的特征向量的两个分量的范数界,主要是根据特征值方 程得出的,计算出的特征向量的某个分量与矩阵 A 的某分块矩阵有关。根据引理 2.2 的简单情况,可推广任意带参数 Hermitian 矩阵 A tE 的特征向量的界。此时, 令 i (t ), x(t ) 为矩阵 A tE 的第 i 个最小特征值和特征向量,且有 xt 2 1 ,那么 就有 A tE x(t ) i (t ) x(t ) . 当 i ( A22 ) 2 E 2 时 , 使 用 公 式 (2-5) 可 得 到 x2 (t ) 2 的 一 个 上 界 , 其 中 t [0,1] ,那么就有 A21 tE21 2 x2 (t ) 2 min i (t ) ( A22 tE22 ) A21 2 t E21 A21 2 E21 (Weyl 定理) 2 min i (0) ( A22 ) 2t E 2 min i A22 2 E 2 , 2 为了方便起见,定义如下两等式 i min i ( A11 ) , 其中 i A, i A11 , i 1, 2, , m n , i min i ( A22 ) , 其中 8 (2-6) 第二章 对 2×2 块 Hermitian 矩阵特征值扰动界的优化 i A, i A22 , i 1, 2, , m n . 因此我们可以将式(2-6)进行简写,以方便今后的讨论。 引理 2.3 [3] 设 i ( A22 ) 是式(2-1)中 A 的第个 i 最小特征值。令 i (t ), x(t ) 为矩阵 A tE 的第 i 个最小特征值和特征向量,而且 x(t ) 2 1 ,分块特征向量 x (t ) x(t ) 1 , x2 (t ) 对 t [0,1] ,得到 x2 (t ) 2 的上界如下 x2 (t ) 2 A21 2 E21 i 2 E 2 . (2-7) 2 结合式(2-4)与式(2-7),因此,可以得到 i 的扰动界。 ~ [3] 引理 2.4 设 i , i 分别是式 (2-1) 中矩阵 A 与 A E 的第 i 个特征值,满足 A tE x(t ) i (t ) x(t ) i A21 2 E21 i 2 E 2 , 2 那么对任意 i ,如果复数 i 0 ,则有 i i E11 2 2 E21 2 i E22 2 i2 . (2-8) 在引理 2.3 中,为了得到式(2-7),作者 Y. J. Nakatsukasa 根据 x(t ) 2 1 ,令 x1 (t ) 2 1 ,从而结合式(2-7)得到特征值的扰动界,所用方法是通过分析特征向量 的某个分量的范数界来估计特征值扰动界。 那么,在此基础上,可以进一步优化特征向量的某个分量的范数界限来优化 特征值扰动界。这就是本章的中心思想所在。 2.2 对 2×2 块 Hermitian 矩阵特征值扰动界的优化 在文献[3]通过分析特征向量的某个分量的范数界来分析特征值的扰动界的理 论基础上,本节通过从优化特征向量的范数界的角度来得到 2×2 块 Hermitian 矩阵 特征值新的优化扰动界。 定理 2.1 设 i ( A22 ) 是式(2-1)中 A 的第 i 个最小特征值,x C m n 是属于特征 值 i 的特征向量, i min i ( A22 ) 。那么特征值和特征向量满足特征方程 x Ax i x 。令 x 2 1 ,将 x 分块为 x 1 ,就有 x2 A21 2 x2 2 2 . i2 A21 证明:根据 x 2 (2-9) x 1 ,且特征向量分块为 x 1 ,其中 x1 C m , x2 C n ,由特 x2 9 电子科技大学硕士毕业论文 征方程 Ax i x 可得 A21 x1 A22 x2 i x2 , 根据 i (A 22 ) 得到 x2 i I A22 A21 x1 1 , 等式两边取范数 x2 2 i I A22 1 A21 x1 2 2 , 由向量 2-范数的定义以及 x 2 1 ,得到 m n x x2 m x2 i 1 2 i i 1 , n xi 2 2 xi , i m 1 两边平方得到 m x 2 xi 2 n 2 i 1 2 i m 1 xi , 从而可得 m xi 1 n 2 i 1 x1 i m 1 2 2 2 1 x 2 2 2 xi , , 等式两边开方得到 x1 2 1 x2 2 , 将此式代入上式得到 x2 2 i I A22 1 i I A22 因为 i min i A22 ,所以上式可化简为 x2 2 1 x2 A21 A21 1 x2 2 2 2 2 , 2 2 A21 1 x2 2 , i 求解上面有关 x2 2 的一元二次不等式可得到 x2 2 A21 2 A21 2 i 2 因此定理 2.1 得证。 . ■ 与定理 2.1 证明相似,就可得到下面定理 2.2。 10 第二章 对 2×2 块 Hermitian 矩阵特征值扰动界的优化 定理 2.2 设 i A11 是式(2-1)中 A 的第个 i 最小特征值 x C m n 是属于特征 值 i 的特征向量, i min i ( A11 ) 。那么特征值和特征向量满足特征方程 x Ax i x 。令 x 2 1 ,那么将特征向量 x 分块为 x 1 ,就有 x2 A21 2 x1 2 2 . i2 A21 (2-10) 由定理 2.1 与定理 2.2 知,仅仅只对特征向量 x 中的分量 x2 和 x1 的范数的界做 了调整,却产生了较文献[3]更精确的特征向量的界,即特征向量的优化,这样我 们已经完成了对 2 2 块 Hermitian 矩阵特征值扰动界的优化的第一步。 接下来,将矩阵 A 特征向量 x 的某个分量的范数界的估计推广到任意带参数的 矩阵 A tE 的特征向量 x(t ) 的某个分量的范数界的估计。首先给出一个单调递增函 数函数的证明。 引理 2.5 设 f (x) x x2 ,其中 是一个正的常数,那么对 x 0, ,f ( x) 是一个单调递增函数。 证明:对 f ( x) 求导数得 df (x) dx 3 2 2 x , 由 是一个正的常数知对 x 0, ,有 df (x) 0, dx 即对任意 x 0, ,f ( x) 是一个单调递增函数。 ■ 现在,和定理 2.1 的研究相似,考虑矩阵 A tE 的特征多项式为 A tE x(t ) i (t ) x(t ) 同样可以得到下面的结论。 定理 2.3 设 i t A22 tE22 是式(2-1)中 A tE 的第个 i 最小特征值,x t 是 矩阵 A tE 属于特征值 i t 的特征向量,且满足 x(t ) 2 1 。令 A tE x(t ) i (t ) x(t ) , 若 i E22 E ,分块 x (t ) x(t ) 1 , x2 (t ) 对 t 0,1 ,得到 x(t ) 2 的上界如下 11 电子科技大学硕士毕业论文 A21 2 E21 x2 (t ) 2 E22 2 E i 2 2 2 A21 2 E21 2 2 . (2-11) 证明:由引理 2.5,式(2-9)以及三角不等式 C D C D 0(其中 C , D 是 任何两个维数相同的矩阵),就有 由式(2-9)可得 x2 2 A21 2 A21 2 i 2 , 其中 i min i ( A22 ) 。 根据特征方程 A tE x(t ) i (t ) x(t ) 和 i 0 i , t 0,1 , 那么就可以得到 x2 (t ) 2 A21 tE21 min i (t ) ( A22 tE22 ) A21 tE21 2 A21 tE21 min (0) ( A i min ( A 22 E22 2 E i E22 2 E A 21 2 A21 tE21 2 A21 tE21 t E21 2 E21 2 A 2 2 2 2 2 2 2 2 2 A21 2 E21 2 ) E22 E 2 2 2 2 ) t E22 E A21 2 t E21 i 22 A21 tE21 i 2 21 2 2 2 2 . 定理 2.3 得证。 ■ 与定理 2.3 的证明思路一样,可以得到 x1 (t ) 2 的优化界。 定理 2.4 设 i t A22 tE22 是式(2-1)中 A tE 的第个 i 最小特征值,x t 是 矩阵 A tE 属于特征值 i t 的特征向量,且满足 x(t ) 2 1 。令 A tE x(t ) i (t ) x(t ) , 若 i E11 E ,分块 对 t 0,1 ,得到 x1 (t ) 的上界如下 x (t ) x(t ) 1 , x2 (t ) 12 第二章 对 2×2 块 Hermitian 矩阵特征值扰动界的优化 A21 2 E21 x1 (t ) 2 E11 2 E i 2 2 2 A21 2 E21 2 2 . (2-12) 在得到矩阵 A tE 特征向量的两个分量的优化界后,现在将重点放在对特征值 的扰动界的讨论上。也就是估计 Hermitian 矩阵 A 与 A E 的特征值误差界的大小。 可以根据引理 2.1 的偏微分形式得出。下面开始给出特征值扰动界以及定理的证 明,此扰动界较之以前的特征值扰动界更加优化。 定理 2.5 设 , 是式(2-1)中矩阵 A 与 A E 的第 i 个最小特征值,定义 i i i A21 2 E21 E22 2 E i 2 2 2 A21 2 E21 2 2 和 i A21 2 E21 i E11 2 E 2 2 2 A21 2 E21 2 2 . 那么对任意 i ,如果 i E22 E , i E11 E ,则有 i i E11 2 i2 2 E21 2 ii E22 2 i2 . (2-13) 证明:由引理 2.1 有 i i i (0) i (1) 1 0 1 0 x(t ) H Ex(t ) dt x1 (t ) H E11 x1 (t ) d t 2 E11 2 1 0 2 i 1 0 x2 (t ) H E21 x1 (t ) d t 2 x1 (t ) dt 2 E21 2 1 0 1 0 x2 (t ) H E22 x2 (t ) d t x2 (t ) x1 (t ) dt E22 2 1 0 2 x2 (t ) dt E11 2 2 E21 2 ii E22 2 , 2 i 定理 2.5 得证。 ■ 根据定理 2.5 的特征值扰动优化界,可知此扰动界与扰动矩阵 E 的某分块矩阵 的范数和特征向量的界有关。并且根据 i , i 和 i 的结构特点可知式(2-13)的扰动 界比式(2-8)的扰动界精细。 通过观察式(2-13)以及定理 2.5 的题设条件中 i 和 i 的结构特点,可以对式 (2-13)进行适当变形,从而可以丰富特征值扰动界的计算方法。那么就有下面的推 论。 推论 2.1 设 , 是式(2-1)中矩阵 A 与 A E 的第 i 个特征值,定义 i i i A21 2 E21 i E22 2 E 2 2 那么对任意 i ,如果 i E22 E ,就有: 13 2 A21 2 E21 2 2 , 电子科技大学硕士毕业论文 i i E11 2 2 E21 2 i E22 2 i2 . (2-14) 证明:根据式(2-13),以及 i E22 2 E 2 , 那么就有 i A21 2 E21 i E11 2 E 2 2 2 A21 2 E21 2 2 1. 因此可得到 i i E11 2 i2 2 E21 2 ii E22 2 i2 E11 2 2 E21 2 i E22 2 i2 , 推论得证。 ■ 推论 2.2 设 i , i 是式(2-1)中矩阵 A 与 A+E 的第 i 个最小特征值,定义 A21 2 E21 2 i , 2 2 i E11 2 E 2 A21 2 E21 2 那么对任意 i ,如果 i E11 2 E 2 ,就有 i i E11 2 i2 2 E21 2 i E22 2 . (2-15) 此推论证明方法同推论 2.1 的证明。 以上两个推论较之定理 2.5 而言,未知数减少,从某种意义上来讲,会减少计 算量,能够节约计算成本,再科学工程方面是具有实用价值的。但是,也有不足 之处,就是在不等式放缩中,使得特征值扰动界变大了,这样就会使特征值扰动 界的估计出现不精细的情况。 下面,将本文的扰动界与文献的扰动界做个比较,并且以实际数值算例来说 明这点。 注记 2.1 从式(2-7)和(2-11)的对比中,可看出对特征向量的某个分量的范数界 明显优化了。 对比引理 2.3 中的特征值扰动界与定理 2.5 的式(2-13),可以看出定理 2.5 的特 征值的扰动界也随着 Hermitian 矩阵特征值的特征向量的范数界的优化而优化。 对比引理 2.3 中的特征值扰动界与推论 2.1 中的式(2-14)和推论 2.2 中的式 (2-15),可以看出推论 2.1 和推论 2.2 的特征值的扰动界也随着 Hermitian 矩阵的特征 向量的界的优化而优化。 对比定理 2.5 的式(2-13)与推论 2.1 中的式(2-14)和推论 2.2 中的式(2-15),由 i 1 和 i 1 ,发现式(2-13)的扰动界是优于式(2-14)和式(2-15)的扰动界。 因此,在本节中,通过缩小特征向量的某个分量的范数界,可以达到优化特 14 第二章 对 2×2 块 Hermitian 矩阵特征值扰动界的优化 征值的扰动界。也就是说达到了特征值扰动界的优化目的。下面给出一个数值算 例来证实本文对 2×2 块 Hermitian 矩阵特征值扰动界特征值扰动界的优化。 2.3 数值例子 例 2.3.1 考虑一个简单数值算例 7 7 3 0 7 4 0 1 , A 3 0 1 1 0 1 1 2 105 105 0 103 5 10 0 0 0 . E 0 0 0 0 3 0 0 2 104 10 将 Hermitian 矩阵 A 与 A+E 进行 2 阶分块,即 3 0 A21 , 0 1 0 E21 3 10 3 用 MATLAB 计算得到 E 2 1.1095 10 。 表 2-1 0 , 0 特征值扰动界的比较 1 1 2 2 3 3 4 4 精确值 4.3297 105 2.1903 104 1.1558 104 6.3256 105 引理 2.3 7.4635 104 3.1995 101 1.6937 102 7.3665 104 推论 2.1 6.8381 104 9.2828 104 9.4988 103 7.3665 104 推论 2.2 7.0339 104 2.2152 103 2.1770 103 7.3945 104 定理 2.5 2.1591 103 9.2874 104 9.6891 104 2.2084 103 特征值扰动界 由表 2-1 的特征值扰动界的比较,可对比出本文的扰动界是比较优化的,即达 到了对之前文献的特征值界的优化。 15 电子科技大学硕士毕业论文 2.4 本章小结 总之,本章是对带扰动的 2×2 块 Hermitian 正定矩阵特征值界问题进行展开, 利用特征值与特征向量的关系,通过对与特征值相对应的特征向量的优化界定, 得到了较优化的特征值扰动界,并用数值实验说明了本文方法的高效性。 16 第三章 广义 Hermitian 矩阵特征值扰动界的研究 第三章 广义 Hermitian 矩阵特征值扰动界的研究 3.1 引言 在研究广义 Hermitian 矩阵特征值扰动界问题之前,先给出本章即将会用到的 几个相关定义和定理。 定义 3.1[1] 定义矩阵 A 的特征值多项式为: f ( ) det( I A) ,其中 I 为单 位矩阵。 定义 3.2[2] 定义线性广义特征值问题为: Ax Bx , 其中 A,B C ( m n )( m n ) , A 是 Hermitian 矩阵,B 是正定 Hermitian 矩阵, x C m n , x 0 , C 。 随着研究的深入,就将上述问题归结为广义特征值问题。自从学者 Weierstrass 和 Kronecker 发表有关广义特征值解法论文后,就有著名的 Fix-Herberger 算法, Crawford 算法等问世。在研究出广义特征值问题算法的同时,同步地开始了广义 特征值扰动理论研究。但是,需要注意的是,从矩阵扰动分析方面可看出广义矩 阵特征值问题 Ax Bx 与普通特征值问题 Ax x 的区别。 下面给出矩阵束、广义特征值和广义特征值相对应的广义特征向量的概念。 定义 3.3[2] 对于 A,B C ( m n )( m n ) ,就把 A B 叫做矩阵束,其中 C 。一 对矩阵 A 与 B 为与矩阵束相对应的矩阵对,记为 A, B。 定义 3.4[2] 设 A,B C ( m n )( m n ) ,若对于某个复数 ,存在着非零向量 x C m n , 满足等式 Ax Bx ,那么就称复数 为矩阵 A 相对于 B 的特征值,或称 为 A 与 B 所确定的广义特征值。其中,非零向量 x 称之为与广义特征值 相对应的广义特征 向量。 定义 3.5[2] 设 A,B C ( m n )( m n ) ,若满足 det( A B ) 0, C ,则称 A, B为 m n 阶正则矩阵对(以下简称正则对);若 det( A B ) 0, C ,则称 A, B为奇 异矩阵对(以下简称奇异对)。 定义 3.6[2] 定义正则矩阵对 A, B的特征值多项式为: f ( ) det( A B) 。 就广义矩阵对而言,学者 Weierstrass 和 Kronecker 分别给出了正则对和奇异对 的标准形式,在本文中所研究的矩阵对 A, B均是正则对。下面两定理即是对正则 对和奇异对的标准形式的阐述。 定理 3.1[2] ( Weierstrass )设 A, B 是 n 阶正则对,那么就存在非奇异矩阵 17 电子科技大学硕士学位论文 P, Q C nn ,使得 PAQ J A , PBQ J B , 其中 J JA 0 J ( n1 ) JB 0 0 , ( n2 ) I 0 , N J diag J1 (1 ), , J r (r ) C n1n2 , i j i j , 1 i, j r , J i i diag J i(1) i , , J i( ki ) i , i 1 , J i( k ) i 1 i ki n n , k 1 k i 1 i r , i r n n , i i 1 1 N diag N ( i1 ) , , N ( is ) C n2 n2 , 0 1 i , N j 1 0 s l i 1 j n2 , 以及 n1 n2 n . 定理 3.2[2] (Kronecker) 设 A, B C mn ,A, B为奇异对,那么必然存在非奇异 矩阵 P C mm 和 Q C nn ,使得满足 0 0 J J , PAQ A PBQ B . 0 LA 0 LB 其中 J A , J B C ( n1 n21 )( n1 n2 ) , L A , LB 的形式如下面所示: 18 第三章 广义 Hermitian 矩阵特征值扰动界的研究 L j1 L jp LA , T L g1 LTg q L' j 1 L' j p , LB L'gT1 L'gTq 1 0 0 1 k ( k 1) ' C k ( k 1) . Lk , Lk C 1 0 0 1 其中 k f1 , , f p , g1 , , g q 。 定理 3.3[1] 设 A C ( m n )( m n ) 是 Hermitian 矩阵,B C ( m n )( m n ) 是正定 Hermitian 矩阵,则存在可逆矩阵 T C ( m n )( m n ) ,使得有 T H AT , T H BT Em n , 其中 diag (1 , 2 , , n ) 是对角矩阵。 通过此定理,可知,存在可逆矩阵矩阵 T C ( m n )( m n ) ,使得 A, B中的矩阵能 被对角化或者被合同。 在研究了一般 2×2 块 Hermitian 矩阵的单特征值扰动界后,本文将着眼于研究 广义 Hermitian 矩阵(2×2 块)的多重特征值和单特征值扰动界问题。 现考虑如下模型 A A 11 0 0 , A22 B B 11 0 0 , B22 其中矩阵 A 与 B 的阶数为 m n 。 当 Hermitian 矩阵 A 与 B 分别经历如下扰动 E12 A B , A A E 11 B B F 11 E21 A22 F21 F12 . B22 (3-1) 此时的矩阵 E 、 F 不一定是 Hermitian 矩阵。 考虑矩阵束 A B 会因矩阵 B , E , F 的不同形式可能会产生的两种变化,从而 19 电子科技大学硕士学位论文 得到下面几节的特征值扰动问题分析,其中包括标准矩阵特征值扰动问题和广义 特征值,也包括多重特征值问题和单特征值问题。 3.2 Hermitian 正定矩阵的多重特征值扰动 若 A11 I m , B11 I m , B22 I n , E 0 (且为对称正定矩阵), F 0 。 即有 0 I , A m A22 0 那么就有矩阵特征值方程 0 E E21 E21H . 0 (3-2) Ax i x , 和扰动后的矩阵特征值方程 A E x i x . 其中, i 是矩阵 A 的第 i 个特征值, i 是矩阵 A E 的第 i 个特征值。 则此类广义特征值扰动问题就变为标准特征值扰动问题。在文献[5]已经讨论 出的标准特征值扰动界的基础上,通过对矩阵 A 做 k k 阶分块,本文对其做了细 微修改,从而可以给出新的扰动界。并且,能够从中分析 Hermitian 矩阵的多重特 征值的不同扰动行为。 本节中,基于文献[3-5]的基础上,讨论多重特征值扰动界。有两种思路: 一、通过重新分块矩阵,将特征值扰动界一般化; 二、重新定义形式更一般化的可逆矩阵 X ,来推广扰动界。 对于式(3-2)中的模型,设 A11 I m , B I , F 0 。定义矩阵 A , A 特征值为: 1 2 m n , 1 2 m n , 其中, 是矩阵块 A11 I m 的特征值,重数为 m 。设 是 A22 的任意特征值,定义 是 A11 I m 与 A22 的特征值误差界的最小值 min . 引理 3.1 [5] 设 Hermitian 正定矩阵 A 如式(3-1),且 A11 I m , B I , E 0 , F 0 ,对于任意 i 1, 2, , m n ,则得到多重特征值 的扰动界: i 2 E21 2 2 2 4 E21 2 . (3-3) 2 有关引理 3.1 的一点说明:在文献中,已有对此引理的证明方法,但是,换种 角度,可以尝试可以利用行列式的相关计算来证明。具体证明过程如下: 证明:首先利用特征值方程 20 第三章 广义 Hermitian 矩阵特征值扰动界的研究 A E x i x 可得到 A11 i I m E21 其中 A11 I m ,由行列式可推出 I I i m A 22 i I n E21 E21H 0 , I I A I I I E E 0 , I A I I I 和 E E 是 Hermitian 正定矩阵,根据 m 设矩阵 I m m E21H 0 A22 i I n i m i m 22 n 22 n n n i n H 21 21 i n H 21 21 Hermitian 正定矩阵行列式的性质以及 是 A22 的任意特征值可得 I m i I m A22 I n I n i I n E21 E21H 2 I m i I m I n i I n E21 2 , 即有不等式: i i E21 2 0 , 2 i2 i E21 2 0 , 2 此式是关于未知数 i 的一元二次不等式,求解得 i 2 2 2 2 或 i 4 E21 4 E21 2 2 2 2 , 整理上式,从而得出 i 2 4 E21 2 2 2 或 i 2 4 E21 2 2 . 2 通过求解有关 i 的一元二次不等式,可以得到扰动后的特征值 i 的上界和下 界,只选择 的下界,那么就可得出多重特征值 的扰动界为 i i 2 21 2 4 E21 2 2 电子科技大学硕士学位论文 4 E21 2 4 E21 2 2 2 2 2 E21 2 2 2 . 2 由 min ,且上式是关于 单调递减函数, 因此就可得到 i 2 E21 2 2 4 E21 2 2 . ■ 式(3-3)给出了标准矩阵多重特征值的扰动界,此扰动界与扰动矩阵 E 的某一 个分块矩阵的算子二范数有关,也与矩阵 A 的两个分块矩阵 A11 , A22 各自的特征值 2 有关。由于以上的讨论都是将矩阵 A 分块为 m 阶和 n 阶,矩阵 E 分块为 m 阶和 n 阶, 由此猜想可以考虑分块后的矩阵为任意阶的吗。如果可行,那就可以将此扰动界 进行推广,从而得出更加一般化的扰动界理论。 现在,将矩阵 A 分块。对于 1 k m ,m 为 Hermitian 矩阵 A11 块的特征值重数。 令 A11( k ) I 1:k ;1:k , A22( k ) diag I k 1:m n;k 1:m n , A22 . 此时,令 A 的任意特征值为 ( k ) ,则 A 的任意特征值不一定与 A22 的任意特 (k ) 22 (k ) 22 (k ) ( m) 征值相同,当 k m 时,即是有 A22 A22 =A22 ,也就有 ( k ) ( m ) v 。 定理 3.4 设 Hermitian 正定矩阵 A 如式(3-1)定义。重新定义 A 的两分块矩阵特 征值最小界为 ( k ) min ( k ) . 对于 1 k m ,1 i k ,那么 Hermitian 正定矩阵的多重特征值的扰动界可界 定为: i 2 E21 (k ) (k) 2 2 2 . 4 E21 (3-4) 2 2 特别地,当 k m 时,特征值的扰动界是最小的。 证明:由式(3-3)和 ( k ) min ( k ) ,对 1 k m 很容易的得到了式(3-4)。下 面证明当 k m 时,特征值的扰动界是最小的。分两种情况说明: (1):若 k m ,则 ( k ) v , ( k ) min ( k ) 0 ,那么就有多重特征值 扰动界为: i 2 E21 (k ) (k) 2 22 2 2 4 E21 . 2 2 第三章 广义 Hermitian 矩阵特征值扰动界的研究 (k ) (2):若 k m ,则 ( k ) ,那么 n 阶矩阵 A22 的某个特征值 ( k ) 可能等于特征 值 ,那么就有 ( k ) min ( k ) 0 ,即 2 2 E21 2 i E21 2 , 2 4 E21 2 因为 E21 2 2 E21 (k ) (k) 2 2 , 2 4 E21 2 2 因此,情况(2)的扰动界大于(1)中的界。 因此,此定理可用来说明当 k m 时的特征值扰动界是优于当 k m 的情况, 其中 1 k m , 1 i k 。在进行研究时,一般选择对矩阵 A 分块为 m 阶和 n 阶, 矩阵 E 分块为 m 阶和 n 阶,其中 m 为多重特征值 的重数,这样得到的多重特征 值扰动界是最优化的。 3.3 数值例子 例 3.31 考虑 4 阶 Hermitian 正定矩阵 A 、 E 1 0 2 1 1 0 0 0 0 0 2 1 0 1 1 3 0 1 0 0 0 0 1 3 , , , A E A 0 0 2 4 2 1 0 0 2 1 2 4 0 0 4 3 1 3 0 0 1 3 4 3 此时 1 0 2 4 2 1 A22 A11 , , E21 , 0 1 4 3 1 3 则 1 ,且 eig ( A) 为 Hermitian 正定矩阵 A 的两重特征值,通过 MATLAB 计 算得 A22 的特征值是 1.5311 和 6.5311 。则 (1):若 k 1 , k min k 1 1 0 ; (2):若 k 2 , k min k 1 (1.5311) 2.5311 0 ; 因此,对取不同的 k ,就可得到不同的特征值扰动界为 2 2 E21 2 (1):若 0 ,则 i E21 2 4 E21 2 k (2):若 3 0 ,则 i 2 2 E21 k k 2 k 3.618 ; 2 1.0191 3.618 ; 2 4 E21 2 2 注记 3.1 比较上面(1),(2)两种情况,证明到在对矩阵 A 如下分块时, 23 电子科技大学硕士学位论文 A( k ) A 11 0 0 , A22( k ) 选择令 k m (其中 m 是 A11 的多重特征值的重数),会使扰动界变得更加优化。 注记 3.2 见文献[9],可知道在广义 Hermitian 正定矩阵扰动下,多重特征值有 不同的敏感行为。同样的,也可以分析出在对一般 Hermitian 正定矩阵扰动下,多 重特征值也有不同的敏感行为。 在例 3.31 中,矩阵 A 有二重特征值 1 ,那么可分为以下两种情况: 若 k 1 , k 0 ,那么 1 1 3.618 ; 若 k 2 , k 3 ,那么 1,2 1 1.8871 3.618 ; 这样就意味着对矩阵 A 的二重特征值 1 而言,其中一个特征值对扰动的敏 感性要高于另外一个。因此,定理 3.4 也可用来解释一般 Hermitian 矩阵多重特征 值对扰动的不同敏感程度。 3.4 广义 Hermitian 正定矩阵的特征值对称扰动界 前面分析了标准 Hermitian 正定矩阵的特征值扰动界问题,并且解释了多重特 征值在扰动下的不同敏感程度。接下来研究有关广义 Hermitian 正定矩阵的特征值 扰动界问题。广义 Hermitian 正定矩阵模型如下: 若矩阵 A, B 是 Hermitian 矩阵,且有 A11 I m ,B11 I m ,B22 I n ,E 0 ,F 0 , 并且 E , F 也为 Hermitian 矩阵: I E21H A A E m , A22 E21 I m F21H B BF , F21 I n F21 2 1 . (3-5) 则矩阵 I F21 F21H 是 Hermitian 正定矩阵。 通过上述定义,可知道扰动后的矩阵对 A , B 为正则对,则此类特征值扰动问 题就是广义特征值问题。 对任意的 i 1, 2, , m n ,定义矩阵 A B 的第 i 个特征值为 i ,矩阵 A B 的 第 i 个特征值为 ,并且按照降序排列如下 i 1 2 m n , 1 2 m n . 定义 min 2 , 2 eig ( A22 , B22 ) i i 1 , eigmin 1 ( A11 , B11 ) i 24 i eig ( A11 , B11 ) i eig ( A22 , B22 ) , 第三章 广义 Hermitian 矩阵特征值扰动界的研究 min i 1i m n min 1eig ( A11 , B11 ), 2 eig ( A22 , B22 ) 1 2 . 在推广广义矩阵特征值扰动界问题之前,先给出几个比较经典的特征值结论。 [6] 引理 3.2 设矩阵 A 和 A 均是 (m n) (m n) 阶 Hermitian 正定矩阵,并且让 其特征值 i 1 i m n 和 i 1 i m n 按照降序排列,设 min (W ) 、 max (W ) 为 矩阵 W 的最小、最大奇异值。那么就有 (a) A A ,其中 1 i m n ; i i 2 2 (b)若A W H AW ,那么存在 ti 1 i m n ,满足 min (W ) ti max (W ) , 使得 t ; i i i (c)设 Q 为 (m n) m 阶正交矩阵,即 Q H Q I m ,设 i 为 H Q H AQ 的降序 排列的特征值。那么就有 m 个特征值 i 满足 1 2 m , 使得 i i AQ QH 2 , n i 1 i i 2 1 i m AQ QH F . 此引理包含了经典的 Weyl 定理,即特征值扰动界与扰动矩阵的范数有关。对 于研究广义特征值扰动界其中举足轻重的作用。 下面,根据此引理,展开广义特征值扰动界的分析。 首先给出已有的研究方法如下,模型为 H A A E A11 E21 , E21 A22 I F21H F21 2 1 . B B F m , F21 I n 对于 m n 维矩阵 X 与 W ,假设上式中的分块矩阵 F21 满足 F21 2 1 ,那么 I F21 F21H 是 Hermitian 正定矩阵,定义 I X m 0 F21H , In Im W 0 , I n F21 F21H 0 1/ 2 (3-6) 根据定理 3.3,可以对 Hermitian 矩阵 A 进行合同变换,对 Hermitian 正定矩阵 B 进 行对角化相似变换。因此,就存在矩阵 B 与 A ,使得有 0 2 Im B X H BX (3-7) 0 I F F H W , 21 21 n A11 A11 F21H E21H . A X H AX H H H F21 A11 E21 A22 E21 F21 F21 E21 F21 A11 F21 现在考虑下面四种特征值问题: 25 (3-8) 电子科技大学硕士学位论文 ˆ 1 I ); EIG(a):矩阵束 A B (该矩阵束与矩阵 W 1 AW mn ˆ EIG(b): A I ; mn A11 EIG(c): F21 A11 E21 A11 F21H E21H I mn ; A22 EIG(d): A I m n ; 先定义 EIG x 的特征值为 i( x ) ,并且按照降序排列为 1( x ) 2( x ) m( x)n , 则有 i( a ) i 和 i( d ) i 。 EIG(a)- EIG(b) 由引理 3.2(b)可知,存在 ti 1 i m n ,满足 1/ max (W ) min (W 1 ) ti max (W 1 ) 1/ min (W ) 2 2 2 2 使得 i( a ) ti i(b ) 或 i( b ) ti1i( a ) , 可以知道 max (W ) 1 , min (W ) 1 F21 2 2 。那么有 0 1 ti1 F21 2 . 2 EIG(b)- EIG(c) 根据引理 3.2(a),对 1 i m n ,有 ib i c E21 F21H F21 E21H F21 A11 F21H 2 . EIG(c)- EIG(d)根据引理 3.2(c), 对 1 i m n ,有 c d i i 2 A11 F21H E21H 2 . H 2 21 2 i 4 A F E 2 i 2 H 11 21 2 E21 F21 A11 2 2 4 E21 F21 A11 2 2 . (3-9) 2 综合以上对界的三步讨论,对于 1 i m n ,可根据三角不等式放缩得到特征值 扰动界 i i i a i d i i i i i i a b b c c d 1 ti1 i a i b i c i c i d 26 第三章 广义 Hermitian 矩阵特征值扰动界的研究 F21 2 2 i E21 F21H F21 E21H F21 A11 F21H 2 E21 F21 A11 2 2 2 i 4 E21 F21 A11 2 i 2 . (3-10) 2 以上就是文献[6]对广义 Hermitian 正定矩阵特征值扰动界的一个估计,最终得 出了式(3-10)。所用的方法就是定义出可逆矩阵 X 与 W ,对矩阵 A 与 B 进行可逆变 换,得到对角矩阵 B 以及结构特殊的矩阵 A ,从而利用引理 3.2 的相关内容逐步得 到特征值的扰动界。 同时,考虑到本节中矩阵 A11 的特殊结构,它是除开主对角线上元素为 ,其 余全为 0 的 m 阶方阵,那么可以通过重新定义矩阵 X 的形式,来推广广义 Hermitian 矩阵特征值扰动界。下面将给出本文对此问题的推广过程。 首先,重新定义矩阵 X , W 为 1 Im X 0 F21H , I n (3-11) 1 0 Im W . H 1/2 0 I n F21 F21 那么存在矩阵 A , B ,满足 1 0 I 2 m H W2, B X BX I n F21 F21H 0 1 I m H A X AX 1 F21 E21 F21H 1 . H F21 F21 E21H A22 E21 F21H F21 E21H 结合前面讨论方法,考虑以下五种特征值问题: ˆ 1 I ); EIG(a):矩阵束 A B (该矩阵束与矩阵 W 1 AW mn ˆ EIG(b): A I ; mn I m EIG(c): 1 F21 E21 1 E21H I m n ; A22 F21H 1 27 (3-12) 电子科技大学硕士学位论文 1 Im EIG(d): 0 0 I m n ; A22 EIG(e): A I m n ; 同样地,先定义 EIG x 的特征值为 i( x ) ,并且按照降序排列为 1( x ) 2( x ) m( x)n , 则有 i( a ) i 和 i( d ) i 。 EIG(a)- EIG(b)由引理 3.2(b)可知,存在 ti 1 i m n ,满足 1/ max (W ) min (W 1 ) ti max (W 1 ) 1/ min (W ) 2 2 2 2 使得 i( a ) ti i(b ) 或 i( b ) ti1i( a ) . 设存在实数 min , max ,从而可得 1 max (W ) max , 1 F 2 max , 2 1 min (W ) min , 1 F21 2 min , 2 则有: 1 ti 1 , max min 2 1 2 min ti max , 2 2 1 max 1 ti1 1 min , 从而有: i a ib i a ti1i a 1 ti1 i a 1 ti1 i . EIG(b)- EIG(c)根据引理 3.2(a),对 1 i m n ,有 ib i c E21 F21H F21 E21H F21 A11 F21H 2 . EIG(c)- EIG(d)根据引理 3.2(c), 对 1 i m n ,有 c d i i 2 F21 1 2 E21 2 1 i 4 F21 2 i 2 F21 1 E21 2 2 E21 2 4 F21 28 2 2 1 2 E21 2 . 第三章 广义 Hermitian 矩阵特征值扰动界的研究 EIG(d)- EIG(e)根据引理 3.2(a),有 1 i d i c I m A11 2 1 1 Im . 2 综合以上五种特征值扰动界,利用三角不等式就可得下面的定理。 定理 3.5 设 I F F H 是 Hermitian 正定矩阵,矩阵束 A B 和 A B 中的矩 21 21 阵 A 、 B 被定义如式 (3-5) ,矩阵 X , W 定义如式 (3-11) , (3-12) 。可得到广义 Hermitian 正定矩阵的特征值扰动界为 a e i i i i i i i i i i i i a b b c c d d e 1 ti1 i a ib i c i c i d i d i e 2 1 min i E21 F21H F21 E21H F21 F21H 2 F21 1 2 E21 2 i i2 4 F21 其中 2 1 2 1 (3-13) E21 2 i eig A B , i eig A B , min 为式(3-12)中矩阵 W 的最小奇异值。 式(3-13)表示的是在 Hermitian 矩阵 E 和 F 扰动下的矩阵束 A B 与 A B 的 特征值的扰动界,此扰动界是借鉴文献[6]中扰动界的讨论方法,将一般 Hermitian 正定分块矩阵 0 A A 11 0 A22 改为特殊的 Hermitian 正定分块矩阵 I , A m A22 而矩阵 B 的形式不变,扰动矩阵也不变,从而得到此类特殊广义矩阵的特征值扰 动界。同时,发现式(3-13)的界是式 (3-10)的一个推广,当且仅当 1 时,式(3-13) 的界就等于式 (3-10)中的扰动界。因此,通过本节,实现了对广义矩阵特征值扰 动界的一个推广。 29 电子科技大学硕士学位论文 3.5 数值例子 考虑 Hermitian 矩阵 A, B, E , F 的形式如下,扰动后的矩阵为 A , B ,则有: A A E , B B F , 0 0 2 1 2 0 0 0 0 2 0 0 0 0 1 3 , , E A 0 0 2 4 2 1 0 0 0 0 4 3 1 3 0 0 0 0 1 3 1 0 0 0 0 0 5 4 0 1 0 0 , , F B 0 0 1 0 1 5 0 0 0 0 0 1 3 4 0 0 1 0 1 3 2 0 2 1 0 1 5 4 0 2 1 3 A , , B 2 1 2 4 1 5 1 0 1 3 4 3 3 4 0 1 其中 2 1 E21 , 1 3 1 5 F21 . 3 4 利用式(3-13),MATLAB 工具计算出 min 0.5 ,i 3.7464 , 2 , 那么就可得到广义矩阵 A B 与广义矩阵 A B 的特征值误差界 2 i i 1 min i E21 F21H F21 E21H F21 F21H 2 F21 1 2 2 E21 i i2 4 F21 2 1 2 1 E21 2 0.75 i 3.7884 . 此数值算例验证了广义 Hermtian 矩阵特征值扰动界理论,证明了式(3-13)的可 行性。该数值算例中矩阵 A 有 2 重特征值 2 ,则可得出相应特征值扰动界。那 么当矩阵没有多重特征值时,也可得出特征值的扰动界。 30 第三章 广义 Hermitian 矩阵特征值扰动界的研究 3.6 本章小结 在本章中,首先利用对矩阵进行重新分块来推广了多重特征值扰动界,得出 了更一般化的结论,并且借助多重特征值扰动界分析了 Hermitian 矩阵多重特征值 的不同敏感行为。其次根据文献[6]通过对矩阵 A , B 进行相似变换,将其化为具有 特殊形式的矩阵,利用引理 3.2 的几个重要结论来研究广义 Hermitian 矩阵的多重 特征值扰动界。并且用 Hermitian 矩阵的多重特征值扰动问题和广义 Hermitian 矩 阵的特征值扰动问题做奠基,得出广义 Hermitian 矩阵多重特征值扰动界,并且给 出了数值例子来支撑了扰动界的可行性。 31 电子科技大学硕士学位论文 第四章 论文总结和展望 4.1 论文总结 本文主要研究了 2×2 块 Hermitian 特征值扰动界问题和广义 Hermitian 矩阵多 重特征值的扰动界扰动。在多重特征值扰动问题中,深入分析,得到了一些更优 化的扰动界。每一章都通过列举数值例子,利用 MATLAB 工具计算出结果,将结 果与已有的结论做对比,能明显看出特征值的扰动界达到了优化。下面将分板块 总结本文主要做的研究工作: (1) 第一章是绪论,主要介绍论文选此题目作为研究的背景,系统给出有关矩 阵论中特征值的相关定义、定理,并且给出了关于 Hermitian 矩阵的特征值扰动定 理,基于这些基础知识,方便本文的研究,为展开讨论打下了理论基础。 (2) 第二章研究了 2×2 块 Hermitian 矩阵特征值扰动界的优化,通过对特征向 量的范数界进行相应的优化界定,得到了特征值的扰动界的一个新界,此界要比 文献[3]的扰动界要优化,并用数值实验说明了本文方法的高效性。 (3) 第三章研究的是广义矩阵特征值扰动界问题,与第二章的思路是不一样 的。先是对文献[6]的一般 Hermitian 正定矩阵多重特征值扰动界进行推广,得到更 加一般化的扰动界;再根据文献已有的广义特征值扰动界理论,通过给出更一般 化的矩阵形式来推广广义矩阵特征值扰动界。 4.2 工作展望 本文主要研究了 2×2 块 Hermitian 特征值扰动界问题和广义 Hermitian 矩阵特 征值的非对称扰动界扰动。方法一是对特征向量范数界进行优化界定,利用特征 值的微分公式和积分公式来得到特征值的扰动界的一个形式,而这个形式是与特 征向量的分量的范数界有关,那么就可以得到较文献更加优化的特征值的扰动界。 方法二是借助学者 Y.J. Nakatsukasa 和 Ren-cang Li 文献[5]中谈到的一般 Hermitian 矩阵多重特征值的扰动界问题,基于文献,本文给出特征值扰动界更一般化的形 式,具有一定的推广意义。方法三是基于学者 Y.J. Nakatsukasa 和 Ren-cang Li 文献 [6]中提出的有关广义矩阵特征值扰动界理论,通过选取更一般的可逆矩阵 X 和 W , 来推广更一般的特征值扰动界。 之前学者们和本文所研究的这些特征值界的理论都是非常好的结论,但这些 结论存在美中不足,就是特征值扰动界在不等式放缩过程中会有比较大的误差。 那么能否在今后的研究工作中进行这方面的完善,将是必须要解决的问题。本文 所有的研究都是基于对 Hermitian 矩阵进行的对称扰动,那么,可以基于有这些对 32 第四章 论文总结和展望 称扰动比较完备的理论,可以逐步展开带非对称扰动下的特征值扰动界的研究。 本文研究的是特征值的扰动界,那么可以拓展到矩阵的奇异值的扰动界问题上, 从而使得扰动理论更加丰富。总之,学无止境,后续的矩阵扰动的研究将继续。 33 电子科技大学硕士学位论文 致 谢 在我研究生三年学习生活里,我最想感谢的人就是我的研究生导师程光辉副 教授,感谢他平日里对我的谆谆教诲,对我毕业论文的悉心指导和严格要求,这 些都让我受益匪浅。不管在学习上、生活上以及做人做事上,程老师都无微不至 的指导我,同时,本文能选定此题目,能最后完成都要特别感谢我的导师程老师。 非常感谢我父母为我做的所有。在学习和生活上,他们一直都在精神上、物 质上无条件的支持我。他们教会我尊重他人,乐观积极面对任何困难。没有他们, 就没有现在的我。 人生成长路上,我的那些可爱同学们和我的朋友们,都给予了我非常真诚的 帮助。在今后的人生道路上,我会将这三年与他们在一起的学习生活的点滴牢牢 记住,谢谢你们。 感谢电子科技大学数学科学学院的各位领导和老师对我的关心和支持。没有 你们,我研究生三年的学习生涯一定会有各种不顺利。 感谢各位专家学者能在我毕业季给我最中肯的宝贵指导意见,谢谢你们百忙 之中参加我的论文答辩。 34 参考文献 参考文献 [1] 黄廷祝,钟守铭,李正良.矩阵理论[M]. 北京:高等教育出版社,2003 [2] 孙继广,矩阵扰动分析.科学出版社,1987 [3] Y. J. Nakatsukasa. Eigenvalue perturbation bounds for Hermitian block tridiagonal matrices. Applied Numerical Mathematics, 2012, 62(1): 67-78 [4] C. K. Li and C. R. Li. A note on eigenvalues of perturbed Hermitian matrices. Linear Algebra and its Applications, 2005, 395: 183-190 [5] R.C. Li, Y. J. Nakatsukasa, N. Truhar, W. G. Wang. Perturbation of multiple Eigenvalues of Hermitian matrix. Linear Algebra and its Applications, 2012,437(1): 202-213 [6] R.C. Li, Y. J. Nakatsukasa, N. Truhar, S. F. Xu. Perturbation of partitioned Hermitian definite generalized eigenvalue problem. SIAM Journal on Matrix Analysis and Applications, 2011, 32(2): 642-663 [7] Y. J. Nakatsukasa. Perturbation behavior of a multiple eigenvalue in generalized Hermitian eigenvalue problems. Numerische Mathematik, 2010, 50(1): 109-121 [8] Barlow, J. Slapnicar. Optimal perturbation bounds for the Hermitian eigenvalue problem. Linear Algebra and its Applications, 2000, 309(1-3): 19-43 [9] G. Stewart and J. G. Sun. Matrix Perturbation Theory. Academic Press, San Diego, 1990 [10] Y. J. Nakatsukasa. Absolute and relative Weyl yheorems for generalized eigenvalue problems. Linear Algebra and its Applications, 2010, 432(1): 242-248 [11] I. C. F. Ipsen, B. Nadler. Refined perturbation bounds for eigenvalues of Hermitian and non-Hermitian matrices. SIAM Joural on Matrix Analysis and Application, 2009. 31(1): 40-53 [12] R. Bhatia. Matrix Analysis. Grad.Texts in Math.169, Springer, New York, 1996 [13] W. Kahan. Inclusion theorems for clusters of eigenvalues of Hermitian matrices. Technical report, Computer Science Department, University of Toronto, 1967 [14] S. Solov'ev. Preconditioned iterative methods for a class of nonlinear eigenvalue problems. Linear Algebra and its Applications, 2006, 415(1): 210-229 [15] J. M. Cuppen. A divide and conquer method for the symmetric tridiagonal eigenproblem. Numerische Mathematik, 1981, 36(2): 177-195 [16] Ross A.Lippert. Fixing two eigenvalues by a minimal perturbation. Linear Algebra and its Applications, 2005, 406(1): 177-200 [17] C. Ashcraft, R. Grimes and J.Lewis. Accurate symmetric indefinite linear equation solvers. SIAM Journal on Matrix Analysis and Applications, 1998, 20(2): 513-561 35 电子科技大学硕士学位论文 [18] B. Parlett. The symmetric eigenvalue problem. SIAM, Philadelphia, 1998 [19] S. C. Eisenstat and I .C. F. Ipsen. Relative perturbation techniques for singular value problems. SIAM Journal on Matrix Analysis and Applications, 1995, 32(6): 1972-1998 [20] R. C. Li. Relative perturbation theory I in eigenvalue and singular value variation. SIAM Journal on Matrix Analysis and Applications, 1998, 19(4): 956-982 [21] R. C. Li. Matrix perturbation theory . Linear Algebra, L.Hogben,R.Brualdi, A.Greenba-Um, and R.Mathisa, eds, CRC Press, Boca Raton, FL, 2006 [22] R. Mathias. Quadratic residual bounds for the Hermitian eigenvalue problem. SIAM Journal on Matrix Analysis and Applications, 1998, 19(1): 541-550 [23] G. W. Stewart and J. G. Sun. Matix peturbation theory. Academic Press, Boston, 1990 [24] M. Heath. Scientific computing-an introductory survey. McGrawHill, New York, 1997 [25] J. G. Sun. Eigenvalues of Rayleigh quotient matrices. Numerische Mathematik, 1991, 59(1): 603-614 [26] 徐树方. 矩阵计算的理论与方法[M]. 京大学出版社, 1999 [27] 黄廷祝,杨传胜. 特殊矩阵分析及应用[M]. 北京:科学出版社,2007 [28] 陈公宁. 矩阵理论与应用[M]. 北京:科学出版社,2007 [29] R.A.Horn, R.C.Johnson. Matrix Analysis[M]. New York: Cambridge University Press, 1985 36 攻硕期间取得的研究成果 攻硕期间取得的研究成果 [1] GuangHui Cheng, Qin Tan, Zhuangde Wang. A note on eigenvalues of perturbed 2×2 block Hermitian matrices. Linear and Multilinear Algebra, 2014, Dol:10.1080/03081087.903252, 1-7 [2] GuangHui Cheng, Qin Tan, Zhuangde Wang. Some inequalities for the minimum eigenvalue of the Hadamard product of an M-matrix and its inverse. Journal of Inequalities and Applications 2013, 65: 1-9 37 巧挤 E N C E A N D TE C H N OL OG . Y O F CH I 靡 NA ’ 霉 繫 硕i学似论 M A S T E R T H E S I S ? . r . * I ? : .骑 3C * — ‘ j S H 訓 菊 i . , 稽 ■ ; : , . 城 r ! ; ; t ! 奪藝 骑 ii ? c il jf ■I ^ 1