Диагонализируемая матрица

В линейной алгебре квадратная матрица A называется диагонализируемой, если она подобна диагональной матрице, то есть если существует невырожденная матрица P, такая что P−1AP является диагональной матрицей. Если V — конечномерное векторное пространство, то линейное отображение T : VV называется диагонализируемым, если существует упорядоченный базис в V, при котором T представляется в виде диагональной матрицы. Диагонализацией называется процесс нахождения соответствующей диагональной матрицы для диагонализируемой матрицы или линейного отображения.[1] Квадратная матрица, которую нельзя диагонализировать, называется дефектной.

Диагонализируемые матрицы и отображения интересны, поскольку с диагональными матрицами просто работать: собственные значения и векторы известны, возведение в степень осуществляется возведением в степень диагональных элементов, определитель равен произведению диагональных элементов. С геометрической точки зрения диагонализируемая матрица представляет собой неоднородное масштабирование: в каждом направлении растяжение происходит в общем случае с разным коэффициентом в зависимости от числа на диагонали.

Фундаментальный факт о диагонализируемых отображениях и матрицах выражен в следующих утверждениях.

Матрица или линейное отображение диагонализируемо над полем F тогда и только тогда, когда минимальный многочлен является произведением линейных множителей над полем F. Иными словами, матрица диагонализируема тогда и только тогда, когда все делители минимального многочлена являются линейными.

Следующее условие (достаточное, но не необходимое) часто является полезным.

Пусть A матрица над F. Если A диагонализируема, то любая её степень будет диагонализируемой. Если A обратима, F алгебраически замкнуто, An диагонализируемо для некоторого n, не являющегося кратным характеристике F, то A диагонализируема.

Над C почти любая матрица является диагонализируемой. Более точно: множество комплексных матриц размера n×n, не являющихся диагонализируемыми над C, при рассмотрении в виде подмножества Cn×n имеет нулевую меру Лебега. Можно также сказать, что диагонализируемые матрицы образуют плотное подмножество в рамках топологии Зарисского: дополнение к этому подмножеству лежит множестве, в котором дискриминант характеристического многочлена обнуляется, то есть на гиперповерхности. Над R это не выполняется.

Декомпозиция Жордана-Шевалле представляет оператор в виде суммы диагонализируемой и нильпотентной части. Следовательно, матрица является диагонализируемой тогда и только тогда, когда нильпотентная часть нулевая. Иными словами, матрица диагонализируема, если каждый блок жордановой формы не имеет нильпотентной части.

Векторы столбцов P являются правыми собственными векторами A, соответствующие диагональные элементы являются собственными значениями. Обратимость P также предполагает, что собственные вектора линейно независимы и образуют базис в Fn. Это необходимое и достаточное условие для диагонализируемости. Векторы строк P−1 являются левыми собственными векторами A.

Если A является эрмитовой матрицей, то можно выбрать собственные вектора A так, что они образуют ортогональный базис в Cn. При таких условиях P будет унитарной матрицей и P−1 равно матрице, эрмитово-сопряжённой P.

На практике диагонализация матриц проводится на компьютере. Существует ряд алгоритмов, позволяющих осуществить данный процесс.

Множество матриц называется совместно диагонализируемым, если существует единственная обратимая матрица P, такая что P−1AP является диагональной матрицей для каждой A из множества. Следующая теорема характеризует совместно диагонализируемые матрицы: множество матриц является множеством диагонализируемых коммутирующих матриц тогда и только тогда, когда оно является совместно диагонализируемым.[2]

Множество всех диагонализируемых над C матриц n×n при n > 1 не является совместно диагонализируемым. Например, матрицы

Множество состоит из коммутирующих нормальных матриц в том и только том случае, если оно совместно диагонализируется унитарной матрицей, то есть существует унитарная матрица U, такая что U*AU диагональна для любой матрицы A из множества.

В общем случае матрица поворота не является диагонализируемой над вещественными числами, но все матрицы поворота диагонализируемы над полем комплексных чисел. Даже если матрица недиагонализируемая, её можно привести к "наилучшему возможному виду" и создать матрицу с теми же свойствами, содержащую собственные значения на главной диагонали и единицы или нули на диагонали выше, т.е. жорданову нормальную форму.

Некоторые матрицы не являются диагонализируемыми ни над каким полем, среди них можно указать ненулевые нильпотентные матрицы. Так происходит, если алгебраическая и геометрическая кратности собственного числа не совпадают. Рассмотрим

Данную матрицу нельзя диагонализировать: не существует матрица U, для которой U−1CU является диагональной матрицей. C имеет одно собственное значение (ноль) алгебраической кратности 2 и геометрической кратности 1.

Некоторые вещественные матрицы нельзя диагонализировать над вещественными числами. Рассмотрим матрицу

Матрица B не имеет вещественных собственных значений, поэтому не существует вещественной матрицы Q, для которой Q−1BQ является диагональной. Но над полем комплексных чисел мы можем диагонализировать B . Если рассмотреть

Заметим: приведённые выше примеры показывают, что сумма диагонализируемых матриц не всегда диагонализируема.

A является матрицей 3×3 с 3 различными собственными значениями; следовательно, она диагонализируема. Заметим, что если у матрицы n×n ровно n различных собственных значений, то она диагонализируема.

Собственные значения будут фигурировать в диагонализированной форме A, поэтому при нахождении собственных значений матрица A диагонализируется. Для диагонализации A можно использовать собственные векторы.

Пусть P — матрица, в которой столбцами являются данные собственные векторы.

Заметим, что для столбцов P нет выделенного порядка; изменение порядка собственных векторов в P только изменит порядок собственных значений в диагональной форме A.[3]

Диагонализацию можно использовать для эффективного вычисления степеней матрицы A, если матрица диагонализируема. Пусть мы получили, что

Последнее произведение несложно вычислить, поскольку оно содержит степени диагональной матрицы. Данный подход можно обобщить до экспоненты матрицы и других матричных функций, поскольку их можно представлять в виде степенных рядов.

Данное явление можно объяснить с помощью диагонализации M. Нам потребуется базис R2, состоящий из собственных векторов M. Одним из базисов является

где ei обозначает стандартный базис Rn. Обратное изменение базиса задаётся выражениями

Следовательно, a и b являются собственными значениями, соответствующими u и v. По линейности матричного произведения получим

В квантовой механике и квантовой химии при вычислениях диагонализация матриц является одной из наиболее используемых процедур. Основной причиной является то, что не зависящее от времени уравнение Шрёдингера является уравнением для собственных значений, причём почти во всех физических приложениях — в бесконечномерном (гильбертовом) пространстве. В приближённых подходах гильбертово пространство заменяют конечномерным пространством, после чего уравнение Шрёдингера можно переформулировать в виде задачи поиска собственных значений вещественной симметричной (или комплексной эрмитовой) матрицы. Данный подход основан на вариационном принципе.