воскресенье, 5 апреля 2026 г.

Матричная экспонента 2x2

Используя описанные ранее, в работе "Оператор группы Лоренца" механизмы работы с системой компьютерной алгебры Maxima для бикватернионов, можно найти еще один результат. А именно, матричную экспоненту аналитически для матриц 2x2.

Метод нахождения построен на переводе матричного представления бикватерниона в гиперкомплексное, получение экспоненты от бикватерниона и затем в переводе обратно в матричное представление. Размер 2x2 оказывается единственным из нескольких матричных представлений бикватернионов, для которого любое значение есть представление бикватерниона. Остальные представления (4x4 или 8x8) требуют наложения условий взаимной зависимости на коэффициенты матрицы. Но, если исходное значение матрицы 4x4 или 8x8 подходит под это условие, то конечно и для него будет существовать аналитическое представление матричной экспоненты. В текущем исследовании остановимся на представлении 2x2. Хотя пока не найдено общего решения для матриц порядка n, результат для матриц 2x2 - это всё же результат.

Зафиксируем матричное представление $2\times 2$ с комплексными коэффициентами в виде соответствия мнимых единиц бикватернионов матрицам: $$ 1 \Leftrightarrow \left( \begin{array}{rr} 1 & 0 \\ 0 & 1 \end{array} \right) $$ $$ Ii \Leftrightarrow \left( \begin{array}{rr} -1 & 0 \\ 0 & 1 \end{array} \right) $$ $$ Ij \Leftrightarrow \left( \begin{array}{rr} 0 & i \\ -i & 0 \end{array} \right) $$ $$ Ik \Leftrightarrow \left( \begin{array}{rr} 0 & -1 \\ -1 & 0 \end{array} \right) $$ \begin{equation} I \Leftrightarrow \left( \begin{array}{rr} i & 0 \\ 0 & i \end{array} \right) \end{equation} $$ i \Leftrightarrow \left( \begin{array}{rr} i & 0 \\ 0 & -i \end{array} \right) $$ $$ j \Leftrightarrow \left( \begin{array}{rr} 0 & 1 \\ -1 & 0 \end{array} \right) $$ $$ k \Leftrightarrow \left( \begin{array}{rr} 0 & i \\ i & 0 \end{array} \right) $$ И потому, если есть бикватернион $$ x = x_0+Iix_1+Ijx_2+Ikx_3+Ix_4+ix_5+jx_6+kx_7 $$ то его матричное представление $2\times 2$ будет иметь вид: $$ \left( \begin{array}{cc} x_0-x_1+i(x_4+x_5) & -x_3+x_6+i(x_2+x_7) \\ -x_3-x_6+i(-x_2+x_7) & x_0+x_1+i(x_4-x_5) \end{array} \right) $$ Исходную матрицу, от которой будем брать экспоненту, представим как матрицу из коэффициентов a для действительных составляющих: $$ \left( \begin{array}{cc} a_{11} & a_{12} \\ a_{21} & a_{22} \end{array} \right) $$ Поскольку для матриц и для комплексных чисел действует правило равенства при покомпонентном равенстве, то получаем систему уравнений, соотносящих коэффициенты a компонентам бикватерниона: $$ \left\{ \begin{array}{l} a_{11}=x_0-x_1 \\ a_{22}=x_0+x_1 \\ a_{12}=-x_3+x_6 \\ a_{21}=-x_3-x_6 \\ \end{array} \right. $$ Выполняя попарные сложения и вычитания уравнений, получаем выражение компонент бикватерниона через коэффициенты матриц: $$ \begin{array}{l} x_0=(a_{11}+a_{22})/2 \\ x_1=(a_{22}-a_{11})/2 \\ x_3=(-a_{12}-a_{21})/2 \\ x_6=(a_{12}-a_{21})/2 \\ \end{array} $$ Получив правила перехода от матричных к бикватернионным компонентам и обратно, можно имея исходную матрицу получить ее бикватернионное представление, для него найти экспоненту, для полученного бикватерниона экспоненты перейти обратно к матрицам. Для простой иллюстрации работы метода выберем диагональную матрицу $$ \left( \begin{array}{cc} a_{11} & 0 \\ 0 & a_{12} \end{array} \right) $$ Найдем экспоненту от нее. Любой математик результат выдаст недолго раздумывая, но в данном случае это просто частный иллюстративный вариант.

Сопоставляя компонентам матрицы компоненты бикватерниона, получим: $$ \left\{ \begin{array}{l} a_{11}=x_0-x_1 \\ a_{22}=x_0+x_1 \end{array} \right. $$ $$ \begin{array}{l} x_0=(a_{11}+a_{22})/2 \\ x_1=(a_{22}-a_{11})/2 \end{array} $$ То есть исходная матрица соответствует бикватерниону $$ x_0+Iix_1=(a_{11}+a_{22})/2+Ii(a_{22}-a_{11})/2 $$ Для мнимой единицы $(Ii)^2=1$ формула Эйлера дает выражение для экспоненты: $$ y=y_0+Iiy_1=e^{x_0+Iix_1}=e^{x_0}\mathrm{ch}(x_1)+Iie^{x_0}\mathrm{sh}(x_1) $$ Раскроем выражения обоих частей, и действительной и мнимой: $$ y_0=e^{x_0}\mathrm{ch}(x_1)=\frac{1}{2}( e^{(a_{11}+a_{22})/2}(e^{a_{22}-a_{11}/2}+ e^{-a_{22}+a_{11}/2})) $$ $$ y_0=\frac{1}{2}(e^{a_{11}}+e^{a_{22}}) $$ $$ y_1=e^{x_0}\mathrm{sh}(x_1)=\frac{1}{2}( e^{(a_{11}+a_{22})/2}(e^{a_{22}-a_{11}/2}- e^{-a_{22}+a_{11}/2})) $$ $$ y_1=\frac{1}{2}(e^{a_{22}}-e^{a_{11}}) $$ Приводя бикватернионное представление результата взятия экспоненты к матричному, получим: $$ \left( \begin{array}{cc} y_0-y_1 & 0 \\ 0 & y_0+y_1 \end{array} \right) = \left( \begin{array}{cc} e^{a_{11}} & 0 \\ 0 & e^{a_{22}} \end{array} \right) $$ Получили всем известный результат, но описываемым методом. Далее нужно раскрыть всю цепочку преобразований для полного набора коэффициентов исходной матрицы. Это некоторым образом громоздкий процесс, и потому применим систему компьютерной алгебры Maxima для преобразования и упрощения выражений.

Поскольку при вычислении экспоненты генерируется повторяющееся выражение в виде $$ (a22-a11)^2/4-(a12-a21)^2/4+(-a21-a12)^2/4 $$ зададим замену на условное обозначение:
tellsimpafter((a22-a11)^2/4-
  (a12-a21)^2/4+(-a21-a12)^2/4,alpha);
А также зададим упрощение арктангенса:
tellsimpafter(atan2(0,-(a22-a11)^2/4+
  (a12-a21)^2/4-(-a21-a12)^2/4),Theta);
Упростить это выражение до нуля нельзя потому, что знаменатель может принять как положительное, так и отрицательное значение.

Эти директивы упрощения ставим в начале программы для Maxima. Далее дадим описание функции получения экспоненты от бикватерниона в виде функции возвращающей вектор результата
makeexp(x0,x1,x2,x3,x4,x5,x6,x7):=
(
  Fsqrt:sqrt((x5+%i*x1)^2+
    (x6+%i*x2)^2+(x7+%i*x3)^2),
  Fsin:sin(Fsqrt),
  Fcos:cos(Fsqrt),
  Fscl:exp(x0+%i*x4),
  [
    realpart(Fscl*Fcos),
    imagpart(Fscl*Fsin/Fsqrt*(x5+%i*x1)),
    imagpart(Fscl*Fsin/Fsqrt*(x6+%i*x2)),
    imagpart(Fscl*Fsin/Fsqrt*(x7+%i*x3)),
    imagpart(Fscl*Fcos),
    realpart(Fscl*Fsin/Fsqrt*(x5+%i*x1)),
    realpart(Fscl*Fsin/Fsqrt*(x6+%i*x2)),
    realpart(Fscl*Fsin/Fsqrt*(x7+%i*x3))
  ]
);
И общая последовательность перехода от одного представления к другому и получения экспоненты:
makexp2x2(a11,a12,a21,a22):=
(
  x0:(a11+a22)/2,
  x1:(a22-a11)/2,
  x3:(-a12-a21)/2,
  x6:(a12-a21)/2,
  y:makeexp(x0,x1,0,x3,0,0,x6,0),
  matrix
  (
    [y[1]-y[2],-y[4]+y[7]],
    [-y[4]-y[7],y[1]+y[2]]
  )
);
И зададим вычислить экспоненту с разложением по возможности на множители:
y:factor(makexp2x2(a11,a12,a21,a22));
В результате получаем матрицу коэффициентов, содержащую модули. Здесь нижние индексы используемые при записи коэффициентов матрицы внесены в имена переменных, что не должно приводить к путанице. $$ \begin{array}{c} \Theta= \mathrm{atan2}(0,-(a22-a11)^2/4+\\ (a12-a21)^2/4-(-a21-a12)^2/4)\\ \alpha = (a22-a11)^2/4-\\ (a12-a21)^2/4+(-a21-a12)^2/4\\ \end{array} $$ $$ y_{11}=-\frac{e^{a22/2+a11/2}}{2\sqrt{|\alpha|}} (\sin(\Theta/2)a22\cos(\cos(\Theta/2)\sqrt{|\alpha|})\cdot $$ $$ \begin{array}{c} \cdot\mathrm{sh}(\sin(\Theta/2)\sqrt{|\alpha|})- \\ -\sin(\Theta/2)a11\cos(\cos(\Theta/2)\sqrt{|\alpha|}) \mathrm{sh}(\sin(\Theta/2)\sqrt(|\alpha)))+ \\ +\cos(\Theta/2)a22\sin(\cos(\Theta/2)\sqrt{|\alpha|}) \mathrm{ch}(\sin(\Theta/2)\sqrt{|\alpha|})- \\ -\cos(\Theta/2)a11\sin(\cos(\Theta/2)\sqrt{|\alpha|}) \mathrm{ch}(\sin(\Theta/2)\sqrt{|\alpha|})- \\ -2\sqrt{|\alpha|}\cos(\cos(\Theta/2)\sqrt{|\alpha|}) \mathrm{ch}(\sin(\Theta/2)\sqrt{|\alpha|})) \end{array} $$ $$ y_{12}=\frac{a12e^{a22/2+a11/2}}{\sqrt{|\alpha|}}\cdot $$ $$ \begin{array}{c} \cdot(\sin(\Theta/2)\cos(\cos(\Theta/2)\sqrt{|\alpha|}) \mathrm{sh}(\sin(\Theta/2)\sqrt{|\alpha|})+ \\ +\cos(\Theta/2)\sin(\cos(\Theta/2)\sqrt{|\alpha|})\mathrm{ch}(\sin(\Theta/2) \sqrt{|\alpha|})) \end{array} $$ $$ y_{21}=\frac{a21 e^{a22/2+a11/2}}{\sqrt{|\alpha|}}(\cdot $$ $$ \begin{array}{c} \cdot(\sin(\Theta/2)\cos(\cos(\Theta/2)\sqrt{|\alpha|}) \mathrm{sh}(\sin(\Theta/2)\sqrt{|\alpha|})+ \\ +\cos(\Theta/2)\sin(\cos(\Theta/2)\sqrt{|\alpha|})\mathrm{ch}(\sin(\Theta/2) \sqrt{|\alpha|})) \end{array} $$ $$ y_{22}=\frac{a22/2+a11/2}{2\sqrt{|\alpha|}}( $$ $$ \begin{array}{c} (\sin(\Theta/2)a22\cos(\cos(\Theta/2)*\sqrt{|\alpha|}) \mathrm{sh}(\sin(\Theta/2)\sqrt{|\alpha|})- \\ -\sin(\Theta/2)a11\cos(\cos(\Theta/2)\sqrt{|\alpha|}) \mathrm{sh}(\sin(\Theta/2)\sqrt{|\alpha|})+ \\ +\cos(\Theta/2)a22\sin(\cos(\Theta/2)\sqrt{|\alpha|}) \mathrm{ch}(\sin(\Theta/2)\sqrt{|\alpha|})- \\ -\cos(\Theta/2)a11\sin(\cos(\Theta/2)\sqrt{|\alpha|}) \mathrm{ch}(\sin(\Theta/2)\sqrt{|\alpha|})+ \\ +2\sqrt{|\alpha|}\cos(\cos(\Theta/2)\sqrt{|\alpha|}) \mathrm{ch}(\sin(\Theta/2)\sqrt{|\alpha|})) \end{array} $$ Далее решение разбиваем на три в зависимости от знака условной величины $\alpha$, которую для краткости назовем селектором: $$ \begin{array}{c} \alpha>0 \\ \alpha=0\\ \alpha<0 \end{array} $$ Начнем с варианта когда селектор равен нулю. Выражение для селектора равно: $$ (a22-a11)^2/4-(a12-a21)^2/4+(-a21-a12)^2/4 $$ И это же выражение но с обратным знаком стоит в знаменателе арктангенса для вычисления параметра $\Theta$. И в этом случае мы должны были бы вычислить неопределенность вида ноль делить на ноль. Но до такого арктангенса вычисления не могут дойти, поскольку выражение для селектора в гиперкомплексной области есть квадрат мнимой части, а именно, если выполнить замену матричных коэффициентов на соответствующие им гиперкомплексные, то $$ \begin{array}{c} (a22-a11)^2/4-(a12-a21)^2/4+(-a21-a12)^2/4 = \\ =x_1^2-x_6^2+x_3^2 \end{array}$$ Это выражение есть квадрат мнимой части аргумента экспоненты: $$ x_1^2-x_6^2+x_3^2=(Iix_1+Ikx_3+jx_6)^2 $$ И при разложении функции экспоненты в ряд он останавливается на квадрате параметра. Обозначим для краткости $$ Iix_1+Ikx_3+jx_6=m $$ тогда экспоненциальный ряд усекается до $$ 1+m+m^2/2!+m^3/3!+... = 1+m $$ В алгебре элемент алгебры m для которого существует такая целая степень n что выполняется условие $$ m^n=0 $$ называется нильпотентом. И полученный при выводе экспоненты селектор можно назвать селектором нильпотентности. Если он равен нулю, то функция экспоненты вычисляется без тригонометрических функций как особый случай: $$ e^{a_{22}/2+a_{11}/2} \left( \begin{array}{cc} 1+a_{11}/2-a_{22}/2 & a_{12} \\ a_{21} & 1-a_{11}/2+a_{22}/2 \end{array} \right) $$ Здесь вынесена за скобки экспонента от скалярной части аргумента, гиперкомплексного компонента $x_0$.

Выпишем работу селектора нильпотентности по шагам чтобы она была прозрачна. Если есть исходная матрица $$ \left( \begin{array}{cc} a11 & a12 \\ a21 & a22 \end{array} \right) $$ то для нее бикватернионное представление имеет вид: $$ \begin{array}{c} x0=(a22+a11)/2 \\ x1=(a22-a11)/2 \\ x3=(-a21-a12)/2 \\ x6=(a12-a21)/2 \end{array} $$ Если взять только мнимую часть от бикватерниона (без x0) и построить для нее матричное представление, то получим матрицу $$ m= \left( \begin{array}{cc} (a11-a22)/2 & a12 \\ a21 & (a22-a11)/2 \end{array} \right) $$ Эта матрица в квадрате равна $$ m^2=(a22^2-2a11a22+4a12a21+a11^2) \left( \begin{array}{cc} 1 & 0 \\ 0 & 1 \end{array} \right) $$ Соответственно, если выполняется условие $$ a22^2-2a11a22+4a12a21+a11^2=0 $$ то $$ m^2=0 $$ Таким образом, селектор нильпотентности определяет нильпотентность не всей исходной матрицы, а только ее условной части в виде матрицы m, которая соответствует лишь мнимой части бикватернионного представления.

Оставшиеся два варианта получения матричной экспоненты следуют из положительности и отрицательности селектора $\alpha$. Поскольку в числителе арктангенса стоит ноль, то значение параметра $\Theta$ зависит не от величины селектора, а лишь от его знака и принимает одно из двух значений: $$ \begin{array}{c} \alpha>0 \rightarrow \Theta=\pi \\ \alpha<0 \rightarrow \Theta=0 \end{array} $$ Поскольку параметр $\Theta$ используется в тригонометрических функциях в половинной величине, то эти тригонометрические функции принимают значения соответственно или 0 или 1, играя роль своего рода дискретного переключателя. $$ \begin{array}{ccc} \alpha>0 \rightarrow \Theta=\pi & \sin(\Theta/2)=1 & \cos(\Theta/2)=0 \\ \alpha<0 \rightarrow \Theta=0 & \sin(\Theta/2)=0 & \cos(\Theta/2)=1 \end{array} $$ Соответственно, при подстановке таких значений $\Theta$ выражения для коэффициентов матричной экспоненты существенно упрощаются. Для первого варианта, положительного селектора, учитывая что он положителен и можем убрать модуль: $$ y_{11}=-e^{a22/2+a11/2} \left( (a22/2-a11/2)\frac{\mathrm{sh}(\sqrt{\alpha})}{\sqrt{\alpha}}- \mathrm{ch}(\sqrt{\alpha}) \right) $$ $$ y_{12}=a12e^{a22/2+a11/2}\frac{\mathrm{sh}(\sqrt{\alpha})}{\sqrt{\alpha}} $$ $$ y_{21}=a21e^{a22/2+a11/2}\frac{\mathrm{sh}(\sqrt{\alpha})}{\sqrt{\alpha}} $$ $$ y_{22}=-e^{a22/2+a11/2} \left( (a22/2-a11/2)\frac{\mathrm{sh}(\sqrt{\alpha})}{\sqrt{\alpha}}+ \mathrm{ch}(\sqrt{\alpha}) \right) $$ В некотором смысле положительный селектор приводит к гиперболическому решению. Сами функции гиперболичекого синуса и косинуса могут быть выражены через экспоненты и при определенном соотношении коэффициентов исходной матрицы решение может быть упрощено до формы с экспонентами.

Для отрицательного селектора знак модуля заменим на знак минус, не забывая что по величине сам он отрицателен: $$ y_{11}=-e^{a22/2+a11/2} \left( (a22/2-a11/2)\frac{\sin(\sqrt{-\alpha})}{\sqrt{-\alpha}}- \cos(\sqrt{-\alpha}) \right) $$ $$ y_{12}=a12e^{a22/2+a11/2}\frac{\sin(\sqrt{-\alpha})}{\sqrt{-\alpha}} $$ $$ y_{21}=a21e^{a22/2+a11/2}\frac{\sin(\sqrt{-\alpha})}{\sqrt{-\alpha}} $$ $$ y_{22}=-e^{a22/2+a11/2} \left( (a22/2-a11/2)\frac{\sin(\sqrt{-\alpha})}{\sqrt{-\alpha}}+ \cos(\sqrt{-\alpha}) \right) $$ В некотором смысле отрицательный селектор приводит к очень похожему решению, но с тригонометрическими функциями.

В текущем исследовании рассматривался только вариант матричной экспоненты от матрицы над полем действительных чисел. В случае если исходная матрица есть матрица над полем комплексных чисел, решение усложняется принципиально, а не только с точностью до замены действительных чисел на комплексные.

Дело в том, что селектор нильпотентности для матриц с комплексными коэффициентами также является комплексным числом. И равенство его нулю приводит не к одному, а к двум уравнениям, состоящим из коэффициентов исходной матрицы, и эти составляющие входят в арктангенс для получения параметра $\Theta$ в числителе и знаменателе. Соответственно, кроме варианта равенства нулю обеих частей селектора будет еще не два а пять вариантов, когда числитель равен нулю а знаменатель положителен/отрицателен, когда знаменатель равен нулю а числитель положителен/отрицателен, и когда оба не равны нулю.

Комментариев нет:

Отправить комментарий