суббота, 18 июня 2016 г.

Элементарные функции матриц

Введение


Рассмотрение свойств гиперкомплексных чисел показало, что в принципе возможно решение весьма необычной задачи. А именно, пусть дана квадратная матрица с заданными коэффициентами. Требуется найти значение функции от этой матрицы. Весьма распространенной задачей является, например, отыскание матричной экспоненты. Решение этой задачи в численном виде существует по крайней мере в 2-х вариантах - вычисление ряда и приведение исходной матрицы к диагональной: $$ A=T \cdot A' \cdot T' $$ где $T'\cdot T=E$, $A'$ - диагональная матрица.

И во втором случае вычисление функции матрицы сводится к отысканию ортогональных преобразований $T$ и $T'$. Вычисление же функции от диагональной матрицы проблем не вызывает. При этом полагается, что функция задается полиномиальным рядом с использованием операций сложения, умножения и умножения на действительное число.

Оба приведенных способа являются численными и при задании коэффициентов исходной матрицы в общем виде приводят к весьма громоздкому результату. Кроме того, они оба имеют огранические недостатки. Первый способ, вычисление ряда от матрицы, вообще говоря, является бесконечным процессом и реально ряд должен быть усечен. Например, из соображений точности вычислений. Второй способ работает только в случаях, когда отыскать соответствующие ортогональные преобразования становится возможным, в остальных случаях он неприменим.

Вниманию читателей предлагается способ отыскания элементарной функции матрицы в любом случае и в общем виде. В статье описывается, каким образом для заданной матрицы, например $$ \left(\begin{array}{cc} a & b \\ c & d \end{array}\right) $$ отыскать элементарную функцию в виде матрицы с коэффициентами, которые являются элементарными функциями $a$, $b$, $c$ и $d$.

Автор полагает, что знакомство с описываемым методом может в некоторых случаях существенно упростить решение технических, физических и математических задач.

Изложение материала ведется на уровне, предполагающем знакомство читателя с матрицами, комплексными числами и кватернионами.

Гиперкомплексное изображение матриц


В основе излагаемого метода лежит метод, названный автором гиперкомплексным изображением. В принципе любого изображения лежит замена операции в области, где она очень трудна, на три шага - отображения объектов в другую область (изображения), отображение операций в область изображения и отображение обратно. При этом операции в исходной области заменяются на операции им соответствующие в области изображений.

Гиперкомплексным изображением матрицы является установление изоморфизма матриц и бикватернионов. С одной стороны, этот факт известен уже давно - любая система ассоциативных гиперкомплексных чисел изоморфна некоторой системе квадратных матриц. С другой стороны, этот факт имеет далеко идущие последствия.

Рассмотрим таблицу произведений бикватерниона $p$: $$ \begin{array}{c} p=p_0+Iip_1+Ijp_2+Ikp_3+Ip_4+ip_5+jp_6+kp_7 \\ ij=k,\; ji=-k,\; jk=i,\; kj=-i \\ ii=jj=kk=-1 \\ Ii=iI,\; Ij=jI,\; Ik=kI,\; II=-1 \end{array} $$ Также рассмотрим набор матриц Паули и матриц Кэли: $$ q_0=\left(\begin{array}{rr} 1 & 0 \\ 0 & 1 \end{array}\right) $$ $$ q_1=\left(\begin{array}{rr} 0 & 1 \\ 1 & 0 \end{array}\right) $$ $$ q_2=\left(\begin{array}{rr} 0 & -i \\ i & 0 \end{array}\right) $$ $$ q_3=\left(\begin{array}{rr} 1 & 0 \\ 0 & -1 \end{array}\right) $$ $$ q_4=\left(\begin{array}{rr} i & 0 \\ 0 & i \end{array}\right) $$ $$ q_5=\left(\begin{array}{rr} 0 & -i \\ -i & 0 \end{array}\right) $$ $$ q_6=\left(\begin{array}{rr} 0 & -1 \\ 1 & 0 \end{array}\right) $$ $$ q_7=\left(\begin{array}{rr} -i & 0 \\ 0 & i \end{array}\right) $$ Здесь $q_0$ - единичная матрица, $q_4$ - мнимая единичная матрица, $q_1$, $q_2$, $q_3$ - матрицы Паули, $q_5$, $q_6$, $q_7$ - матрицы Кэли. В данном случае приведены их записи в классическом общеупотребимом виде.

Сравнение таблицы произведений матриц Паули-Кэли и мнимых единиц бикватернионов показывает их полное соответствие с точностью до взаимной замены. Обозначив через $\Leftrightarrow$ оператор соответствия матриц Паули-Кэли мнимым единицам бикватерниона, получим: $$ 1\Leftrightarrow\left(\begin{array}{rr} 1 & 0 \\ 0 & 1 \end{array}\right) $$ $$ Ii\Leftrightarrow\left(\begin{array}{rr} 0 & 1 \\ 1 & 0 \end{array}\right) $$ $$ Ij\Leftrightarrow\left(\begin{array}{rr} 0 & -i \\ i & 0 \end{array}\right) $$ $$ Ik\Leftrightarrow\left(\begin{array}{rr} 1 & 0 \\ 0 & -1 \end{array}\right) $$ $$ I\Leftrightarrow\left(\begin{array}{rr} i & 0 \\ 0 & i \end{array}\right) $$ $$ i\Leftrightarrow\left(\begin{array}{rr} 0 & -i \\ -i & 0 \end{array}\right) $$ $$ j\Leftrightarrow\left(\begin{array}{rr} 0 & -1 \\ 1 & 0 \end{array}\right) $$ $$ k\Leftrightarrow\left(\begin{array}{rr} -i & 0 \\ 0 & i \end{array}\right) $$ Приведенное соответствие является основой гиперкомплексного изображения матриц.

Теперь сформулируем принцип гиперкомплексного изображения полностью:

Любые операции с комплекснозначными матрицами $2\times 2$, приводимые к сложению и умножению, могут быть заменены на точно такие же операции с бикватернионами если компоненты бикватерниона получить по таблице соответствия, приведенной выше.

Итак, общая схема гиперкомплексного изображения может быть представлена алгоритмически:

1) разложить исходную матрицу в базис матриц Паули-Кэли.

2) полученные коэффициенты использовать для составления бикватерниона.

3) провести запрошенную операцию в области бикватернионов.

4) использовать компоненты полученного результата для сборки матрицы по той же таблице изображения.

Поскольку элементарные функции определяются в виде полиномиальных рядов, метод гиперкомплексного изображения позволяет отыскивать результат функции от матрицы.

Как будет показано дальше, отыскание результата функции бикватерниона на деле является гораздо более простой и понятной задачей.

Свобода выбора перестановок


Поскольку таблица соответствия мнимых единиц бикватерниона матрицам Паули-Кэли строилась не на свойствах самих матриц, а на перестановочных свойствах их произведений, то такая замена неоднозначна.

Организовав матрицы $q_1$, $q_2$, $q_3$, $q_5$, $q_6$, $q_7$ в при пары ($q_1$, $q_5$), ($q_2$, $q_6$), ($q_3$, $q_7$), мы можем построить три различные таблицы отображения путем циклических перестановок пар. Полученные наборы будут по-прежнему удовлетворять перестановочным соотношениям, требующимся для построения отображения.

Несложно видеть, что из трех полученных перестановок можно получить три другие, переставляя местами только две пары. Такие перестановки будут соответствовать смене правой ориентации на левую. В дальнейшем будем полагать, что для отображения матриц на бикватернионы будет использоваться таблица, сохраняющая ориентацию базиса: правый отображается в правый, левый в левый.

Также в основной принцип гиперкомплексного изображения следует добавить требование, чтобы получение компонентов бикватерниона по коэффициентам матриц и обратный переход совершался по одной и той же таблице отображения. Но уже не важно по какой именно. В дальнейшем изложении в случае каких-либо конкретный преобразований будем для определенности пользоваться описанной выше таблицей.

Элементарные функции одного кватернионного переменного


Для дальнейшего изложения нам понадобится составить методику вычисления элементарной функции одного кватернионного переменного.

Под элементарной функцией будем понимать класс функций, определяемых в виде полиномиального ряда, возможно бесконечного, причем в таком ряду должны использоваться операции сложения, умножения и умножения на действительное число.

Например, экспоненциальная функция формально определена в виде бесконечного ряда: $$ e^x=\sum\limits_{n=0}^{\infty}\frac{x^n}{n!} $$ где $x^0$ считается равным 1, а $0!=1$.

В случае подстановки в качестве аргумента экспоненциальной функции не действительного числа, а числа другой алгебры, будем считать что возведение в нулевую степень также дает единичное число этой же алгебры.

Например, в случае если x принадлежит алгебре комплексных чисел, то из определения экспоненциальной функции фактически вытекает уравнение Эйлера: $$ e^{x_0+ix_1}=e^{x_0}\left(\cos(x_1)+i\sin(x_1)\right) $$ а также уравнения Муавра и уравнения для синуса и косинуса суммы и разности углов.

Рассмотрим случай, когда в качестве переменной элементарной функции выступает кватернион и в определении функции не используются другие кватернионы, а только действительные числа либо функции с действительной областью значений.

Кватернион в общем виде определяется как: $$ q=q_0+iq_1+jq_2+kq_3 $$ В случае если кватернион используется в качестве аргумента элементарной функции, он может быть представлен как условное комплексное число с условной мнимой единицей: $$ q=q_0+\frac{iq_1+jq_2+kq_3}{\sqrt{q_1^2+q_2^2+q_3^2}}\sqrt{q_1^2+q_2^2+q_3^2} $$ $$ q=Q_0+IQ_1 $$ $$ Q_0=q_0 $$ $$ I=\frac{iq_1+jq_2+kq_3}{\sqrt{q_1^2+q_2^2+q_3^2}} $$ $$ Q_1=\sqrt{q_1^2+q_2^2+q_3^2} $$ В этой записи кватернион сохраняет свойства комплексного числа: $$ |q|^2=Q_0^2+Q_1^2=q_0^2+q_1^2+q_2^2+q_3^2 $$ $$ q^2=Q_0^2-Q_1^2+2IQ_0Q_1 $$ $$ I^2=-1 $$ Используя это свойство, мы можем трансформировать известные из стандартного курса теории функций комплексного переменного представления элементарных функций:

1) замены кватерниона условным комплексным числом

2) раскрытие функции как функции комплексного переменного и

3) обратной замены обозначений $$ Q_0\rightarrow q_0 $$ $$ I\rightarrow \frac{iq_1+jq_2+kq_3}{\sqrt{q_1^2+q_2^2+q_3^2}} $$ $$ Q_1\rightarrow \sqrt{q_1^2+q_2^2+q_3^2} $$ Выпишем для наглядности некоторые элементарные функции кватерниона. $$ e^q=e^{Q_0+IQ_1}=e^{Q_0}\left(\cos(Q_1)+I\sin(Q_1)\right)= $$ $$ =e^{Q_0}\left(\cos\left(\sqrt{q_1^2+q_2^2+q_3^2}\right)+ \frac{iq_1+jq_2+kq_3}{\sqrt{q_1^2+q_2^2+q_3^2}} \sin\left(\sqrt{q_1^2+q_2^2+q_3^2}\right)\right) $$ $$ \sin(q)=\sin(Q_0+IQ_1)=\sin(Q_0)\mathrm{ch}(Q_1)+I\cos(Q_0)\mathrm{sh}(Q_1)= $$ $$ =\sin(q_0)\mathrm{ch}\left(\sqrt{q_1^2+q_2^2+q_3^2}\right)+ \frac{iq_1+jq_2+kq_3}{\sqrt{q_1^2+q_2^2+q_3^2}} \cos(q_0)\mathrm{sh}\left(\sqrt{q_1^2+q_2^2+q_3^2}\right) $$ $$ \cos(q)=\cos(Q_0+IQ_1)=\cos(Q_0)\mathrm{ch}(Q_1)-I\sin(Q_0)\mathrm{sh}(Q_1)= $$ $$ =\cos(q_0)\mathrm{ch}\left(\sqrt{q_1^2+q_2^2+q_3^2}\right)- \frac{iq_1+jq_2+kq_3}{\sqrt{q_1^2+q_2^2+q_3^2}} \sin(q_0)\mathrm{sh}\left(\sqrt{q_1^2+q_2^2+q_3^2}\right) $$ Остальные функции, такие как логарифм, синус и косинус гиперболические, могут быть представлены с помощью той же самой методики.

Итак, с помощью замены кватерниона условным комплексным числом, мы можем получить аналитические выражения для элементарных функций кватернинов. И эта методика также является составной частью описываемого в этой статье метода вычисления элементарных функций матриц

Функция бикватерниона как функция комплексного кватерниона


Несмотря на некоторый успех, достигнутый в предыдущем параграфе, нашей целью является составление аналитического выражения не для функций кватернионов, а для функций бикватернионов.

Выпишем еще раз покомпонентные записи бикватерниона и кватерниона: $$ p=p_0+Iip_1+Ijp_2+Ikp_3+Ip_4+ip_5+jp_6+kp_7 $$ $$ q=q_0+iq_1+jq_2+kq_3 $$ И проведем группировку компонентов бикватерниона следующим образом: $$ p=(p_0+Ip_4)+i(p_5+Ip_1)+j(p_6+Ip2)+k(p_7+Ip_3) $$ Сравнив с выражением для кватерниона, видим, что получили кватернион, но с компонентами не действительными числами, а комплексными числами. Или, говоря правильно, бикватернион над полем действительных чисел изоморфен кватерниону над полем комплексных чисел. Комплексные числа образуют "очень хорошее" поле, поскольку они ассоциативны, коммутативны и не содержат делителей нуля.

Иными словами, комплексные числа всегда могут быть подставлены вместо действительных и вычисления могут быть продолжены, за исключением случаев образования принципиально новых свойств. Например, кватернионы не содержат делителей нуля, а бикватернионы содержат. Поэтому, формально говоря, следует убедиться, что переходы от одного представления числа к другому не приводят к появлению или исчезновению каких-либо свойств.

В нашем случае, совершая переход от бикватерниона к комплексному кватерниону, мы ничего не меняем в свойствах этих чисел, поэтому переход является безопасным. В нашем случае мы всего лишь проводим перегруппировку компонентов числа.

Поскольку комплексные числа коммутативны по умножению, то, рассматривая элементарные функции бикватерниона, мы можем перейти к элементарным функциям кватернионов с комплексными компонентами.

Отважимся выписать аналитически функцию экспоненты для бикватерниона. $$ e^p=e^{p_0+Iip_1+Ijp_2+Ikp_3+Ip_4+ip_5+jp_6+kp_7}= $$ $$ =e^{q_0+iq_1+jq_2+kq_3}= $$ $$ =e^{q_0}\left(\cos\left(\sqrt{q_1^2+q_2^2+q_3^2}\right) +\frac{iq_1+jq_2+kq_3}{\sqrt{q_1^2+q_2^2+q_3^2}} \sin\left(\sqrt{q_1^2+q_2^2+q_3^2}\right)\right) $$ Отметим очень важный момент: выражение $\sqrt{q_1^2+q_2^2+q_3^2}$ может быть равно нулю при неравных нулю значениях $q_1$, $q_2$, $q_3$, например в случае $p=Ii+j$. Хотя выражение $e^p$, записанное в обозначениях $q(p)$, скрывает наличие делителей нуля, о них не следует забывать. Замена $q(p)$ - это всего лишь условность.

Таким образом, $$ e^p=e^{p_0+Ip_4}\left[\cos\left(\sqrt{ p_5^2-p_1^2+p_6^2-p_2^2+p_7^2-p_3^2+I(2p_1p_5+2p_2p_6+2p_3p_7)}\right)\right.+ $$ $$ +\frac{Iip_1+Ijp_2+Ikp_3+ip_5+jp_6+kp_7}{\sqrt{ p_5^2-p_1^2+p_6^2-p_2^2+p_7^2-p_3^2+I(2p_1p_5+2p_2p_6+2p_3p_7)}}\cdot $$ $$ \cdot \left.\sin\left(\sqrt{ p_5^2-p_1^2+p_6^2-p_2^2+p_7^2-p_3^2+I(2p_1p_5+2p_2p_6+2p_3p_7)}\right)\right] $$ При попытке раскрыть корни из комплексных чисел в такой записи получим выражение страницы на две, поэтому не будем его здесь приводить. Будем полагать, что вручную теперь это никому не понадобится расписывать, и что при вычислениях будет использоваться та или иная система компьютерной алгебры. Как-никак, а 21-й век уже.

Также скажем пару слов об описанном ранее исключительном случае, когда $$ \sqrt{q_1^2+q_2^2+q_3^2}=0 $$ Будем полагать, что в этом случае $$ \frac{\sin\left(\sqrt{q_1^2+q_2^2+q_3^2}\right)}{\sqrt{q_1^2+q_2^2+q_3^2}}=1 $$ $$ \cos\left(\sqrt{q_1^2+q_2^2+q_3^2}\right)=1 $$ $$ e^p=e^{p_0+Ip_4}\left(1+Iip_1+Ijp_2+Ikp_3+ip_5+jp_6+kp_7\right) $$ Приведенные выше уравнения с единицей будем полагать полученными предельным переходом при таком изменении переменных $q_1$, $q_2$ и $q_3$, что величина $\sqrt{q_1^2+q_2^2+q_3^2}$ стремится к нулю.

Функция матриц второго порядка


В этом параграфе переходим к основной теме статьи - к построению функций матриц. Общая схема вычисления такой функции следующая:

1) разложим исходную матрицу в базисе матриц Паули-Кэли.

2) по коэффициентам полученного разложения составим эквивалентный бикватернион.

3) найдем по компонентам бикватерниона комплексный компоненты кватерниона.

4) для комплексного кватерниона найдем требуемую функцию.

5) по полученному комплексному кватерниону составим компоненты бикватерниона.

6) по компонентам бикватерниона составим с помощью таблицы отображения матриц Паули-Кэли матрицу результата.

Продемонстрируем эту процедуру на примере вычисления квадратного корня из матрицы $$ A=\left(\begin{array}{cc} 1 & 2 \\ 3 & 4 \end{array}\right) $$ Эквивалентный ей бикватернион равен: $$ p=\frac{5}{2}+Ii\frac{5}{2}+j\frac{1}{2}-Ik\frac{3}{2} $$ Комплексный кватернион равен: $$ q=\frac{5}{2}+Ii\frac{5}{2}+j\frac{1}{2}-Ik\frac{3}{2} $$ Найдем величину $$ \sqrt{q_0^2+q_1^2+q_2^2+q_3^2}=I1,414 $$ Таким образом, $$ |\sqrt{p}|=0,347+I1,571 $$ $$ \sqrt{q_1^2+q_2^2+q_3^2}=1,571+I1,335 $$ Таким образом, взяв корень из комплексного кватерниона по методике, описанной в параграфе 3, получим: $$ \sqrt{p}=(1,159+I0,305)+i(0,266+I1,009)+j(0,202-I0,053)+k(-0,159-I0,605) $$ Отобразив полученный комплексный кватернион в бикватернион, и по таблице матриц Паули-Кэли в матрицы, получим: $$ A'=\sqrt{A}=\left(\begin{array}{cc} 0,554+I0,464 & 0,807-I0,212 \\ 1,210-I0,319 & 1,764+I0,146 \end{array}\right) $$ Нетрудно убедиться непосредственной проверкой, что $A'^2=A$, то есть действительно был найден один из квадратных корней, чем и был продемонстрирован метод гиперкомплексного изображения.

Отметим, что весь ход отыскания квадратного корня (а при выборе иной функции - ход рассуждений не меняется) изложен четко алгоритмически и нигде не содержит никаких головоломок и неоднозначностей, чем и удобен при численной реализации. Фактически, квадратный корень находится за константное число операций в случае использования при вычислениях сопроцессора.

Выводы


Изложенная методология отыскания элементарных функций от матрицы оказалась вполне применимой. Хотя и ограниченной только матрицами 2-го порядка.

Метод гиперкомплексного изображения на поверку оказался довольно простым. Для его реализации достаточно знать правила оперирования с комплексными числами. Этот метод позволяет при необходимости составить аналитическое представление элементарной функции матрицы как метрицы элементарных функций ее коэффициентов.

Хотя описываемый метод и достиг своей цели, но он остается пока ограниченным порядком матрицы. Автор надеется, что в будущем удастся найти способ обхода этого ограничения. Например, путем рассмотрения матриц над полем матриц или изображения матриц гиперкомплексными числами иного порядка.

Комментариев нет:

Отправить комментарий