이는 기본적으로는 [선형대수학]의 두 글 [선형대수학] §행렬 그리고 [선형대수학] §선형대수학의 기본정리가 일반적인 $A$-module의 경우에도 성립한다는 것을 확인하는 과정이다. 대부분의 정의와 정리를 일반적인 상황에서 서술하는 것은 어렵지 않으나, 몇 가지 문제점들, 예컨대 $A$가 commutative가 아닐 수 있다는 것, 무한차원 free module의 경우도 다룰 것이라는 등등의 문제점들로 인하여 다소 복잡해질 수 있다.
이번 글에서 우리는 행렬과 이들 사이의 연산을 정의한다.
행렬의 기본 정의
[선형대수학]과 마찬가지로, ring $A$ 위에 정의된 $m\times n$ 행렬은 $A$의 $mn$개의 원소를 $m\times n$ 사각형 모양
\[X=\begin{pmatrix}x_{11}&x_{12}&\cdots&x_{1n}\\x_{21}&x_{22}&\cdots&x_{2n}\\\vdots&\vdots&\ddots&\vdots\\x_{m1}&x_{m2}&\cdots&x_{mn}\end{pmatrix}\tag{1}\]으로 적은 것이다. 이들을 모아둔 집합을 $\Mat_{m\times n}(A)$로 적는다. 더 일반적으로 다음과 같이 정의한다.
정의 1 임의의 집합 $I, J$에 대하여 $I\times J$ 행렬은 $I\times J$로 index가 주어진 $A$의 원소들의 family $(x_{ij})_{(i,j)\in I\times J}$를 의미하며, 이들의 모임을 $\Mat_{I\times J}(A)$로 적는다.
이것이 기존의 정의와 다른 점은 $I,J$가 무한집합이 될 수도 있다는 것이다. 그러나 행렬의 곱을 정의하고, 행렬과 선형사상 사이의 관계를 살펴보기 위해서는 이들이 반드시 유한집합이 되어야 하므로 위의 정의는 큰 일반화는 아니다.
정의 2 임의의 $I\times J$ 행렬 $X$와, $I,J$의 부분집합 $I_0\subseteq I$, $J_0\subseteq J$에 대하여, $X$의 $I\times J$ 부분행렬은 $i\in I_0$, $j\in J_0$를 만족하는 $x_{ij}$들로 만든 행렬 $(x_{ij})_{(i,j)\in I_0\times J_0}$으로 정의한다. 특별히 $X$의 $\{i\}\times J$ 부분행렬을 $X$의 $i$번째 행벡터$i$th row vector라 부르고, $I\times \{j\}$ 부분행렬을 $X$의 $j$번째 열벡터$j$th column vector라 부른다.
또, 다음을 정의한다.
정의 3 임의의 $I\times J$ 행렬 $X=(x_{ij})_{(i,j)\in I\times J}$에 대하여, $X$의 transpose전치행렬 $X^t=(x^t_{ji})_{(j,i)\in J\times I}$는 다음 식
\[x_{ji}^t=x_{ij}\qquad\text{for all $(i,j)\in I\times J$}\]으로 주어지는 행렬이다.
특히 (1)과 같은 $m\times n$ 행렬 $X$가 주어졌을 때, $X$의 transpose는 다음 식
\[X^t=\begin{pmatrix}x_{11}&x_{21}&\cdots&x_{m1}\\ x_{12}&x_{22}&\cdots&x_{m2}\\\vdots&\vdots&\ddots&\vdots\\ x_{1n}&x_{2n}&\cdots&x_{mn}\end{pmatrix}\]으로 주어지는 $n\times m$ 행렬 $X^t\in\Mat_{n\times m}(A)$를 의미한다. 정의로부터 다음 명제가 자명하다.
명제 4 $(X^t)^t=X$.
또, $X$의 $i$번째 행벡터는 $X^t$의 $i$번째 열벡터이며 $X$의 $j$번째 열벡터는 $X^t$의 $j$번째 행벡터이다.
행렬의 연산
이번 절의 목표는 위에서 정의한 $\Mat_{I\times J}(A)$는 $A$-module의 구조를 갖는다는 것이다.
우선 $\Mat_{I\times J}(A)$가 abelian group의 구조를 갖는다는 것을 보이자. 이는 $\Mat_{I\times J}(A)$의 두 행렬
\[X=(x_{ij})_{(i,j)\in I\times J},\qquad Y=(y_{ij})_{(i,j)\in I\times J}\]에 대하여, 이들의 덧셈을
\[X+Y=(x_{ij}+y_{ij})_{(i,j)\in I\times J}\]으로 정의하면 된다. 그럼 $A$에서의 덧셈의 결합법칙과 교환법칙에 의하여, 위의 식이 $\Mat_{I\times J}(A)$ 위에 abelian group의 구조를 정의한다는 것을 안다. 이 때 $\Mat_{I\times J}(A)$의 덧셈에 대한 항등원은 모든 성분이 $0\in A$인 $I\times J$ 행렬이고, $X$의 역원은
\[-X=(-x_{ij})_{(i,j)\in I\times J}\]이다. 그럼 다음 식
\[(X+Y)^t=X^t+Y^t\]을 확인할 수 있다.
이제 $\Mat_{I\times J}(A)$ 위에 left $A$-action의 구조를 주어야 한다. 이는 임의의 $\alpha\in A$와 위와 같은 $X\in\Mat_{I\times J}(A)$에 대하여,
\[\alpha X=(\alpha x_{ij})_{(i,j)\in I\times J}\]으로 정의하면 되며, left $A$-module로서 이것이 만족해야 할 성질들은 $A$가 자기 자신 위의 left module이라는 것으로부터 따라나온다. 비슷하게 $\Mat_{I\times J}(A)$ 위에 right $A$-action을
\[X\alpha=(x_{ij}\alpha)_{(i,j)\in I\times J}\]으로 정의하면 된다. 이 때 $(\alpha X)^t=\alpha X^t$이고 $(X\alpha)^t=X^t\alpha$임을 확인할 수 있다.
뿐만 아니라, $\Mat_{I\times J}(A)$는 free $A$-module이며, 이들의 basis는 다음의 행렬들
\[E_{ij}=(e_{kl})_{(k,l)\in I\times J},\qquad \text{$e_{kl}=0$ for all $(k,l)$ except for $e_{ij}=1$}\]로 주어진다. 엄밀하게는 $E_{ij}$는 행렬의 크기에 대한 정보를 담고 있지 않으므로 표기법 상의 남용이 약간 있지만, 대부분의 경우 혼동의 여지가 없으므로 이대로 사용한다. 그럼 $(E_{ij})^t=E_{ji}$임을 안다.
행렬의 곱셈
기초 선형대수학에서의 정의와 마찬가지로, 두 개의 행렬 $X\in\Mat_{I\times J}(A)$, $Y\in\Mat_{K\times L}(A)$에 대하여, 행렬의 곱 $XY$는 오직 $J=K$일 때만 정의되며, 이 경우 $XY$는 $I\times L$ 행렬이 될 것이다. [선형대수학] §행렬, ⁋정의 3 이후에 살펴본 행렬의 곱의 각 성분의 표현을 따라, 일반적인 상황에서도 $XY$의 $(i,l)$ 성분은 다음의 식
\[(XY)_{il}=\sum_{j\in J} X_{ij}Y_{jl}\tag{2}\]으로 정의된다. 다만, 위의 식의 우변이 일반적으로 유한합이 될 필요가 없으므로 행렬의 곱을 이야기할 때에는 항상 $J=K$가 유한집합임을 가정한다.
이제 각각의 성분별로 계산을 하여 다음의 식들
\[(XY)Z=X(YZ),\quad X(Y+Z)=XY+XZ,\quad (X+Y)Z=XZ+YZ\]를 확인할 수 있다.
다만 [선형대수학] §행렬, ⁋명제 9와는 다르게 행렬의 곱과 전치행렬의 관계를 생각할 때는 주의해야 할 점이 있는데, 식
\[(XY)^t=Y^tX^t\]는 일반적으로 성립하지 않는다는 것이다. 이는 양 변을 성분별로 써 보면 바로 확인할 수 있고, 무엇이 문제인지도 명확한데, 바로 $A$가 commutative가 아니기 때문이다. 위의 식은 우변의 두 행렬 $X^t, Y^t$가 모두 $A$의 opposite ring 위에서 정의된 행렬이라 생각하면 말이 되지만, 대부분의 경우 우리는 $A$가 commutative인 경우를 생각할 것이므로 이는 큰 의미가 없다.
참고문헌
[Goc] M.S. Gockenbach, Finite-dimensional linear algebra, Discrete Mathematics and its applications, Taylor&Francis, 2011.
[Lee] 이인석, 선형대수와 군, 서울대학교 출판문화원, 2005.
댓글남기기