Las matrices son una representación esquemática de funciones lineales de varias variables. De froma general, una matriz es una aplicación $A:\mathbb{R}^n \rightarrow \mathbb{R}^m$, para representar y entender de que van las funciones lineales, vamos a aplicarlo a $\mathbb{R}^2$ que es más fácil de dibujar.
Una aplicación lineal se caracteriza por las propiedades de linealidad, en las que no vamos a entrar en detalle, ya que para los números una aplicación lineal es aquella de la forma:
$$A (x,y) = (ax + by,\, cx + dy)$$
Por comodidad y conveniencia, introduciremos la manera de expresar las funciones en forma de columna, análogamente:
$$A \begin{pmatrix} x \\ y \end{pmatrix} = \begin{pmatrix} ax + by \\ cx + dy \end{pmatrix}$$
Es en la composición de funciones donde se descubre el método de componer matrices, definamos dos aplicaciones de números (en las que al componer no operaremos para ver cómo se comportan)
$$A \begin{pmatrix} x \\ y \end{pmatrix} = \begin{pmatrix} 1x + 2y \\ 3x + 4y \end{pmatrix} \ , \quad \quad B \begin{pmatrix} x \\ y \end{pmatrix} = \begin{pmatrix} 5x + 6y \\ 7x + 8y \end{pmatrix}$$
Así la composición $A \circ B$ queda:
$$A \left( B \begin{pmatrix} x \\ y \end{pmatrix} \right) = A \begin{pmatrix} 5x + 6y \\ 7x + 8y \end{pmatrix} = \begin{pmatrix} 1(5x + 6y) + 2(7x + 8y) \\ 3(5x + 6y) + 4(7x + 8y) \end{pmatrix}$$
Sacando factor común las variables obtenemos la forma en la que se multiplican las matrices
$$A \circ B \begin{pmatrix} x \\ y \end{pmatrix} = \begin{pmatrix} (1\cdot5 + 2\cdot7)x + (1\cdot6+2\cdot8)y \\ (3\cdot5 + 4\cdot7)x + (3\cdot6 + 4\cdot8)y \end{pmatrix} $$
Después de un buen tiempo trabajando con esta notación, es natural que los matemáticos tiendan a querer simplificar la operación eliminando lo superfluo, como las $x$ y las $y$, expresando esta composición en forma matricial:
$$A \circ B = \begin{pmatrix} 1\cdot5 + 2\cdot7 & 1\cdot6+2\cdot8 \\ 3\cdot5 + 4\cdot7 & 3\cdot6 + 4\cdot8 \end{pmatrix} $$
Dejando un último detalle para volver a las variables, ya que la misma forma que tienen de multiplicarse los números, también las tienes con variables, culminando con:
$$A \begin{pmatrix} x \\ y \end{pmatrix} = \begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix} \begin{pmatrix} x \\ y \end{pmatrix} = \begin{pmatrix} 1x + 2y \\ 3x + 4y \end{pmatrix}$$
Dándole el nombre de la matriz a la función sin las variables, pues en esa igualdad es lo que le corresponde.
Matrices en el plano
Al ser funciones, envian puntos que estaban en un sitio, a otro. Por ejemplo para las matrices de $\mathbb{R}^2$ envía puntos del plano a otro sitio del plano. Ayuda a entender las transformaciones de las matrices con animaciones de donde mandaría los putnos del cuadrado unidad, antes y después de aplicar la matriz.
Para aplicar transformaciones, es bueno empezar con variables de la matriz identidad, que es la función que deja todos los puntos donde están.
$$I_2 \begin{pmatrix} x \\ y \end{pmatrix} = \begin{pmatrix} x \\ y \end{pmatrix} = \begin{pmatrix} x \\ y \end{pmatrix} = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix} \begin{pmatrix} x \\ y \end{pmatrix} $$
Una característica que cumplen todas las combinaciones lineales es que llevan el cero $(0,0)$ al cero $(0,0)$. Por eso en todas las transformaciones podéis ver que dicho punto no varía.
Simetrías (Espejo)
Una matriz que cambia en espejo sobre el eje x (simetría axial), cambia los signos de dichos puntos, siendo esta matriz para el eje x la:
$$\begin{pmatrix} -1 & 0 \\ 0 & 1 \end{pmatrix}$$
Mediante esta animación podemos ver cómo desplaza el cuadrado unidad hasta aplicar finalmente la simetria completa:

Análogamente, la matriz que realiza la simetría respecto del eje y es $\begin{pmatrix} 1 & 0 \\ 0 & -1 \end{pmatrix}$
Y la simetría central es aplicar a la vez estas dos simetrías $\begin{pmatrix} -1 & 0 \\ 0 & -1 \end{pmatrix}$, que es equivalente a girar 180º.
Observando los determinantes de estas simetrías, sabemos que si el signo del determinante es negativo, se ha producido una simetría axial y la derecha está en la izquierda y viceversa. Si el determinante es positivo se ha mantenido la derecha y la izquierda.
Estiramiento y contracción
Una matriz diagonal con valores distintos de 1 va a estirar ( si es mayor que 1) y encoger (si es menor que 1). El área resultante está multiplicada por el determinante de la matriz. Por ejemplo para la matriz:
$$\begin{pmatrix} 4 & 0 \\ 0 & \frac{1}{2} \end{pmatrix}$$

Si la matriz es diagonal mantiene los ángulos rectos.
Rotación
Una matriz de giro en dirección de las agujas del reloj, que se desplace un ángulo $\alpha$ es de la forma:
$$\begin{pmatrix} cos\,\alpha & -sen\,\alpha \\ sen\,\alpha & cos\,\alpha \end{pmatrix}$$
Por ejemplo para un giro de 90º tenemos la matriz
$$\begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}$$

Otra matriz interesante es el giro de 45º, que sería $\begin{pmatrix} \frac{\sqrt{2}}{2} & -\frac{\sqrt{2}}{2} \\ \frac{\sqrt{2}}{2} & \frac{\sqrt{2}}{2} \end{pmatrix}$ que si lo estiramos multiplicando por raíz de 2 tenemos $\begin{pmatrix} 1 & -1 \\ 1 & 1 \end{pmatrix}$
Combinación
En general una matriz llena de número hará varias cosas a la vez, como girar y estirar:
$$\begin{pmatrix} 1 & -4 \\ 1 & 2 \end{pmatrix}$$

Lo malo de esta combinación, es que aunque le área sigue aumentando con el valor del determinante, no mantiene los ángulos rectos, y por tanto, los lados no se multiplican solamente por los valores del determinante.