6. Transformações Lineares

Dados dois espaços vetoriais, \(V\) e \(W\), uma transformação entre eles é uma função que associa vetores de \(V\) em vetores de \(W\). Ela pode ser uma rotação de \(\mathbb{R}^2\) como as que foram estudadas na seção anterior, que associa vetores do plano em outros vetores do plano, girados de um ângulo \(\theta\). Outro exemplo seria a associação de um vetor do espaço em um vetor do plano que corresponde a uma projeção do primeiro vetor neste plano. Esta última transformação poderia, por exemplo, ser usada em uma aplicação gráfica para desenhar a sombra de um objeto tridimensional. Denotaremos por \(F : V \rightarrow W\) uma transformação que leva vetores de \(V\) em vetores de \(W\). Os termos transformação, aplicação e função são equivalentes e serão usados livremente neste texto.

Definição: Se \(V\) e \(W\) são dois espaços vetoriais, uma transformação \(F : V \rightarrow W\) é uma regra que associa a vetores de \(V\) um único vetor de \(W\).

Definição: Dados os espaços vetoriais \(U, V\) e \(W\), se \(F : U \rightarrow V\) e \(G : V \rightarrow W\), a transformação composta \(G \circ F : U \rightarrow W\) é definida da seguinte forma: se \(u \in U\) então
$$ G \circ F (u) = w = G (F (u)) \in W, $$

desde que \(F (u)\) esteja no domínio de \(G\).

Definição: Dada uma transformação \(F : V \rightarrow W\) entre dois espaços vetoriais a transformação inversa, quando existir, é uma transformação \(F^{-1} : W \rightarrow V\) tal que se
$$ F (v) = w \Rightarrow F^{-1}(w) = v. $$

Observe que, se \(F^{-1}\) é a inversa de \(F\), então \(F^{-1} \circ F : V \rightarrow V\) é a aplicação identidade, \(F^{-1} \circ F (v) = v, \forall v \in V\) (ela deixa inalterado qualquer vetor \(v)\).

Figura *

Exemplo . A composição de funções é uma prática rotineira em aplicações da matemática desde os estágios iniciais de seu estudo. Por exemplo, se \(f : \mathbb{R} \rightarrow \mathbb{R}\) dada por \(f (x) = x + 1\) e \(g : \mathbb{R} \rightarrow \mathbb{R}\) dada por \(g (x) = \sqrt{x}\) então a composta \(g \circ f : \mathbb{R} \rightarrow \mathbb{R}\) é a função \(g (f(x)) = g (x + 1) = \sqrt{x + 1}\).

As transformações lineares representam um caso particular das transformações me geral, de grande importância no estudo da matemática e aplicações. Elas são importantes porque muitos objetos e fenômenos que se pretende descrever ocorrem de forma linear, entre eles o estudo de circuitos passivos (contendo apenas resistores), o cálculo de estruturas de concreto, a manipulação computadorizada de imagens, etc. Além disto, mesmo objetos e fenômenos que não ocorrem de forma linear admitem, em seu tratamento, uma primeira aproximação linear, a partir da qual se procura fazer correções e aperfeiçoamentos.

Definição: Dados dois espaços vetoriais, \(V\) e \(W\), uma transformação linear entre eles é uma função de \(V\) em \(W\), \(F : V \rightarrow W\), satisfazendo:

  1. \(F (u + v) = F (u) + F (v), \forall u, v \in V\),
  2. \(F (k u) = k F (u), \forall u \in V, k\) um escalar qualquer.

Exemplo . A transformação de \(\mathbb{R}^2\) em \(\mathbb{R}^2\)
$$ \begin{array}{rl}
F : \mathbb{R}^2 \mapsto & \mathbb{R}^2 \\
(x, y) \mapsto & (x+y, x-y)
\end{array} $$
é uma transformação linear. Antes de mostrar isto, como ilustração do significado de uma transformação, observe que \(F\) tem o seguinte efeito sobre os vetores abaixo:
$$ \begin{array}{rrr}
F (1, 1) = (2, 0), & F (1, 0) = (1, 1), &\\
F (0, 0) = (0, 0), & F (3, 2) = (5, 1), & \text{etc..}
\end{array}
$$

Dados dois vetores de \(\mathbb{R}^2\), \(\vec{u} = (u_x, u_y)\) e \(\vec{v} = (v_x, v_y)\) então
$$ \begin{array}{rl}
F (\vec{u} + \vec{v}) = & F[(u_x + v_x, u_y + v_y)]=(u_x + v_x + u_y + v_y, u_x + v_x – u_y – v_y) = \\
& (u_x + u_y, u_x – u_y) + (v_x + v_y, v_x – v_y) = F (\vec{u}) + F (\vec{v}).
\end{array}
$$

Além disto, se \(k\) é um escalar temos
$$ F (k \vec{u}) = F [(k u_x, k u_y)] = (k u_x + k u_y, k u_x – k u_y) = k(u_x + u_y, u_x – u_y) = k F (\vec{u}).$$

Portanto a aplicação \(F\) satisfaz as duas condições e é, portanto, uma transformação linear. Vale a pena notar que \(F (\vec{0}) = \vec{0}\), i. e. ela leva o vetor nulo no vetor nulo, o que é, como veremos em breve, uma característica de todas as transformações lineares.

Exemplo . A transformação \(G : \mathbb{R} \rightarrow \mathbb{R}\) dada por \(G (u) = \alpha u\), (a multiplicação de um vetor por um fator \(\alpha\) ) é linear, pois:
$$ \begin{array}{rl}
G(u+v)= & \alpha (u + v)=\alpha u + \alpha v = G(u)+G(v), \\
G(ku)= & \alpha (ku)=k(\alpha u) = k\,G(u).
\end{array}
$$

Observamos novamente que \(G (0) = 0\).

Exemplo . A transformação
$$ \begin{array}{r}
H : \mathbb{R} \rightarrow \mathbb{R}\\
x \mapsto x^2
\end{array}
$$
não é linear. Qualquer uma das duas propriedades (i) e (ii) não são satisfeitas pois
$$ \begin{array}{rl}
H (u + v) = & (u + v)^2 = u^2 + v^2 + 2 u v \neq H (u) + H (v) ; \\
H (k u + v) = & (k u)^2 = k^2 u^2 \neq k H (u).
\end{array}
$$

Embora esta não seja uma transformação linear é verdade que \(H (0) = 0\).

Exemplo . A transformação
$$ \begin{array}{r}
J : \mathbb{R}^2 \rightarrow \mathbb{R}^3\\
(x, y) \mapsto (2 x, 0, x + y)
\end{array}
$$
é linear. Dados o vetores de \(\mathbb{R}^2\), \(\vec{u} = (x_1, y_1)\) e \(\vec{v} = (x_2, y_2)\) então
$$ \begin{array}{rl}
J (\vec{u}+\vec{v})= & J [(x_1 + x_2, y_1 + y_2)] = (2 x_1 + 2 x_2, 0, x_1 + y_1 + x_2 + y_2) = \\
& (2 x_1, 0, x_1 + y_1) + (2 x_2, 0, x_2 + y_2) = F (\vec{u}) + F (\vec{v}).
\end{array}
$$

Sendo \(k\) um escalar
$$ J (k \vec{u}) = J [(k x_1, k y_1)] = (2 k x_1, 0, k x_1 + k y_1) = k (2x_1, 0, x_1 + y_1) = k J (\vec{u}) . $$

Afirmação: Se \(F : V \rightarrow W\) é uma transformação linear, então \(F (0_V) = 0_W,\) onde \(0_V \;\text{ e }\; 0_W\) são, respectivamente, os vetores nulos de \(V\) e de \(W\).

Demonstração: Podemos escrever o vetor nulo como \(W \ni 0 = u – u\). Se \(F\) é linear então,
$$ F (0) = F (u – u) = F (u) – F (u) = 0 \in W. $$

No último exemplo, \(J (x, y) = (2 x, 0, x + y)\) temos que \(J (0, 0) = (0, 0, 0)\), ou seja, \(J\) leva o vetor nulo de \(\mathbb{R}^2\) no vetor nulo de \( \mathbb{R}^3\). Vimos também que a transformação \(H : \mathbb{R} \rightarrow \mathbb{R}; H (x) = x^2\) não é linear mas \(H(0) = 0\). Esta é, portanto, uma condição necessária mas não suficiente para que a transformação seja linear.

Exemplo . A transformação \(L : \mathbb{R}^3 \rightarrow \mathbb{R}^3\), dada por
$$ \text{ } L (x, y, z) = (x + 1, y, z) $$

não é linear pois \(L (0, 0, 0) = (1, 0, 0) \neq 0\). As condições (i) e (ii) não precisam ser testadas, nesta caso.

Exemplo . A transformação \(M : \mathbb{R}^3 \rightarrow \mathbb{R}\), dada por
$$ \text{ } M (\vec{v}) = \vec{v} \cdot \vec{v} \;\;\; \text{(o produto escalar)} $$

não é linear, embora \(M (\vec{0})=0.\;\;\) Apesar disto, se \(\vec{u}\), \(\vec{v} \in \mathbb{R}^3\) então
$$ \begin{array}{rl}
M(\vec{u}+\vec{v})= & (\vec{u}+\vec{v})\cdot(\vec{u}+\vec{v})=\vec{u}\cdot\vec{u}+\vec{v}\cdot\vec{v}+2\vec{u}\cdot \vec{v}\neq M(\vec{u})+M(\vec{v}), \\
M(k\vec{u})= & (k \vec{u}) \cdot (k \vec{u}) = k^2 \vec{u} \cdot \vec{u}\neq k M (\vec{u}).
\end{array}$$

Naturalmente, se uma das condições não é satisfeita já sabemos que a transformação não é linear. Nos exemplos sempre testamos as duas condições, para efeito de exercício.

Exemplo . A operação derivada \(D : P_n \rightarrow P_n\) (que leva polinômios em polinômios, ambos de grau menor ou igual a \(n\) ) é uma transformação linear. Se \(f, g \in P_n\) (são polinômios), e \(k\) é um escalar então
$$ \begin{array}{l} D (f + g) = D (f) + D (g), \\ D (k f) = k D (f). \end{array} $$

Exemplo . \(N : V \rightarrow W\), \(N (u) = 0, \forall u \in V\), é uma transformação linear pois
$$ \begin{array}{l} N (u + v) = 0 = N (u) + N (v); \\ N (k u) = k N (u) = 0. \end{array} $$

Exemplo . Toda matriz \(m \times n\) esta associada a uma transformação linear \(A : \mathbb{R}^n \rightarrow \mathbb{R}^m\):
$$
\left[ \begin{array}{rrrr}
a_{11} & a_{12} & \cdots & a_{1 n} \\
a_{21} & a_{22} & \cdots & a_{2 n} \\
\vdots & & & \vdots \\
a_{m1} & a_{m 2} & \cdots & a_{m n}
\end{array} \right]
\left[ \begin{array}{r} x_1\\ x_2\\ \vdots\\ x_n \end{array} \right] =
\left[ \begin{array}{r} y_1\\ y_2\\ \vdots\\ y_m\end{array} \right].
$$

Denotando a operação acima por \(A \vec{x} = \vec{y}\), sabemos da álgebra das matrizes que
$$ \begin{array}{l}
A (\overrightarrow{x_1} + \overrightarrow{x_2}) = A (\overrightarrow{x_1}) + A (\overrightarrow{x_2}); \\
A (k \vec{x}) = k A (\vec{x}).
\end{array}
$$

Veremos mais tarde que a afirmação inversa também é verdadeira, ou seja, que toda a transformação linear \(T : V \rightarrow W\) (dois espaços vetorais) pode ser representada por uma matriz \(m \times n\) onde \(n\) é a dimensão de \(V\) e \(m\) a dimensão de \(W\).

Exemplo . Dada a matriz \(3 \times 2\)
$$
A = \left[ \begin{array}{rr}
2 & 0\\
0 & 0\\
1 & 1
\end{array} \right]
$$

existe a aplicação linear \(L_A : \mathbb{R}^2 \rightarrow \mathbb{R}^3\),
$$ \left[ \begin{array}{r}
x\\
y
\end{array} \right] \mapsto \left[ \begin{array}{rr}
2 & 0\\
0 & 0\\
1 & 1
\end{array} \right] \left[ \begin{array}{r}
x\\
y
\end{array} \right] = \left[ \begin{array}{c}
x \\ 0 \\ x + y
\end{array} \right] .
$$

Esta transformação é idêntica à \(J (x, y) = (2 x, 0, x + y)\), usada anteriormente em um exemplo.

Afirmação: Se \(F : V \rightarrow W\) é uma transformação linear, então \(F\) leva retas de \(V\) em retas de \(W\).

Demonstração: Uma reta de \(V\) é um espaço gerado por um único vetor. Vamos aqui denotar esta reta por \(\alpha = [v] = \{t v\},\) onde \(v \in V\) é um vetor fixo, \(t\) uma variável. A imagem desta reta, sob a acão de \(F\) é \(F \{tv\} = \{tF (v)\} = [F (v)]\), que é uma reta de \(W\).

Observação: Esta é, aliás, o motivo do nome, transformação linear.

Figura *

Transformações do plano no plano

De particular importância entre as transformações lineares entre espaços vetoriais estão as transformações \(T : \mathbb{R}^2 \rightarrow \mathbb{R}^2\). Grande parte das operações em computação gráfica pertencem a este tipo de transformações, em particular as expansões e contrações (para aumentar ou diminuir o tamanho de uma figura na tela do computador), as reflexões, projeções e rotações.

Expansão e contração uniforme

Uma transformação
$$ \begin{array}{lll}
T : & \mathbb{R}^2 \rightarrow \mathbb{R}^2 & \\
& \vec{v} \mapsto \alpha \vec{v}, & \alpha \in \mathbb{R}
\end{array}
$$

é uma expansão ou dilatação se \(\alpha \gt 1\), ou uma contração se \(\alpha \lt 1\). Vale aqui nos lembrarmos de que a multiplicação de um vetor por um escalar \(\alpha\) tem o efeito de multiplicar seu comprimento por \(| \alpha |\) pois
$$ |T (\vec{v}) | = | \alpha \vec{v} | = \sqrt[]{\alpha^2 \vec{v} . \vec{v} } = | \alpha | | \vec{v} |. $$

Exemplo . A seguinte transformação é uma dilatação,
$$ \begin{array}{rr}
T : & \mathbb{R}^2 \rightarrow \mathbb{R}^2\\
& \vec{v} \mapsto 2 \vec{v},
\end{array}
$$
que dobra o comprimento do vetor, conforme a figura *a. Em termos matriciais ela pode ser expressa por
$$ T \left[ \begin{array}{r}
x\\
y
\end{array} \right] = \left[ \begin{array}{rr}
2 & 0\\
0 & 2
\end{array} \right] \left[ \begin{array}{r}
x\\
y
\end{array} \right] = \left[ \begin{array}{r}
2 x\\
2 y
\end{array} \right] .
$$

Por outro lado a aplicação \(F (x, y) = \frac{1}{2} (x, y)\) é uma contração, mostrada na figura *b.

figura

Reflexão em torno do eixo \(\mathcal{O}x\)

A transformação
$$ \begin{array}{rl}
R_x : & \mathbb{R}^2 \rightarrow \mathbb{R}^2 \\
& (x, y) \mapsto (x,- y),
\end{array} $$
representa uma reflexão em torno do eixo \(\mathcal{O}x\), ilustrada na figura *. Em notação matricial
$$ \left[ \begin{array}{r}
x’\\
y’
\end{array} \right] = \left[ \begin{array}{rr}
1 & 0\\
0 & – 1
\end{array} \right] \left[ \begin{array}{r}
x\\
y
\end{array} \right] = \left[ \begin{array}{r}
x\\
– y
\end{array} \right], \;\;\;\text{ onde }\;\;\; \left[ \begin{array}{r}
x’\\
y’
\end{array} \right] = T \left[ \begin{array}{r}
x\\
y
\end{array} \right] .
$$

Rotação de um ângulo \(\theta\)

Dado um vetor \(\vec{v} \in \mathbb{R}^2\) queremos conhecer a transformação \(R_{\theta} : \mathbb{R}^2 \rightarrow \mathbb{R}^2\) tal que \(\vec{v}’ = R_{\theta} (\vec{v})\) tem o mesmo comprimento que \(\vec{v}\) mas está girado de um ângulo \(\theta\) no sentido antihorário, como mostrado na figura *. Vamos começar denotando por \(r = | \vec{v} |\) o módulo deste vetor, e \(\alpha\) o ângulo que ele faz com o eixo \(\mathcal{O}x\). Nesta notação, se \(\vec{v} = (x, y)\) temos
$$ \left. \begin{array}{r} x = r \cos \theta \\ y = r \text{sen } \theta\end{array} \right\} \Rightarrow \vec{v} = r (\cos \theta, \text{sen }\theta). $$

O novo vetor \(\vec{v}’\) obtido de \(\vec{v}\) por meio de um giro de ângulo \(\theta\) será escrito por
$$ \begin{array}{r} x’ = r \cos (\alpha + \theta),\\ y’ = r \text{sen } (\alpha + \theta). \end{array} $$

Podemos aqui usar as identidades trigonométricas para a soma de ângulos,
$$ \begin{array}
\cos (\alpha + \theta) = \cos \alpha \cos \theta – \text{sen } \alpha \text{sen } \theta, \\
\text{sen } (\alpha + \theta) = \text{sen } \alpha \cos \theta + \cos \alpha \text{sen } \theta.
\end{array} $$

Por conseguinte as coordenadas de \(\vec{v}’\) serão
$$ \begin{array} {l}
x’ = r \cos \alpha \cos \theta – r \text{sen } \alpha \text{sen } \theta = x \cos \theta – y \text{sen } \theta, \\
y’ = r \text{sen } \alpha \cos \theta + r \cos \alpha \text{sen } \theta = x \text{sen } \theta + y \text{sen } \theta.
\end{array} $$

Temos portanto, a transformação procurada,
$$ R_{\theta} \left[ \begin{array}{r}
x\\
y
\end{array} \right] = \left[ \begin{array}{r}
x’\\
y’
\end{array} \right] = \left[ \begin{array}{rr}
\cos \theta & – \text{sen } \theta\\
\text{sen } \theta & \cos \theta
\end{array} \right] \left[ \begin{array}{r}
x\\
y
\end{array} \right] .
$$

Exemplo . No caso particular de uma rotação de \(\theta = \pi / 2\) temos
$$ R_{\pi / 2} \left[ \begin{array}{r}
x\\ y
\end{array} \right] = \left[ \begin{array}{rr}
0 & – 1\\ 1 & 0
\end{array} \right] \left[ \begin{array}{r}
x\\ y
\end{array} \right] = \left[ \begin{array}{r}
– y\\ x
\end{array} \right].
$$

Exercício: Denotando por \(R_{\theta}\) a rotação antihorário de um ângulo \(\theta\) mostre que
$$ R_{\theta 1} \cdot R_{\theta_2} = R_{(\theta_1 + \theta_2)}.$$

Extra: Um conceito importante em álgebra moderna é o de um grupo. Um grupo é um conjunto \(G \neq \emptyset\), dotado de uma operação binária \(\ast\), satisfazendo as seguintes propriedades:

  1. Se \(a,\, b,\, c \in G \Rightarrow (a \ast b) \ast c = a \ast (b \ast c)\) (associatividade).
  2. \(\exists \, e \, \in G\) tal que \(e \ast a = a \ast e = a, \forall a \in G\) (existência do elemento neutro).
  3. \(\forall a \in G \; \exists b \; \in G\) tal que \(a \ast b = b \ast a = e\) (existência do elemento inverso).

Estas propriedades significam que um grupo é um conjunto com uma operação \(\ast\) associativa, onde existe um elemento neutro \(e\) (com relação àquela operação) e que para cada elemento \(a\) de \(G\) existe um inverso \(b\) (algumas vezes denotado por \(a^{-1}\)).

Mostre que o conjunto \(G = (R_{\theta}, \ast)\) onde \( \ast\) é a multiplição usual de matrizes, é um grupo. Quem são, neste grupo, os elementos \(e\) (a identidade) e \( [R_{\theta}]^{-1}\), o inverso de \(R_{\theta}\)?

Translações

Exemplos de transformações importantes no plano são as translações
$$ T (x, y) = (x + a, y + b) $$

ou
$$ T \left[ \begin{array}{r}
x\\
y
\end{array} \right] = \left[ \begin{array}{r}
x’\\
y’
\end{array} \right] = \left[ \begin{array}{rr}
1 & 0\\
0 & 1
\end{array} \right] \left[ \begin{array}{r}
x\\
y
\end{array} \right] + \left[ \begin{array}{r}
a\\
b
\end{array} \right] .
$$

Estas não são, no entanto, transformações lineares, como se pode mostrar facilmente.

O teorema seguinte seguinte mostra que, para conhecer o efeito de uma transformação linear sobre os vetores de um espaço vetorial, basta conhecer o efeito desta transformação sobre todos os vetores de uma de suas bases.

Teorema: Uma transformação linear \(T : V \rightarrow W\) fica inteiramente determinada por sua ação sobre os vetores de uma base de \(V\).

Demonstração: Seja \(\beta = \{v_1, \ldots, v_n \}\) uma base de \(V\) e suponha conhecidos \(T (v_1) = w_1, \ldots, T (v_n) = w_n\). Então, qualquer \(v \in V\) e sua transformação \(T(v)\) podem ser escritos respectivamente como
$$ \begin{array}{rl}
v = & a_1 v_1 + \ldots + a_n v_n \;\;\; \text{e} \\
T(v)= & T(a_1 v_1+\ldots +a_n v_n)=a_1 T(v_1)+ \ldots + a_n T(v_n) \\
= & a_1 w_1 + \ldots + a_n w_n,
\end{array} $$
como foi afirmado.

Exemplo . Qual é a transformação linear \(T : \mathbb{R}^2 \rightarrow \mathbb{R}^3\) satisfazendo
$$ T (1, 0) = (2, – 1, 0) \text{ e } T (0, 1) = (0, 0, 1) ? $$

Qualquer vetor \(\vec{v} \in \mathbb{R}^2\) pode ser escrito na base canônica
$$ \vec{v} = (x, y) = x (1, 0) + y (0, 1) . $$
Então
$$ T (\vec{v}) = xT (1, 0) + yT (0, 1) = x (2, – 1, 0) + y (0, 0, 1) = (2 x, – x, y) . $$
Em termos matriciais
$$ T \left[ \begin{array}{r}
x\\
y
\end{array} \right] = \left[ \begin{array}{rr}
2 & 0\\
– 1 & 0\\
0 & 1
\end{array} \right] \left[ \begin{array}{r}
x\\
y
\end{array} \right] = \left[ \begin{array}{r}
2 x\\
– x\\
y
\end{array} \right] .
$$

Relembramos aqui que uma matriz \(3 \times 2\) corresponde a uma transformação de \(\mathbb{R}^2\) em \(\mathbb{R}^3\).

Exemplo . Queremos encontrar a transformação linear \(T : \mathbb{R}^2 \rightarrow \mathbb{R}^3\) satisfazendo
$$ T (1, 1) = (3, 2, 1) \text{ e } T (0, – 2) = (0, 1, 0) . $$

Neste caso, \(\{(1, 1), (0, – 2)\}\) não é a base canônica de \(\mathbb{R}^2\). Temos então que encontrar a decomposição de um vetor qualquer nesta base. O \(\vec{v} = (x, y) \in \mathbb{R}^2\) pode ser escrito nesta base como
$$
\vec{v} = (x, y) = a (1, 1) + b (0, – 2) \Rightarrow \left\{
\begin{array}{r}
(a, a – 2 b) = (x, y), \\
a = x, \\
b = \frac{1}{2} (x – y).
\end{array} \right.
$$

Dai
$$ (x, y) = x (1, 1) + \frac{1}{2} (x – y) (0, – 2) $$
e o vetor transformado é
$$ T (x, y) = xT (1, 1) + \frac{1}{2} (x – y) T (0, – 2) = $$

$$ = x (3, 2, 1)+\frac{1}{2}(x-y)(0, 1, 0)=\left(3x,\frac{5 x-y}{2},x\right).$$

Em termos matriciais
$$ T \left[ \begin{array}{r}
x\\
y
\end{array} \right] = \left[ \begin{array}{rr}
3 & 0\\
5 / 2 & – 1 / 2\\
1 & 0
\end{array} \right] \left[ \begin{array}{r}
x\\
y
\end{array} \right] .
$$

Vimos que uma transformação linear \(T : V \rightarrow W\) transforma vetores de um espaço vetorial \(V\) em vetores de outro, \(W\). Algumas definições serão necessárias para prosseguirmos.

Definição: Seja \(T : V \rightarrow W\) uma transformação linear. A imagem de \(T\) é o conjunto
$$ \text{Im} (T) = \{w \in W ; T (v) = w \text{ para algum } v \in V\} . $$

A imagem é, portanto, o conjunto de todos os vetores de \(W\) que são imagem de algum vetor de \(V\) pela transformação \(T\). Podemos denotar a imagem por \(\text{Im} (T)\) ou por \(T (V)\).

Definição: Seja \(T : V \rightarrow W\) uma transformação linear. O núcleo da transformação \(T\) é o conjunto
$$ \text{Nuc } (T) = \{v \in V ; T (v) = 0\} . $$

O núcleo é, portanto, o conjunto de todos os vetores de \(V\) que são levados no vetor nulo de \(W\). Observe que \(\text{Nuc } (T) \neq \emptyset\) pois se \(0_V\) é o vetor nulo de \(V\) então \(T (0_V) = 0_W\) (i.e. pelo menos o vetor nulo de \(V\) está no núcleo).

Obs. Em alguns textos o núcleo é denotado por \(\text{Ker} (T)\) (do inglês, kernel).

Exercício importante: Mostre que \(T (V)\) é um subespaço vetorial de \(W\) e \(\text{Nuc }(V)\) é um subespaço vetorial de \(V\).

Figura: Imagem e núcleo (feita)

Exemplo . Considere a transformação linear
$$ \begin{array}{rl}
T : & \mathbb{R}^2 \mapsto \mathbb{R} \\
& (x, y) \mapsto x + y.
\end{array}
$$

O núcleo desta transformação é \(\text{Nuc } (T) = \{(x, y) \in \mathbb{R}^2 ; x + y = 0\}\). Portanto o núcleo desta transformação é a reta \(y = – x\), exibida na figura *. A imagem de \(T\) é \(\text{Im} (T) =\mathbb{R}\), (toda a reta real) pois qualquer ponto \(r\) desta reta pode ser obtido pela expressão \(r = x + y\), escolhndo-se \(x, y\) adequadamente.

figura *

Exemplo . A transformação linear \(T : \mathbb{R}^3 \rightarrow \mathbb{R}^3\) dada por \(T (x, y, z) = (x, 2 y, 0)\) tem como imagem o conjunto
$$ \text{Im} (T) = \{(x, 2 y, 0) | x, y \in \mathbb{R}\} . $$

Observe que esta imagem é o plano \([(1, 0, 0), (0, 1, 0)]\), isto é, o plano gerado por \(\hat{\imath}\) e \(\hat{\jmath}\) ou ainda o plano \(x\mathcal{O}y\) \((z = 0)\). A dimensão da imagem é \(\dim \text{Im} (T) = 2\), pois existem 2 vetores em sua base. O núcleo desta transformação é
$$ \text{Nuc } (T) = \{(x, y, z) \in \mathbb{R}^3 ; (x, 2 y, 0) = 0\}, $$

ou seja, \(x = 0, y = 0\). Não há qualquer restrição sobre o valor de \(z\), portanto
$$ \text{Nuc } (T) = \{(0, 0, z) ; z \in \mathbb{R}\} . $$

Isto significa que \(\text{Nuc } (T) = [(0, 0, 1)]\), o eixo \(\mathcal{O}z\) e \(\dim \text{Nuc } (T) = 1\). Observe que
$$ \dim \text{Im} (T) + \dim \text{Nuc } (T) = 3 = \dim V. $$

Este resultado será explorado em breve.

Definição: Uma aplicação \(T : V \rightarrow W\) é injetora se, dados \(u, v \in V\), com \(T (u) = T (v)\), então \(u = v\). Equivalentemente, se \(u \neq v\) então \(T (u) \neq T (v)\).

figura

Uma aplicação injetora é aquela que tem imagens distintas para vetores distintos.

Definição: Uma aplicação \(T : V \rightarrow W\) é sobrejetora se \(T (V) = W\), ou seja, a imagem de \(V\) por \(T\) é todo o espaço \(W\). Isto significa que todo vetor de \(W\) é imagem de algum vetor de \(V\) por \(T\).

figura *

Definição: Uma aplicação que é simultaneamente injetora e sobrejetora é uma aplicação bijetora (ou uma bijeção).

Exemplo . A aplicação \(T : \mathbb{R} \rightarrow \mathbb{R}^2\), dada por \(T (x) = (x, 0)\) é injetora pois, se \(x \neq y\) temos \(T (x) \neq T (y)\). No entanto ela não é sobrejetora pois sua imagem é apenas o eixo \(\mathcal{O}x\) de \(\mathbb{R}^2\).

Teorema: Uma aplicação linear \(T : V \rightarrow W\) é injetora se, e somente se, \(\text{Nuc } (T) = \{0\}\).

Demonstração: Suponha que \(\text{Nuc } (T) = \{ \vec{0} \}\). Tome dois vetores \(u, v \in V\) tal que \(T (u) = T (v)\). Então \(T (u) – T (v) = 0 \Rightarrow T (u – v) = 0\), já que a aplicação é linear. Isto indica que \(u – v \in \text{Nuc } (T)\) logo \(u – v = 0\) (pois o núcleo contém apenas o vetor nulo). Resumindo, se \(T (u) = T (v)\) temos, obrigatoriamente que \(u = v\), logo \(T\) é injetora.

Por outro lado, suponha \(T\) injetora e tome um vetor \(v \in \text{Nuc } (T) \Rightarrow\) \(T (v) = 0\). Mas \(T (0) = 0\) para qualquer aplicação linear logo \(T (v) = T (0)\) ou seja \(v = 0\) (pois \(T\) é injetora) de onde se conclui que \(\text{Nuc } (T) = \{0\}\).

Exemplo . Queremos descobrir se a aplicação
$$ \begin{array}{rl}
T : & \mathbb{R}^2 \rightarrow \mathbb{R}^3 \\
& (x, y) \mapsto (x + y, x, x – y),
\end{array}
$$
é injetora. Sem usar a definição do que é uma aplicação injetora procuramos por núcleo,
$$ \begin{array}{r}
\text{Nuc }(T)=\{(x, y) \in \mathbb{R}^2 ; T (x, y) = 0 \} \Rightarrow \\
(x + y, x, x – y) = 0 \Rightarrow x = 0, y = 0.
\end{array}
$$
portanto \(\text{Nuc } (T) = \{0\}\), logo \(T\) é injetora.

Teorema: Seja \(T : V \rightarrow W\) uma aplicação linear. Então
$$ \dim \text{Nuc } (T) + \dim \text{Im} (T) = \dim V. $$

Demonstração: Considere que \(\beta_N = \{v_1, \ldots, v_n \}\) é uma base de \(\text{Nuc } (T)\) à qual adicionamos o conjunto de vetores \(w_k\) necessários para que \(\beta_V = \{v_1, \ldots, v_n, w_1, \ldots, w_m \}\) seja uma base de \(V\). Com estas definições temos que \(\dim \text{Nuc } (T) = n\) e \(\dim V = n + m\). Qualquer vetor \(v \in V\) pode ser decomposto na base \(\beta_V \) como
$$ v = a_1 v_1 + \ldots + a_n v_n + b_1 w_1 + \ldots + b_m w_m . $$

O efeito da transformação \(T\) sobre este vetor é dada por
$$ \begin{array}{rl}
T(v) = & a_1 T (v_1) + \ldots + a_n T (v_n) + b_1 T (w_1) + \ldots + b_m T(w_m) = \\ & b_1 T (w_1) + \ldots + b_m T (w_m),
\end{array} $$

onde a última igualdade se deve a que os vetores \(v_k, k = 1, \ldots, n\) estão no núcleo, logo \(T (v_k) = 0\). A imagem de \(T\) é, portanto
$$ \text{Im} (T) = \{b_1 T (w_1) + \ldots + b_m T (w_m) ; b_k \in \mathbb{R}, k = 1, \ldots, m\} $$

ou ainda
$$ \text{Im} (T) = [T (w_1), \ldots, T (w_m)]. $$

Resta mostrar que os vetores \(T (w_i)\) são l.i.. Procedemos, como de costume, verificando se a combinação linear
$$ c_1 T (w_1) + \ldots + c_m T (w_m) = 0 $$

só pode ser obtida com todos os coeficientes \(c_k = 0\). Como \(T\) é linear podemos escrever
$$ T (c_1 w_1 + \ldots + c_m w_m) = 0, $$

concluindo que o vetor entre parênteses está no núcleo e pode, portanto, ser decomposto na base \(\beta_N\) como
$$ c_1 w_1 + \ldots + c_m w_m = d_1 u_1 + \ldots + d_n u_n . $$

A seguinte combinação linear é, por isto, nula,
$$ c_1 w_1 + \ldots + c_m w_m – d_1 u_1 – \ldots – d_n u_n = 0, $$

o que só pode ser conseguido com todos os coeficientes constantes nulos, \(c_k = 0\) e \(d_l = 0\), pois esta é uma combinação linear entre os vetores da base \(\beta_V\) de \(V\) (que são, por definição, l.i.). Isto mostra que o conjunto \(\beta_I = \{T (w_1), \ldots, T (w_m)\}\) é l.i. e gera \(\text{Im} (V)\), portanto é uma base da imagem. Dai se conclui que \(\dim \text{Im} (V) = m\) e o teorema fica provado.

Corolário: Se \(T : V \rightarrow W\) é uma aplicação linear e injetora, e \(\dim V = \dim W\) então \(T\) transforma bases de \(V\) em bases de \(W\).

Observação: Em outras palavras, o corolário afirma que, se \(\beta_V = \{v_1, \ldots, v_n \}\) é uma base de \(V\) então \(\beta_W = \{T (v_1), \ldots, T (v_n)\}\) é uma base de \(W\).

Demonstração: Tome \(\beta_V = \{v_1, \ldots, v_n \}\),uma base de \(V\). Queremos saber se \(\beta_W = \{T (v_1), \ldots, T (v_n)\}\) é l.i.. Para isto tornamos nula a combinação linear
$$ k_1 T (v_1) + \ldots + k_n T (v_n) = 0 \Rightarrow T (k_1 v_1 + \ldots + k_n v_n) = 0, $$

a última afirmação decorrendo de ser \(T\) linear. Como \(T\) é injetora então \(\text{Nuc } (T) = \{0\}\) e, portanto, \(k_1 v_1 + \ldots + k_n v_n = 0\), o que só pode ser obtido se todos os coeficientes constantes forem nulos, \(k_i = 0, i = 1, \ldots, n\). Dai se conclui que \(\beta_W\) é um conjunto de vetores l.i.. Como \(\dim V = \dim W = n\) então, como queríamos mostrar, \(\beta_W\) é uma base de \(W\).

Definição (isomorfismo): Se a aplicação linear \(T : V \rightarrow W\) é simultaneamente injetora e sobrejetora então dizemos que ela é um isomorfismo. Dizemos que os espaços vetoriais \(V\) e \(W\) são isomorfos.

Convém aqui enfatizar, apesar da repetição, alguns pontos importantes. Espaços isomorfos tem a mesma dimensão: como \(T\) é injetora temos que \(\dim \text{Nuc } (T) = 0\) e \(\dim \text{Im} (T) = \dim V\). Mas \(T\) é também sobrejetora, o que significa que sua imagem cobre todo o espaço \(W\), \(\text{Im} (T) = W\) logo \(\dim W = \dim V\). Além disto um isomorfismo leva bases de \(V\) em bases de \(W\). Como existe uma correspondência biunívoca entre vetores dos dois espaços e todos os vetores de \(W\) correspondem a algum vetor de \(V\), então é possível encontrar a aplicação inversa \(T^{-1} : W \rightarrow V\) e ela é também um isomorfismo.

Exemplo . Seja \(T : \mathbb{R}^3 \rightarrow \mathbb{R}^3\) dada por \(T (x, y, z) = (x – 2 y, z, x + y)\). Vamos mostrar que \(T\) é um isomorfismo e encontrar sua inversa, \(T^{-1}\).

Pelo corolário, como a dimensão do espaço de partida e de chegada são as mesmas (pois são o mesmo espaço) se \(T\) é injetora então \(\dim \text{Nuc }(T)=0\) e \(\dim \text{Im}(T)=3\), o que significa que a imagem é o próprio \(\mathbb{R}^3\) (\( T\) é sobrejetora). Basta portanto verificar que a transformação é injetora. Para isto procuramos pelo núcleo de \(T\),
$$ \text{Nuc } (T) = \{(x, y, z) ; T (x, y, z) = 0\}$$
o que significa que vetores do núcleo devem satisfazer
$$ (x – 2 y, z, x + y) = 0 \Rightarrow \left\{ \begin{array}{r}
x – 2 y = 0\\
z = 0\\
x + y = 0
\end{array} \Rightarrow (x, y, z) = (0, 0, 0) . \right. $$

Como \(\text{Nuc } (T) = \{0\}\), \(T\) é injetora e, sendo sobrejetora, é um isomorfismo e existe a transformação inversa. Para achar a transformação inversa encontramos sua ação sobre 3 vetores l.i. de \(\mathbb{R}^3\). Em geral é mais simples usar a base canônica, embora qualquer base possa ser usada. Listamos abaixo a ação da transformação sobre a base canonônica e a ação de sua inversa sobre os vetores:
$$ \left\{ \begin{array}{rr}
T (1, 0, 0) = & (1, 0, 1) \\
T (0, 1, 0) = & (- 2, 0, 1) \\
T (0, 0, 1) = & (0, 1, 0)
\end{array} \right. \Rightarrow \left\{ \begin{array}{rr}
T^{-1} (1, 0, 1) = & (1, 0, 0), \\
T^{-1} (- 2, 0, 1) = & (0, 1, 0), \\
T^{-1} (0, 1, 0) = & (0, 0, 1).
\end{array} \right.
$$

Sabemos que \(\{(1, 0, 1), (- 2, 0, 1), (0, 1, 0) \}\) é uma base de \(\mathbb{R}^3\) pois isomorfismos transformam bases em bases. Qualquer vetor deste espaço pode ser escrito nesta base como
$$ (x, y, z) = a (1, 0, 1) + b (- 2, 0, 1) + c (0, 1, 0) $$

o que representa o sistema listado abaixo, com sua solução,
$$ \left. \begin{array}{r}
x = a – 2 b\\
y = c\\
z = a + b
\end{array} \;\;\right\} \Rightarrow \begin{array}{l}
a = \frac{1}{3} (x + 2 z),\\
b = \frac{1}{3} (z – x),\\
c = y.
\end{array}
$$

Podemos escrever qualquer vetor de \(\mathbb{R}^3\) nesta base como
$$(x,y,z)=\frac{1}{3} (x + 2 z) (1, 0, 1) + \frac{1}{3} (z – x) (- 2, 0, 1) + y (0, 1, 0) $$

enquanto a ação de \(T^{-1}\) sobre este vetor arbitrário é
$$ T^{-1} (x, y, z) = \frac{1}{3} (x + 2 z) T^{-1} (1, 0, 1) + \frac{1}{3} (z – x) T^{-1} (- 2, 0, 1) + yT^{-1} (0, 1, 0), $$

onde usamos o fato de que \(T\) é linear. Já conhecemos o efeito de \( T^{-1}\) sobre os vetores envolvidos, portanto encontramos **
$$ \begin{array}{rl}
T^{-1}(x, y, z)= & \frac{1}{3}(x + 2 z)(1, 0, 0)+\frac{1}{3}(z-x) (0, 1, 0)+y (0, 0, 1)= \\
& \left(\frac{x + 2 z}{3},\frac{z – x}{3}, y \right).
\end{array} $$

Esta é a transformação inversa procurada.

Segue um resumo dos resultados sobre as transformações lineares

• Uma transformação \(T : V \rightarrow W\) é linear se \(T (\alpha u + \beta v) = \alpha T (u) + \beta T (v)\)

• A transformação fica totalmente determinada por meio de sua ação sobre uma base de \(V\).

• Def.: \(\text{Im} (T) = T (V) ; \text{Nuc } (T) = \{v \in V ; T (v) = 0_W \}\).

• \(T\) é injetora se \(T (u) = T (v) \Rightarrow u = v\), ou, se \(u \neq v \Rightarrow T (u) \neq T (v)\).

• \(T\) é sobrejetora se \(\text{Im} (T) = W\). Se \(T\) é injetora e sobre então é um isomorfismo.

• \(T\) linear é injetora \( \Leftrightarrow \text{Nuc } (T) = \{0_V \}\).

• \(\dim \text{Nuc } (T) + \dim \text{Im} (T) = \dim V\).

• Se \(\dim V = \dim W\), T é injetora \(\Leftrightarrow T\) é sobrejetora.

• \(T\) injetora: Se \(\dim V = \dim W\) então \(T\) leva bases de \(V\) em bases de \(W\).

• Se \(T\) é um isomorfismo então \(\exists \; T^{-1} : W \rightarrow V\), (existe a inversa de \(T\) ).