Introdução
Dada uma transformação linear \(T : V \rightarrow V\) buscamos descobrir quais são os vetores fixos de \(V\) sob esta transformação, ou seja, que vetores satisfazem a expressão \(T (v) = v\). Em seguida procuraremos quais são as direções fixas ou invariantes sob esta transformação, sendo estas as direções dos vetores \(v\) que satisfazem a expressão \(T (v) = \lambda v\), \(\lambda\) um escalar. No primeiro caso dizemos que \(v\) fica invariante sob \(T\) ; no segundo caso a direção de \(v\) é invariante.
Exemplo 1. Considere as transformações
$$
\begin{array}{r}
I : \mathbb{R}^2 \rightarrow \mathbb{R}^2\\
v \mapsto v
\end{array} \begin{array}{r}
N : \mathbb{R}^2 \rightarrow \mathbb{R}^2\\
(x, y) \mapsto (0, 0)
\end{array} \begin{array}{r}
r_x : \mathbb{R}^2 \rightarrow \mathbb{R}^2\\
(x, y) \mapsto (x, – y)
\end{array}
$$
A primeira delas é a identidade que deixa todos os vetores fixos. O plano \(\mathbb{R}^2\) é invariante sob esta transformação. A segunda é a aplicação nula, que só deixa invariante o próprio vetor nulo, a oriegm de de \(\mathbb{R}^2\). A terceira transformação consiste em uma reflexão em torno do eixo \(\mathcal{O}x\). Não é difícil perceber que todos os vetores da forma \((x, 0)\) são fixos pois \(r_x (x, 0) = (x, 0)\). Isto significa que o eixo \(\mathcal{O}x\) é refletido nele mesmo. Para verificar se existem outros vetores fixos vamos procurar soluções da equação \(r_x (x, y) = (x, y)\) ou, em forma matricial,
$$
\left. \left[ \begin{array}{rr}
1 & 0\\
0 & – 1
\end{array} \right] \left[ \begin{array}{r}
x\\
y
\end{array} \right] = \left[ \begin{array}{r}
x\\
y
\end{array} \right] \Rightarrow \begin{array}{r}
x = x\\
y = – y
\end{array} \right\} \Rightarrow y = 0.
$$
Portanto os vetores \((x, 0)\) são os únicos deixados fixos por esta reflexão.
Queremos agora encontrar direções fixas. Sempre que não houver ambiguidade na notação entre transformações e vetores omitiremos os parênteses. Na expressão
$$ T \mathbf{v} = \lambda \mathbf{v} $$
dizemos que \(\mathbf{v}\) é um autovetor de \(T\), e \(\lambda \) é um autovalor de \(T\).
Observe que o vetor nulo \(\mathbf{0} \in V\) sempre é um autovetor de qualquer transformação linear correspondendo ao autovalor nulo. Procuramos autovetores não-nulos, também chamados de não triviais.
Exemplo 2. Vamos encontrar os autovetores e autovalores da reflexão em \(\mathbb{R}^2, r_x (x, y) = (x, – y)\). A equação de autovalores é
$$ r_x (x, y) = \lambda (x, y) \Rightarrow (x, – y) = \lambda (x, y) $$
que corresponde ao seguinte sistema e sua solução
$$
\left\{ \begin{array}{r}
x = \lambda x\\
– y = \lambda y
\end{array} \Rightarrow \left\{ \begin{array}{r}
\lambda = 1, y = 0 \;\;\text{ e }\;\; x \;\;\text{ qualquer, }\;\; \\
\lambda = – 1, x = 0 \;\;\text{ e } y \;\; \text{ qualquer.}
\end{array} \right. \right.
$$
Descobrimos portanto que, \(\lambda = 1\) é um autovalor, correspondente aos autovetores \((x, 0)\), enquanto \(\lambda = – 1\) é outro autovalor, correspondente aos autovetores \((0, y)\). Isto está correto pois, como podemos verificar diretamente,
$$ r_x (x, 0) = 1 (x, 0) ; r_x (0, y) = (0, – y) = – 1 (0, y). $$
O procedimento de busca de autovetores e autovalores é muito importante em diversas aplicações à engenharia, física, computação e outras áreas, e uma técnica mais eficaz foi desenvolvida para isto.
Para entender este procedimento vamos encontrar autovetores e autovalores da mesma reflexão em \(\mathbb{R}^2, r_x (x, y) = (x, – y)\). Escrevemos a transformação em forma matricial,
$$
r_x \left[ \begin{array}{r}
x\\
y
\end{array} \right] = \left[ \begin{array}{rr}
1 & 0\\
0 & – 1
\end{array} \right] \left[ \begin{array}{r}
x\\
y
\end{array} \right] = \left[ \begin{array}{r}
x\\
– y
\end{array} \right].
$$
Com isto a equação de autovetores fica
$$
\left[ \begin{array}{rr}
1 & 0\\
0 & – 1
\end{array} \right] \left[ \begin{array}{r}
x\\
y
\end{array} \right] = \lambda \left[ \begin{array}{r}
x\\
y
\end{array} \right] \Rightarrow \left( \left[ \begin{array}{rr}
1 & 0\\
0 & – 1
\end{array} \right] – \lambda \mathbb{I} \right) \left[ \begin{array}{r}
x\\
y
\end{array} \right] = 0,
$$
onde a identidade \(2 \times 2\) foi inserida para deixar o vetor das incógnitas em evidência. A operação dentro de parênteses pode ser efetuada e o sistema de devemos resolver é
$$
\left[ \begin{array}{rr}
1 – \lambda & 0\\
0 & – 1 – \lambda
\end{array} \right] \left[ \begin{array}{r}
x\\
y
\end{array} \right] = 0.
$$
Para que exista uma solução não trivial para este sistema é necessário que o determinante da primeira matriz seja nulo (ou seja, que ela seja não invertível),
$$
\det \left[ \begin{array}{rr}
1 – \lambda & 0\\
0 & – 1 – \lambda
\end{array} \right] = 0 \Rightarrow (1 – \lambda) (- 1 – \lambda) = 0.
$$
A solução do polinômio acima fornece os autovalores procurados, \(\lambda = 1\) e \(\lambda = – 1\). De posse dos autovalores retornamos à equação (1) para encontrar os autovetores: Se \(\lambda = 1\) temos
$$
\left[ \begin{array}{rr}
0 & 0\\
0 & – 2
\end{array} \right] \left[ \begin{array}{r}
x\\
y
\end{array} \right] = 0 \Rightarrow y = 0, x \;\; \text{qualquer} .
$$
Se \(\lambda = – 1\) temos
$$
\left[ \begin{array}{rr}
– 2 & 0\\
0 & 0
\end{array} \right] \left[ \begin{array}{r}
x\\
y
\end{array} \right] = 0 \Rightarrow x = 0, y \;\; \text{qualquer} .
$$
Chegamos ao resultado já obtido: \(\lambda = 1\) é autovalor correspondente aos autovetores \((x, 0)\), enquanto \(\lambda = – 1\) é autovalor correspondente aos autovetores \((0, y)\).
Recapitulando a situação: Para toda matriz quadrada \(A\) a condição \(A \mathbf{v} = 0\) (eq. *) sempre pode ser conseguida com o vetor \(\mathbf{v} = 0\), a chamada solução trivial. Além disso, se \(A\) é invertível, multiplicamos a equação * por sua inversa para verificar que \(A^{-1} A \mathbf{v} = 0 \Rightarrow \mathbf{v} = 0\), o que significa que a solução trivial é a única solução. Portanto, para que existam outras soluções que não a trivial é necessário que \(\det A = 0\). No problema de autovetores e autovalores a exigência de que \(\det (A – \lambda \mathbb{I}) = 0\) resulta em um polinômio de grau \(n\) chamado de polinômio característico.
Generalizando este procedimento, para resolver a equação de autovetores \(T \mathbf{v} = \lambda \mathbf{v}\) fazemos o seguinte:
- encontramos a matriz \(A_{n \times n}\) associada à transformação \(T\),
- escrevemos \(A \mathbf{v} = \lambda \mathbf{v}\) como \((A – \lambda \mathbb{I}) \mathbf{v} = 0\),
- encontramos as raízes \(\lambda_1, \ldots, \lambda_n\) do polinômio característico \(det(A – \lambda \mathbb{I})=0\). \(\lambda_i\) são os autovalores.
- para cada autovalor \(\lambda_k\) encontramos o autovetor que satisfaz a expressão \((A – \lambda_k \mathbb{I}) \mathbf{v}_k = 0\).
Exemplo 3. Vamos encontrar autovetores e autovalores da transformação \(R : \mathbb{R}^2 \rightarrow \mathbb{R}^2\), dada por \((x, y) \mapsto (- y, x)\), que consiste em uma rotação de \(90^o\) em torno da origem, sentido antihorário. Em notação,
$$
R \left[ \begin{array}{r}
x\\
y
\end{array} \right] = \left[ \begin{array}{rr}
0 & – 1\\
1 & 0
\end{array} \right] \left[ \begin{array}{r}
x\\
y
\end{array} \right] = \left[ \begin{array}{r}
– y\\
x
\end{array} \right].
$$
A equação de autovetores é
$$
\left[ \begin{array}{rr}
0 & – 1\\
1 & 0
\end{array} \right] \left[ \begin{array}{r}
x\\
y
\end{array} \right] = \lambda \left[ \begin{array}{r}
x\\
y
\end{array} \right] \Rightarrow \left( \left[ \begin{array}{rr}
0 & – 1\\
1 & 0
\end{array} \right] – \lambda \mathbb{I} \right) \left[ \begin{array}{r}
x\\
y
\end{array} \right] = 0.
$$
A matriz entre parênteses tem determinante que não se anula para [/latex] \lambda[/latex] real, pois
$$
\det \left[ \begin{array}{rr}
– \lambda & – 1\\
1 & – \lambda
\end{array} \right] = 0 \Rightarrow \lambda^2 + 1 = 0.
$$
Portanto esta equação de autovetores não admite solução para autovalores reais. (Ela pode ser resolvida, no entanto, para autovalores complexos.)
Exemplo 4. Vamos encontrar autovetores e autovalores da matriz
$$
A = \left[ \begin{array}{rr}
2 & 2\\
0 & 1
\end{array} \right].
$$
A equação de autovetores é
$$
\left[ \begin{array}{rr}
2 & 2\\
0 & 1
\end{array} \right] \left[ \begin{array}{r}
x\\
y
\end{array} \right] = \lambda \left[ \begin{array}{r}
x\\
y
\end{array} \right] \Rightarrow \left( \left[ \begin{array}{rr}
2 & 2\\
0 & 1
\end{array} \right] – \lambda \left[ \begin{array}{rr}
1 & 0\\
0 & 1
\end{array} \right] \right) \left[ \begin{array}{r}
x\\
y
\end{array} \right] = \left[ \begin{array}{rr}
2 – \lambda & 2\\
0 & 1 – \lambda
\end{array} \right] \left[ \begin{array}{r}
x\\
y
\end{array} \right] = 0.
$$
Para que existam soluções não triviais é necessário que
$$
\det \left[ \begin{array}{rr}
2 – \lambda & 2\\
0 & 1 – \lambda
\end{array} \right] = 0,
$$
de onde obtemos o polinômio característico e suas raízes,
$$ (2 – \lambda) (1 – \lambda) = 0 \Rightarrow \lambda_1 = 1 ; \lambda_2 = 2. $$
Para \(\lambda_1 = 1\) temos
$$
\left[ \begin{array}{rr}
1 & 2\\
0 & 0
\end{array} \right] \left[ \begin{array}{r}
x\\
y
\end{array} \right] = 0 \Rightarrow x + 2 y = 0 \Rightarrow y = –
\frac{x}{2},
$$
e os autovetores correspondentes são \(\mathbf{v}_1 = (x, – x / 2)\). Para
[/latex] \lambda_2 = 2[/latex] temos
$$
\left[ \begin{array}{rr}
0 & 2\\
0 & – 1
\end{array} \right] \left[ \begin{array}{r}
x\\
y
\end{array} \right] = 0 \Rightarrow y = 0
$$
e os autovetores correspondentes são \(\mathbf{v}_2 = (x, 0)\). De fato, observamos que
$$
A \mathbf{v}_1 = \left[ \begin{array}{rr}
2 & 2\\
0 & 1
\end{array} \right] \left[ \begin{array}{r}
x\\
– x / 2
\end{array} \right] = \left[ \begin{array}{r}
x\\
– x / 2
\end{array} \right] = \lambda_1 \mathbf{v}_1,
$$
$$
A \mathbf{v}_2 = \left[ \begin{array}{rr}
2 & 2\\
0 & 1
\end{array} \right] \left[ \begin{array}{r}
x\\
0
\end{array} \right] = 2 \left[ \begin{array}{r}
x\\
0
\end{array} \right] = \lambda_2 \mathbf{v}_2 .
$$
Teorema: Se \(T : V \rightarrow V\) é uma transformação linear e \(\mathbf{v} \in V\) um autovetor associado ao autovalor \(\lambda\) então \(\mathbf{w} = \rho \mathbf{v}\) onde \(\rho \in \mathbb{R}\) (um escalar), também é um autovetor associado à mesmo autovalor \(\lambda\).
Demonstração: Se \(T (\mathbf{v}) = \lambda \mathbf{v}\) então
$$ T (\mathbf{w}) = T (\rho \mathbf{v}) = \rho T (\mathbf{v}) = \rho \lambda \mathbf{v} = \lambda (\rho \mathbf{v}) = \lambda \mathbf{w}. $$
Este teorema signica que a equação de autovetores permite, como proposto no início desta seção, encontrar apenas direções. Qualquer vetor com a mesma direção de um autovetor é também autovetor, correspondendo ao mesmo autovalor. Observe que em todos os exemplos resolvidos, para cada autovalor, encontramos infinitos autovetores correspondentes. Em algumas aplicações se busca encontrar autovetores \(v\) normalizadas (ou seja \(|v| = 1\) ). Com esta exigência encontramos um número finito de soluções, desde que \(V\) seja finito.
Definição: Dada a transformação linear \(T : V \rightarrow V\) o subespaço \(V_{\lambda} = \{ \mathbf{v} \in V ; T (\mathbf{v}) = \lambda \mathbf{v} \}\) é denominado subespaço associado ao autovalor \(\lambda . V_{\lambda} \) é, portanto, o conjunto dos autovetores de \(T\) correspondentes ao mesmo autovalor \(\lambda\).
Exercício: Lembrando que \(\mathbf{0} \in V_{\lambda}\), o vetor nulo, mostre que \(V_{\lambda}\) é um subespaço vetorial de \(V\).