Prévia do material em texto
Autor: Café com leite
Pseudo-inversa
𝐴+ = (𝐴∗𝐴)−1𝐴∗
𝐴+ = 𝐴∗(𝐴𝐴∗)−1
𝐴+ = (𝐴)−1
Primeiramente, quem é a transformada? Se você tem um sistema de equações, monte-
o primeiro em forma de matriz, da forma que fica [A][x] = [b], uma matriz pra A, uma para x e
outra para b. Exemplo, uma transformada A: R3 R2, A (x,y,z): (2x-y+z, -x+2y+z)
Isso é uma transformada que leva vetores do R3, ou seja (x,y,z), para dois, tipo um (a,b)
que nesse caso é (2x-y+z, -x+2y+z). Vamos escrever essa transformada em forma de matriz.
Teremos:
2 −1 1
−1 2 1
𝑥
𝑦
𝑧
= b , b é o vetor resposta
Agora já sabemos qual a matriz da nossa transformada [A], que usaremos mais tarde.
Para definir a pseudo-inversa dessa transformada, de acordo com as fórmulas dadas acima
temos que verificar se ela é injetiva ou sobrejetiva, pois para cada um destes há uma maneira
de resolver. Começaremos a avaliar se ela é injetiva.
Injetiva
Para uma transformada ser injetiva seu núcleo deve ser formado APENAS, SÓ,
SOMENTE, pelo vetor nulo. E como ver isso? Pega-se a transformada, [A][x] = [b] e é preciso
descobrir quais vetores levam a matriz de [A] à uma matriz nula (só copiei do caderno pra ficar
bonito, hihi). Traduzindo, vai pegar o [A][x] e igualar a zero, simplesmente [A][x] = [0] e
descobrir para quais [x]’s isso existe. Vou te explicar como acho mais fácil que é por matriz.
2 −1 1
−1 2 1
𝑥
𝑦
𝑧
=
0
0
Se a transformada for injetiva
Se a transformada for sobrejetiva
A x = b
0
Se a transformada for injetiva e
sobrejetiva (invertível). É apenas a
inversa
Autor: Café com leite
Porque a matriz de [b] ficou apenas com 2 zeros se tenho 3 icognitas? Por que a
transformada está no R2 e como saber disso? O problema define no começo da questão A:
R3 R2 (que 3 “valores” virarão 2 valores)
2 −1 1
−1 2 1
0
0
=
𝑥
𝑦
𝑧
2 −1 1
0 3 3
0
0
=
𝑥
𝑦
𝑧
Na linha 2 teremos: 0x +3y +3z = 0 então y=-z.
Na linha 1 teremos: 2x –y +z = 0, como y=-z 2x + 2z = 0, então x= -z
Isso tudo pra falar que o núcleo é formado pelo conjunto de pontos que obedecem a
relação x=y=-z. Se x= a, daí o vetor nulo seria a = a = -a. Essa forma de escrever em forma de
“a” é só bonitinha. Formalmente falamos assim N(A) = {(a, a, -a), a ∈ R}
Como o núcleo ficou escrito em função de uma variável só, então a dimensão dele é 1, dim
N(A) =1. Se você tivesse achado que x = y= z = 0, isso significa que a dim N(A) = 0.
E pra que achar a dimensão da imagem? Uma transformada SÓ é INJETIVA, se dim N(A)
= 0, SOMENTE! Nesse caso ela é diferente de 1, então ela é o que? Nada que tenha nome, só
nos interessa até esse ponto saber se ela é injetiva ou não. Como ela não é injetiva, para
calcular a pseudo-inversa temos que saber se ela é sobrejetiva.
Sobrejetiva
Para ser sobrejetiva a dim Im = dim F, só é sobrejetiva se isso ocorrer. Só, somente!
Primeiramente, quem é F, é o espaço para onde a transformada está indo. E como eu vejo a
dimensão dele? Por essa definição inicial A: R3 R2, o espaço que ele está indo é o R2 , e a
dimensão dele é o coeficiente, logo a dim F= 2, o espaço de onde ele está vindo é E, a dimensão
de dim E = 3 (apenas por curiosidade nesse momento). Voltando ao que interessa, a dim F =
2, agora temos que saber a dim da Imagem para verificar se a transformada é sobrejetiva.
Dimensão da Imagem:
Temos duas formas de ver a dimensão da imagem, ou podemos fazer as duas para
comprovar que dão a mesma coisa, ou provar que é verdadeira e tal.
Método 1: Se já sabemos a dimensão do núcleo podemos aplicar o “Teorema do
Núcleo e Imagem” que nos diz: dim N(A) + dim Im(A) = dim E
L2=(2*L2) – L1
Autor: Café com leite
A dimensão do núcleo definimos lá em cima, que era dim N(A) =1, e a dimensão de E
comentamos no parágrafo acima que é dim E = 3.
dim N(A) 1 + dim Im(A) = dim E 3, então dim Im(A) = 2
A condição para TL ser sobrejetiva que definimos é: dim Im = dim F, a dim F achamos no
primeiro parágrafo desse tópico que é 2, e acabamos de achar que a dim Im(A) =2, logo essa
condição de dim Im = dim F está satisfeita. Então a TL é sobrejetiva.
Método 2: Definimos base canônicas de E, aplicamos a transformada e teremos a base
da Im. A transformada irá levar de R3 R2, então definiremos 3 vetores canônicos de E, 3 pois
é R³.
Base: e1, e2, e3
- e1: (1,0,0)
- e2: (0,1,0)
- e3: (0,0,1)
A matriz do conjunto dessas transformadas é [A] = [Ae1, Ae2, Ae3]. Essa matriz é a base da
Im(A)
[A]=
2 −1 1
−1 2 1
Recapitulando, vimos que para calcular a pseudo-inversa temos duas formas, uma caso a
transformada seja injetiva e outra para sobrejetiva. Para verificar se ela é injetiva temos que
achar a dimensão do núcleo, e só será injetiva caso dim N(A) = 0, como no exemplo a dim N(A)
= 1, então ela não é injetiva. Agora temos que verificar se ela é sobrejetiva, para isso a dim Im
= dim F, a dim F é definida no começo do problema quando sabemos de onde vem para onde
vai, que é o E → F, os coeficientes em cima de cada R. E a dimensão da Im pode ser definida
Aplicando a
transformada em cada vetor.
Faremos Ae1, Ae2, A3
A: R3 R2, A (x,y,z): (2x-y+z, -x+2y+z)
Ae1= A(1,0,0) = (2-0+0, -1,0,0) = (2,-1)
Ae2= A(0,1,0) = (0-1+0, -0,2,0) = (-1,2)
Ae3= A(0,0,1) = (0-0+1, -0,0,1) = (1,1)
Podemos observar que uma das colunas pode ser escrita como
combinação das outras duas. Ex.: A coluna Ae1 = Ae3 – Ae2.
Apenas conseguimos escrever uma das colunas em função das
outras duas. Desta forma as duas que fazem essa combinação geram
duas bases LI, no exemplo dado, Ae3 e Ae2 são LI, então a dim Im(A) =
2, o que confirma o “Teorema do núcleo e imagem”.
Autor: Café com leite
pelo Teorema do Núcleo e Imagem, caso saibamos a dim N(A) ou montando uma base e vendo
se todos os vetores são LI. Verificamos que no exemplo é uma TL sobrejetiva. Então, para
calcular a pseudo-invesa seguiremos o caminho a seguir:
𝐴+ = 𝐴∗(𝐴𝐴∗)−1
Primeiramente,
𝐴∗= [A]T, que é mudar linhas para colunas: linha 1 vira coluna 1, linha 2 vira
coluna 2, ... linha n vira coluna n;
Inversa: A-1: O modo que eu acho mais fácil [A][A]-1 = [I] (lendo: a matriz A, vezes
a matriz inversa de A é igual a matriz identidade);
Matriz identidade: Matriz toda zerada, exceto a diagonal principal que é 1 em
todos as posições.
A* = AT:
[A] =
2 −1 1
−1 2 1
[A]T =
2 −1
−1 2
1 1
AA* = [A]x[A*] = [A]x[AT]
2 −1 1
−1 2 1
x
2 −1
−1 2
1 1
=
2𝑥2 + (−1)𝑥(−1) + 1𝑥1 2𝑥(−1) + (−1)𝑥2 + 1𝑥1
(−1)𝑥2 + 2𝑥(−1) + 1𝑥1 2𝑥(−1) + 2𝑥(−1) + 1𝑥1
=
6 −3
−3 6
(𝐀𝐀∗)−𝟏 : O modo que eu acho mais fácil [A][A]-1 = [I] (lendo: a matriz A, vezes a matriz
inversa de A é igual a matriz identidade)
[AA*] x [AA*]-1 = I
6 −3
−3 6
X
𝑎 𝑏
𝑐 𝑑
=
1 0
0 1
6𝑎 − 3𝑐 6𝑏 − 3𝑑
−3𝑎 + 6𝑐 −3𝑏 + 6𝑑
=
1 0
0 1
, caímos em um sistema:
[AA*] x [AA*]-1 = I
Como queremos achar [AA*]-1, então temos que achar os
valores de a, b, c e d.
Autor: Café com leite
6𝑎 − 3𝑐 = 1
6𝑏 − 3𝑑 = 0
−3𝑎 + 6𝑐 = 0
−3𝑏 + 6𝑑 = 1
Resolvendo:
𝑎 = 2/9
𝑏 = 1/9
𝑐 = 1/9
𝑑 = 2/9
𝑎𝑏
𝑐 𝑑
= [AA*]-1 =
2/9 1/9
1/9 2/9
=
2 1
1 2
1
9
Relembrando 𝐴+ = 𝐴∗(𝐴𝐴∗)−1
[A+] =
2 −1
−1 2
1 1
2 1
1 2
1
9
=
2𝑥2 + −1𝑥1 2𝑥1 + (−1)𝑥2
(−1)𝑥2 + 2𝑥2 (−1)𝑥1 + 2𝑥2
1𝑥2 + 1𝑥1 1𝑥1 + 1𝑥2
1
9
=
3 0
0 3
3 3
1
9
=
1/3 0
0 1/3
1/3 1/3
Pronto, achamos a pseudo-inversa.