Esta é uma pré-visualização de arquivo. Entre para ver o arquivo original
Cálculo Numérico José Alberto Cuminato ICMC/USP Suma´rio 1 Conceitos Ba´sicos 1 1.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 Espac¸o Vetorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.3 Processo de Gram-Schmidt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.4 Projec¸a˜o Ortogonal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.5 Auto-Valores e Auto-Vetores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 1.6 Exerc´ıcios Complementares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 2 Ana´lise de Arredondamento em Ponto Flutuante 32 2.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 2.2 Sistema de Nu´meros Discreto no Computador . . . . . . . . . . . . . . . . . . . . . . . . . 32 2.3 Representac¸a˜o de Nu´meros no Sistema F (β, t,m,M) . . . . . . . . . . . . . . . . . . . . . 37 2.4 Operac¸o˜es Aritme´ticas em Ponto Flutuante . . . . . . . . . . . . . . . . . . . . . . . . . . 40 2.5 Efeitos Nume´ricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 2.5.1 Cancelamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 2.5.2 Propagac¸a˜o do erro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 2.5.3 Instabilidade Nume´rica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 2.5.4 Mal Condicionamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 2.6 Exerc´ıcios Complementares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 3 Equac¸o˜es na˜o Lineares 55 3.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 3.2 Iterac¸a˜o Linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 3.3 Me´todo de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 3.4 Me´todo das Secantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 3.5 Me´todo Regula Falsi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 3.6 Sistemas de Equac¸o˜es na˜o Lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 3.6.1 Iterac¸a˜o Linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 3.6.2 Me´todo de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79 3.7 Equac¸o˜es Polinomiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 3.7.1 Determinac¸a˜o de Ra´ızes Reais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 3.7.2 Determinac¸a˜o de Ra´ızes Complexas . . . . . . . . . . . . . . . . . . . . . . . . . . 86 3.7.3 Algoritmo Quociente-Diferenc¸a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91 3.8 Exerc´ıcios Complementares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 3.9 Problemas Aplicados e Projetos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 i 4 Soluc¸a˜o de Sistemas Lineares: Me´todos Exatos 108 4.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108 4.2 Decomposic¸a˜o LU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 4.3 Me´todo de Eliminac¸a˜o de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 4.4 Me´todo de Gauss-Compacto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 4.5 Me´todo de Cholesky . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 4.6 Me´todo de Eliminac¸a˜o de Gauss com Pivotamento Parcial . . . . . . . . . . . . . . . . . . 135 4.7 Refinamento da Soluc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 137 4.8 Mal Condicionamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 4.9 Ca´lculo da Matriz Inversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 4.10 Exerc´ıcios Complementares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 4.11 Problemas Aplicados e Projetos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 5 Soluc¸a˜o de Sistemas Lineares: Me´todos Iterativos 156 5.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 5.2 Processos Estaciona´rios. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 5.2.1 Me´todo de Jacobi-Richardson . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158 5.2.2 Me´todo de Gauss-Seidel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 5.3 Processos de Relaxac¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 5.3.1 Pr´ıncipios Ba´sicos do Processo de Relaxac¸a˜o . . . . . . . . . . . . . . . . . . . . . 171 5.3.2 Me´todo dos Gradientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 5.3.3 Me´todo dos Gradientes Conjugados . . . . . . . . . . . . . . . . . . . . . . . . . . 176 5.4 Exerc´ıcios Complementares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 5.5 Problemas Aplicados e Projetos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 185 6 Programac¸a˜o Matema´tica 191 6.1 Espac¸o Vetorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191 7 Determinac¸a˜o Nume´rica de Auto-Valores e Auto-Vetores 192 7.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192 7.2 Me´todo de Leverrier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194 7.3 Me´todo de Leverrier-Faddeev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195 7.4 Me´todo das Poteˆncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201 7.4.1 Me´todo da Poteˆncia Inversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205 7.4.2 Me´todo das Poteˆncias com Deslocamento . . . . . . . . . . . . . . . . . . . . . . . 207 7.5 Auto-Valores de Matrizes Sime´tricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211 7.5.1 Me´todo Cla´ssico de Jacobi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213 7.5.2 Me´todo C´ıclico de Jacobi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218 7.6 Me´todo de Rutishauser (ou Me´todo LR) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 220 7.7 Me´todo de Francis (ou Me´todo QR) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 7.8 Exerc´ıcios Complementares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227 7.9 Problemas Aplicados e Projetos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230 8 Aproximac¸a˜o de Func¸o˜es: Me´todo dos Mı´nimos Quadrados 234 8.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234 8.2 Aproximac¸a˜o Polinomial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235 8.2.1 Caso Cont´ınuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235 8.2.2 Caso Discreto: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241 8.2.3 Erro de Truncamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245 8.3 Aproximac¸a˜o Trigonome´trica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246 ii 8.3.1 Caso Cont´ınuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246 8.3.2 Caso Discreto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250 8.4 Outros Tipos de Aproximac¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252 8.5 Sistemas Lineares Incompat´ıveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262 8.6 Exerc´ıcios Complementares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265 8.7 Problemas Aplicados e Projetos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268 9 Programac¸a˜o na˜o Linear 279 10 Aproximac¸a˜o de Func¸o˜es: Me´todos de Interpolac¸a˜o Polinomial 280 10.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280 10.2 Polinoˆmio de Interpolac¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280 10.3 Fo´rmula de Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283 10.4 Erro na Interpolac¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287 10.5 Interpolac¸a˜o Linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290 10.6 Fo´rmula para Pontos Igualmente Espac¸ados . . . . . . . . . . . . . . . . . . . . . . . . . . 292 10.7 Outras Formas do Polinoˆmio de Interpolac¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . 296 10.7.1 Diferenc¸a Dividida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 297 10.7.2 Ca´lculo Sistema´tico das Diferenc¸as Divididas. . . . . . . . . . . . . . . . . . . . . . 297 10.7.3 Alguns Resultados sobre Diferenc¸as Divididas . . . . . . . . . . . . . . . . . . . . . 299 10.7.4 Fo´rmula de Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299 10.7.5 Diferenc¸as Ordina´rias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306 10.7.6 Ca´lculo Sistema´tico das Diferenc¸as Ordina´rias . . . . . . . . . . . . . . . . . . . . . 307 10.7.7 Fo´rmula de Newton-Gregory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 310 10.8 Exerc´ıcios Complementares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 312 10.9 Problemas Aplicados e Projetos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316 11 Integrac¸a˜o Nume´rica 321 11.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321 11.2 Fo´rmulas de quadratura interpolato´ria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322 11.2.1 Fo´rmulas de Newton-Cotes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325 11.2.2 Erro nas Fo´rmulas de Newton-Cotes . . . . . . . . . . . . . . . . . . . . . . . . . . 335 11.3 Polinoˆmios Ortogonais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340 11.3.1 Principais Polinoˆmios Ortogonais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 342 11.3.2 Propriedades dos Polinoˆmios Ortogonais . . . . . . . . . . . . . . . . . . . . . . . . 344 11.4 Fo´rmulas de Quadratura de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 348 11.4.1 Fo´rmula de Gauss-Legendre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 351 11.4.2 Fo´rmula de Gauss-Tchebyshev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353 11.4.3 Fo´rmula de Gauss-Laguerre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 355 11.4.4 Fo´rmula de Gauss-Hermite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356 11.5 Erro nas Fo´rmulas de Gauss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 357 11.6 Exerc´ıcios Complementares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 361 11.7 Problemas Aplicados e Projetos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 366 12 Soluc¸a˜o Nume´rica de Equac¸o˜es Diferenciais Ordina´rias 379 12.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 379 12.2 Me´todo de Taylor de Ordem q . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 380 12.3 Me´todos Lineares de Passo Mu´ltiplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383 12.3.1 Obtidos do Desenvolvimento de Taylor . . . . . . . . . . . . . . . . . . . . . . . . 384 12.3.2 Obtidos de Integrac¸a˜o Nume´rica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 386 iii 12.3.3 Ordem e Constante do Erro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 389 12.3.4 Erro de Truncamento Local . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 391 12.3.5 Consisteˆncia e Estabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393 12.3.6 Convergeˆncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 394 12.4 Me´todos do Tipo Previsor - Corretor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 397 12.4.1 Erro de Truncamento Local . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 399 12.5 Me´todo Geral Expl´ıcito de 1-passo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401 12.5.1 Ordem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401 12.5.2 Consisteˆncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401 12.5.3 Convergeˆncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 402 12.5.4 Me´todos de Runge-Kutta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 403 12.6 Sistemas de Equac¸o˜es e Equac¸o˜es de Ordem Elevada . . . . . . . . . . . . . . . . . . . . . 412 12.6.1 Sistemas de Equac¸o˜es Diferenciais . . . . . . . . . . . . . . . . . . . . . . . . . . . 413 12.6.2 Equac¸o˜es Diferenciais de Ordem Elevada . . . . . . . . . . . . . . . . . . . . . . . 418 12.7 Exerc´ıcios Complementares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 420 12.8 Problemas Aplicados e Projetos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 423 13 Soluc¸a˜o Nume´rica de Equac¸o˜es Diferenciais Parciais 429 13.1 Introduc¸a˜o . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 429 13.2 Equac¸o˜es Parabo´licas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431 13.3 Me´todos de Diferenc¸as Finitas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 436 13.4 Problemas Na˜o Lineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 453 13.5 Equac¸o˜es Parabo´licas em Duas Dimenso˜es . . . . . . . . . . . . . . . . . . . . . . . . . . . 455 13.6 Equac¸o˜es El´ıpticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 460 13.7 Me´todos de Diferenc¸as Finitas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 462 13.8 Erro de Truncamento Local . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 465 13.9 Condic¸o˜es de Fronteira em Domı´nios Gerais . . . . . . . . . . . . . . . . . . . . . . . . . . 469 13.10Condic¸a˜o de Fronteria de Neumann . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 473 13.11Diferenc¸as Finitas em Coordenadas Polares . . . . . . . . . . . . . . . . . . . . . . . . . . 475 13.12Exerc´ıcios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 476 14 Exerc´ıcios Mistos 486 iv Cap´ıtulo 1 Conceitos Ba´sicos 1.1 Introduc¸a˜o Pretendemos neste cap´ıtulo relembrar alguns conceitos ba´sicos, que ira˜o facilitar a compreensa˜o dos me´todos nume´ricos apresentados nos pro´ximos cap´ıtulos. A maioria dos conceitos aqui apresentados sa˜o de a´lgebra linear e isso se deve ao fato de que os resultados da a´lgebra linear, em geral, e da teoria dos espac¸os vetoriais, em particular, na ana´lise nume´rica e´ ta˜o grande, que estudo pormenorizado desses assuntos cada vez mais se justifica. Assim maiores detalhes sobre os assuntos aqui abordados podem ser encontrados em livros de a´lgebra linear. Para iniciar vamos examinar dois conjuntos que certamente ja´ sa˜o conhecidos do leitor. O primeiro e´ o conjunto dos vetores da geometria, definidos atrave´s de segmentos orientados, e o outro e´ o conjunto das matrizes reais m× n. A` primeira vista pode parecer que tais conjuntos na˜o possuem nada em comum. Mas na˜o e´ bem assim conforme mostraremos a seguir. No conjunto dos vetores esta´ definida uma adic¸a˜o dotada das propriedades comutativa, associativa, ale´m da existeˆncia do elemento neutro (vetor nulo) e do oposto. Ale´m disso, podemos multiplicar um vetor por um nu´mero real. Essa multiplicac¸a˜o tem as seguintes propriedades (ja´ certamente vista por voceˆ no seu curso): α(u+ v) = αu+ αv , (α+ β)u = αu+ βu , (αβ)u = (αβu) , 1 · u = u , onde u, v sa˜o vetores e α, β sa˜o escalares quaisquer. No conjunto das matrizes tambe´m esta´ definida uma adic¸a˜o dotada tambe´m das propriedades associ- ativa, comutativa, admite elemento neutro, a matriz nula, e toda matriz tem uma oposta. Como vemos o comportamento do conjunto dos vetores e o das matrizes quanto a` adic¸a˜o e´ o mesmo. Mas na˜o param por a´ı as coincideˆncias. Pode-se tambe´m multiplicar uma matriz por um nu´mero real. Essa multiplicac¸a˜o apresenta as mesmas propriedades que as destacadas para o caso de vetor, ou seja, valem as seguintes igualdades: α(A+B) = αA+ αB , (α+ β)A = αA+ βA , (αβ)A = (αβA) , 1 ·A = A , 1 CAPI´TULO 1. CONCEITOS BA´SICOS 2 onde A, B sa˜o matrizes e α, β sa˜o escalares quaisquer. Logo o conjunto dos vetores e o das matrizes apresentam uma certa coincideˆncia estrutural no que se refere a um par importante de operac¸o˜es definidas sobre eles. Nada enta˜o mais lo´gico que estudar simultaneamente o conjunto dos vetores, das matrizes e todos os conjuntos que apresentem a mesma estrutura acima apontada. 1.2 Espac¸o Vetorial Seja E um conjunto e seja K um corpo. Suponhamos que em E esteja definida uma operac¸a˜o de adic¸a˜o: (x, y) ∈ E × E → x+ y ∈ E , e que esteja definida uma operac¸a˜o entre os elementos de K e os elementos de E (chamada multiplicac¸a˜o por escalar): (α, x) ∈ K × E → αx ∈ E . Enta˜o E e´ um K-espac¸o vetorial, em relac¸a˜o a essas operac¸o˜es, se as seguintes condic¸o˜es estiverem satisfeitas: A1) (x+ y) + z = x+ (y + z), ∀x, y, z ∈ E , A2) x+ y = y + x, ∀x, y ∈ E , A3) ∃ 0(zero) ∈ E / x+ 0 = x, ∀x ∈ E , A4) ∀x ∈ E, ∃ − x ∈ E / x+ (−x) = 0 , M1) α(x+ y) = αx+ αy, ∀α ∈ K, ∀x, y ∈ E , M2) (α+ β)x = αx+ βx, ∀α, β ∈ K, ∀x, y ∈ E , M3) (αβ)x = (αβx), ∀ α, β ∈ K, ∀x ∈ E , M4) 1 · x = x, ∀ x ∈ E . O leitor devera´ lembrar-se sempre de que, na definic¸a˜o acima, na˜o se especifica nem a natureza dos vetores nem das operac¸o˜es. Assim qualquer conjunto que satisfac¸a as oito condic¸o˜es acima especificada sera´ um espac¸o vetorial. Definic¸a˜o 1.1 - Seja E um K-espac¸o vetorial. Os vetores v1, v2, . . . , vk ∈ E sa˜o linearmente depen- dentes sobre K, se existem escalares α1, α2, . . . , αk ∈ K, nem todos nulos, tais que: α1 v1 + α2 v2 + . . .+ αk vk = 0 . Observamos que essa relac¸a˜o e´ sempre va´lida se os αi, i = 1, 2, . . . , k sa˜o todos iguais a zero. Nesse caso dizemos que os vetores sa˜o linearmente independentes. Definic¸a˜o 1.2 - Um K-espac¸o vetorial tem dimensa˜o n se: a) existem n vetores linearmente independentes; b) (n+ 1) vetores sa˜o sempre linearmente dependentes. Definic¸a˜o 1.3 - Qualquer conjunto de n vetores linearmente independentes e´ chamado base de um K-espac¸o vetorial de dimensa˜o n. Assim, qualquer vetor do espac¸o pode ser representado como combinac¸a˜o linear dos vetores da base. Mudanc¸a de Base CAPI´TULO 1. CONCEITOS BA´SICOS 3 Estudaremos inicialmente mudanc¸a de base em um espac¸o vetorial bi-dimensional, e a seguir, em um espac¸o de dimensa˜o n. a) Seja E = IR2. Sejam B1 = {e1, e2} uma base de E e v ∈ E, como mostrados na Figura 1.1. a22 v2 a21 v′2 e2 v v′1 e′1 a11v1e1a12 e′2K * � 6 6 -- Figura 1.1 Enta˜o v se exprime de maneira u´nica como combinac¸a˜o linear dos elementos de B1, isto e´, existem escalares v1, v2 (elementos de K) tais que: v = v1 e1 + v2 e2 , (1.1) (onde os escalares v1, v2 sa˜o as coordenadas de v na base B1). Seja B′1 = {e′1, e′2}, como mostrado na Figura 1.1, uma outra base de E. Analogamente, podemos escrever: v = v′1 e ′ 1 + v ′ 2 e ′ 2 . (1.2) Desejamos saber como, dadas as coordenadas de v na base B1 (aqui denominada base antiga), poderemos determinar as coordenadas de v na base B′1 (aqui denominada base nova). Sendo e ′ 1, e ′ 2 elementos de E podemos, em particular, escrever cada um deles como combinac¸a˜o linear dos elementos da base B1. Assim: e′1 = a11 e1 + a21 e2 , e′2 = a12 e1 + a22 e2 . (1.3) isto e´, cada vetor da base nova se exprime de maneira u´nica como combinac¸a˜o linear dos vetores da base antiga. Assim, em virtude de (1.1), (1.2) e (1.3) temos: v = v1 e1 + v2 e2 = v′1 e ′ 1 + v ′ 2 e ′ 2 = v′1 (a11 e1 + a21 e2) + v ′ 2 (a12 e1 + a22 e2) = (v′1 a11 + v ′ 2 a12) e1 + (v ′ 1 a21 + v ′ 2 a22) e2 . Como as coordenadas de um vetor em relac¸a˜o a uma determinada base sa˜o u´nicas, podemos igualar os coeficientes. Assim, obtemos o sistema linear:{ v1 = v′1 a11 + v ′ 2 a12 v2 = v′1 a21 + v ′ 2 a22 CAPI´TULO 1. CONCEITOS BA´SICOS 4 ou na forma matricial: ( v1 v2 ) = ( a11 a12 a21 a22 ) ( v′1 v′2 ) , (1.4) ou ainda: v = A v′ . (1.5) O sistema (1.4), possui sempre uma e uma so´ soluc¸a˜o v′1, v ′ 2, pelo fato de B1 e B ′ 1 serem bases de E. Enta˜o, conhecidas, na base antiga, as coordenadas v1, v2 de v e as coordenadas de cada um dos vetores e′1, e ′ 2, na base antiga, podemos determinar as coordenadas v ′ 1, v ′ 2 de v na base nova usando (1.4). Sendo A na˜o singular, (det(A) 6= 0), existe a inversa A−1 de A. Assim, pre´-multiplicando (1.5) por A−1, obtemos: v′ = A−1 v . (1.6) A equac¸a˜o matricial (1.6) mostra como calcular as coordenadas de v na base antiga quando conhecidas as coordenadas de v na base nova. Exemplo 1.1 - Seja v = (2, 4)t na base {(1, 2)t, (2, 3)t}. Calcular as coordenadas de v na base {(1, 3)t, (1, 4)t}. Soluc¸a˜o: De (1.3), temos: (1, 3)t = a11 (1, 2)t + a21 (2, 3)t , (1, 4)t = a12 (1, 2)t + a22 (2, 3)t . Da primeira equac¸a˜o, obtemos o sistema:{ a11 + 2 a21 = 1 2 a11 + 3 a21 = 3 cuja soluc¸a˜o e´: a11 = 3, a21 = −1. De maneira ana´loga, da segunda equac¸a˜o, obtemos:{ a12 + 2 a22 = 1 2 a12 + 3 a22 = 4 cuja soluc¸a˜o e´: a12 = 5, a22 = −2. Substituindo os valores conhecidos em (1.4), segue que:( 2 4 ) = ( 3 5 −1 −2 ) ( v′1 v′2 ) . cuja soluc¸a˜o e´: v′1 = 24, v ′ 2 = −14. Assim, v = (24,−14)t na base {(1, 3)t, (1, 4)t}. Veremos agora, mudanc¸a de base em um K-espac¸o vetorial E de dimensa˜o n. b) Seja E = IRn. Sejam {e1, e2, . . . , en}, {e′1, e′2, . . . , e′n} bases de E e v ∈ E. Enta˜o, podemos escrever: v = n∑ i=1 viei = n∑ j=1 v′je ′ j . Mas e′1, e ′ 2, . . . , e ′ n sa˜o elementos de E, e portanto podem ser expressos em relac¸a˜o a base {e1, e2, . . . , en}. Logo: e′j = n∑ i=1 aijei , j = 1, 2, . . . , n . CAPI´TULO 1. CONCEITOS BA´SICOS 5 Enta˜o temos: v = n∑ i=1 vi ei = n∑ j=1 v′j e ′ j = n∑ j=1 v′j ( n∑ i=1 aij ei ) = n∑ i=1 n∑ j=1 aij v ′ j ei , ⇒ vi = n∑ j=1 aijv ′ j . Assim, na forma matricial, podemos escrever: v1 v2 ... vn = a11 a12 . . . a1n a21 a22 . . . a2n ... ... ... an1 an2 . . . ann v′1 v′2 ... v′n . ou v = A v′ e v′ = A−1 v . Exerc´ıcios 1.1 - Seja v = (2, 3, 4)t na base canoˆnica, isto e´, na base: {(1, 0, 0)t , (0, 1, 0)t , (0, 0, 1)t} . Calcular as coordenadas de v na base: {(1, 1, 1)t , (1, 1, 0)t , (1, 0, 0)t} . 1.2 - Seja v = 3 b1 + 4 b2 + 2 b3, onde: b1 = (1, 1, 0)t , b2 = (−1, 1, 0)t , b3 = (0, 1, 1)t . Calcular as coordenadas de v na base: f1 = (1, 1, 1)t , f2 = (1, 1, 0)t , f3 = (1, 0, 0)t . 1.3 - Seja Kn(x) = {Pr(x) / r ≤ n} o espac¸o vetorial de todos os polinoˆmios de grau ≤ n. A base canoˆnica para o espac¸o dos polinoˆmios e´ {1, x, x2, . . .}. Seja P3 = 3 + 4 x2 + 2 x3 e B1 = {5, x− 1, x2 − 5 x+ 3, x3 − 4} uma outra base. Calcular as coordenadas de P3 em relac¸a˜o a` base B1. 1.4 - Sejam B1 = {5, x − 1, x2 − 3 x} e B2 = {8, 3 x + 2, 5 x2 − 3 x} bases de K2(x). Seja P2(x) = 8{5}+ 4{x− 1}+ 3{x2 − 3x}. Calcular as coordenadas de P2(x) em relac¸a˜o a` base B2. 1.5 - Dado o polinoˆmio P3(x) = 20 x3 + 8 x2 − 14 x + 28 exprimı´-lo como combinac¸a˜o linear dos polinoˆmios da sequeˆncia: Q3(x) = 5 x3 − 7 x+ 12, Q2(x) = −4 x2 + 8 x, Q1(x) = 6 x− 1, Q0(x) = 5. Espac¸o Vetorial Euclidiano Vamos definir aqui importantes noc¸o˜es de produto escalar e de ortogonalidade, visando introduzir, entre outras coisas o conceito de comprimento e distaˆncia. Produto Escalar Seja E um espac¸o vetorial real. Sejam x, y elementos de E. CAPI´TULO 1. CONCEITOS BA´SICOS 6 Definic¸a˜o 1.4 - Chama-se produto escalar (ou produto interno) de x por y, em s´ımbolo, (x, y), qualquer func¸a˜o definida em E × E com valores em IR satisfazendo as seguintes propriedades: P1) (x, y) = (y, x), ∀x, y ∈ E , P2) (x+ y, z) = (x, z) + (y, z), ∀x, y, z ∈ E , P3) (λx, y) = λ(x, y), ∀λ ∈ IR, ∀x, y ∈ E , P4) (x, x) ≥ 0 e (x, x) = 0 se e somente se x = θ(nulo). Um espac¸o vetorial real E, onde esta´ definido um produto escalar e´ chamado espac¸o euclidiano real. Daremos a seguir alguns exemplos de produto escalar. Exemplo 1.2 - Seja E = IR2. Sejam x = (x1, x2)t; y = (y1, y2)t. Mostrar que, definindo: (x, y) = x1 y1 + x2 y2 . (1.7) o IR2 torna-se um espac¸o euclidiano real. Soluc¸a˜o: Devemos mostrar que as condic¸o˜es P1, P2, P3 e P4 esta˜o satisfeitas, isto e´, que (1.7) e´ um produto escalar bem definido no IR2. De fato: P1) (x, y) = x1y1 + x2y2 = y1x1 + y2x2 = (y, x). P2) (x+ y, z) = (x1 + y1)z1 + (x2 + y2)z2 = x1z1 + y1z1 + x2z2 + y2z2 = (x1z1 + x2z2) + (y1z1 + y2z2) = (x, z) + (y, z). P3) (λ x, y) = λx1y1 + λx2y2 = λ(x1y1 + x2y2) = λ(x, y). P4) (x, x) = x21 + x 2 2 ≥ 0 (evidente). (x, x) = x21 + x 2 2 = 0 ⇔ x2i = 0 ⇔ xi = 0,∀i ⇔ x = θ. Logo, (1.7) e´ uma boa definic¸a˜o de produto escalar. Nos pro´ximos exemplos, a verificac¸a˜o de que as condic¸o˜es P1, P2, P3 e P4 sa˜o satisfeitas, fica como exerc´ıcio. Exemplo 1.3 - Seja E = IRn. Para x, y ∈ E, isto e´, x = (x1, x2, . . . , xn)t , e y = (y1, y2, . . . , yn)t, definimos: (x, y) = n∑ i=1 xi yi , (1.8) como um produto escalar no IRn. (1.8) e´ chamado de produto escalar usual no IRn. Tambe´m, (x, y) = n∑ i=1 wi xi yi, (1.9) com wi fixados e positivos, define no IRn um produto escalar. Assim, tanto (1.8) como (1.9) transformam o IRn num espac¸o euclidiano real. Exemplo 1.4 - Seja E = C[a, b] o espac¸o vetorial das func¸o˜es cont´ınuas reais definidas sobre o intervalo limitado fechado [a, b]. Se para f, g ∈ C[a, b] definimos: (f, g) = ∫ b a f(x) g(x)dx, (1.10) tal espac¸o torna-se um espac¸o euclidiano real. (1.10) e´ chamado de produto escalar usual em C[a, b]. CAPI´TULO 1. CONCEITOS BA´SICOS 7 Em particular, se f(x) = Pk(x) e g(x) = Pj(x), com k, j ≤ n, sa˜o polinoˆmios de grau ≤ n, a equac¸a˜o (1.10) define um produto escalar em Kn = {Pr(x) / r ≤ n}, (espac¸o vetorial dos polinoˆmios de grau ≤ n). Exemplo 1.5 - Seja E = Kn(x) = {Pr(x) / r ≤ n}. Sejam a ≤ x0 < x1 < . . . < xm ≤ b, m+ 1 pontos distintos, com m ≥ n. Definimos: (Pi(x), Pj(x)) = m∑ k=0 Pi (xk)Pj (xk) . (1.11) como um produto escalar Kn. Esse u´ltimo exemplo mostra uma outra maneira de se transformar Kn(x) num espac¸o euclidiano real, maneira esta que sera´ u´til em problemas de aproximac¸a˜o de func¸o˜es pelo me´todo dos mı´nimos quadrados, no caso discreto. Ortogonalidade Seja E um espac¸o euclidiano real. Sejam x, y elementos de E. Definic¸a˜o 1.5 - Dizemos que x e´ ortogonal a y, em s´ımbolo, x ⊥ y, se e somente se (x, y) = 0. Observe que (x, θ) = (θ, x) = 0 qualquer que seja x, onde θ e´ o vetor nulo. Exemplo 1.6 - No espac¸o E = C[−pi, pi], com (f, g) = ∫ pi−pi f(x) g(x) dx, verificar se sen x e cos x sa˜o ortogonais. Soluc¸a˜o: Temos: (sen x, cos x) = ∫ pi −pi sen x cos x dx = sen2 x 2 ]pi −pi = 0 . Assim, sen x e cos x sa˜o ortogonais em E. Exemplo 1.7 - Em E = IR3, com o produto escalar usual, verificar se os vetores: f1 = ( 1√ 3 , 1√ 3 , 1√ 3 )t e f2 = ( 1√ 2 , − 1√ 2 , 0 )t sa˜o ortogonais. Soluc¸a˜o: Temos: (f1, f2) = 1√ 3 × 1√ 2 + 1√ 3 × ( − 1√ 2 ) + 1√ 3 × 0 = 1√ 6 − 1√ 6 + 0 = 0. Logo, f1 e f2 sa˜o ortogonais em E. Teorema 1.1 - Os vetores v1, v2, . . . , vm tais que: a) vi 6= θ, i = 1, 2, . . . ,m ; b) (vi, vj) = 0, para i 6= j; sa˜o sempre linearmente independentes. CAPI´TULO 1. CONCEITOS BA´SICOS 8 Dito de outro modo:os vetores na˜o nulos v1, v2, . . . , vm, dois a dois ortogonais, sa˜o sempre linearmente independentes. Prova: Devemos provar que: α1v1 + α2v2 + . . .+ αmvm = 0 (1.12) ⇒ α1 = α2 = . . . = αm = 0. Em virtude de (1.12) podemos escrever, sucessivamente, para cada i = 1, 2, . . . ,m: (vi , α1v1 + α2v2 + . . .+ αivi + . . .+ αmvm) = (vi, 0) = 0, ou seja: α1 (vi, v1) + α2 (viv2) + . . .+ αi (vi, vi) + . . .+ αm (vi, vm) = 0. onde aplicamos P2 e P3. Mas (vi, vj) = 0 , i 6= j. Da´ı, a igualdade acima se reduz a: αi (vi, vi) = 0. Mas sendo vi 6= θ, temos, usando P4, que (vi, vi) 6= 0, para i = 1, 2, . . . ,m. Portanto, da u´ltima igualdade conclu´ımos que, αi = 0, i = 1, 2, . . . ,m. Logo, os vetores v1, v2, . . . , vm sa˜o linearmente independentes. Definic¸a˜o 1.6 - Seja E um espac¸o euclidiano de dimensa˜o n. Se f1, f2, . . . , fn sa˜o dois a dois ortogonais, ou seja, se (fi, fj) = 0, i 6= j, eles constituem uma base de E, que sera´ chamada de base ortogonal. Teorema 1.2 - A condic¸a˜o necessa´ria e suficiente para que um vetor v ∈ E seja ortogonal a um sub- espac¸o E′ ⊂ E e´ que v seja ortogonal a cada vetor e1, e2, . . . , en de uma base de E′. Prova: A condic¸a˜o e´ evidentemente necessa´ria. Provemos a suficieˆncia. Seja x um vetor qualquer de E′. Temos enta˜o: x = α1 e1 + α2 e2 + . . . + αn en, desde que e1, e2, . . . , en e´ uma base de E′. Devemos mostrar que v ⊥ x. Assim: (v, x) = (v, α1 e1 + α2 e2 + . . .+ αn en) = α1 (v, e1) + α2 (v, e2) + . . .+ αn (v, en) = 0, desde que por hipo´tese, v ⊥ {e1, e2, . . . , en}. Logo v e´ ortogonal a E′. Teorema 1.3 - Num espac¸o euclidiano real E quaisquer que sejam x, y ∈ E, temos: (x, y)2 ≤ (x, x) (y, y), (1.13) com igualdade va´lida se e somente se x e y sa˜o linearmente dependentes. A desigualdade (1.13) e´ chamada desigualdade de Schwarz. Prova: Tomemos o vetor v = x+ λ y, onde λ e´ um nu´mero real qualquer. De P4, resulta: (x+ λ y, x+ λ y) ≥ 0 , e usando P2 e P3, obtemos: λ2(y, y) + 2λ(x, y) + (x, x) ≥ 0 . CAPI´TULO 1. CONCEITOS BA´SICOS 9 Para que o trinoˆmio seja sempre ≥ 0 e´ necessa´rio que ∆ ≤ 0. Assim: ∆ = 4(x, y)2 − 4(x, x)(y, y) ≤ 0, ⇒ (x, y)2 ≤ (x, x)(y, y). Mostremos agora que a igualdade e´ va´lida se e somente se x e y sa˜o linearmente dependentes. Seja x = λ y. Enta˜o: (x, y)2 = (λy, y)2 = [λ(y, y)]2 = λ2(y, y)2 = λ2(y, y)(y, y) = (λy, λy)(y, y) = (x, x)(y, y). Isto e´, x e y linearmente dependentes =⇒ (x, y)2 = (x, x)(y, y). Suponhamos, agora que a igualdade seja va´lida em (1.13). O caso y = θ e´ trivial. Suponhamos y 6= θ. Temos que (x, y)2 = (x, x)(y, y) e´ equivalente a: (x + λ y, x+ λ y) = 0 com λ = − (x, y) (y, y) . Assim, de P4, conclu´ımos que x + λ y = 0. Ou seja x = (x, y) (y, y) y, e isto quer dizer que x e y sa˜o linearmente dependentes. Exerc´ıcios 1.6 - Em relac¸a˜o ao produto escalar usual do IR3, calcule (x, y) nos seguintes casos: a) x = (1/2, 2, 1)t , y = (4, 1, −3)t; b) x = (2, 1, 0)t , y = (4, 0, 2)t; 1.7 - Determinar (f, g) = ∫ 1 0 f(t)g(t)dt para cada um dos seguintes pares de vetores de K2(t). a) f(t) = t , g(t) = 1− t2; b) f(t) = t− 12 , g(t) = 12 − ( t− 12 ) ; 1.8 - Sejam x = (x1, x2)t e y = (y1, y2)t dois vetores quaisquer do IR2. Mostre que: (x, y) = x1x2 a2 + y1y2 b2 , com a, b ∈ IR fixos e na˜o nulos define um produto escalar sobre o IR2. 1.9 - Considere no espac¸o vetorial IR2 o produto escalar dado por: (x, y) = x1y1 + 2x2y2, para todo par de vetores x = (x1, x2)t e y = (y1, y2)t. Verificar se x e y sa˜o ortogonais em relac¸a˜o a esse produto escalar nos seguintes casos: a) x = (1, 1)t e y = (2, −1)t; b) x = (2, 1)t e y = (−1, 1)t; b) x = (3, 2)t e y = (2, −1)t; CAPI´TULO 1. CONCEITOS BA´SICOS 10 1.10 - Determine m de modo que sejam ortogonais os vetores x = (m + 1, 2)t e y = (−1, 4)t em relac¸a˜o ao produto escalar usual do IR2. 1.11 - Determinar f(x) ∈ K2(x) que seja ortogonal a g(x) = 1 e h(x) = t, em relac¸a˜o ao produto escalar dado por: (f, g) = ∫ 1 −1 f(x) g(x) dx . 1.12 - Considere no IR3 o produto escalar usual. Determine m ∈ IR de tal modo que os vetores u = (1, m+ 1, m)t , v = (m− 1, m, m+ 1)t, sejam ortogonais. 1.13 - Sejam f(x) = x, g(x) = mx2 − 1 e considere o produto escalar usual em C[0, 1]. Determine o valor de m, para que f(x) e g(x) sejam ortogonais. Espac¸o Vetorial Normado Vamos definir agora importantes definic¸o˜es de norma de vetor e de matriz. Com isso estaremos aptos a definir, quando oportuno, as noc¸o˜es de limite de uma sequeˆncia de vetores ou de matrizes, de grande utilidade, entre outros, no estudo de convergeˆncia de me´todos iterativos de soluc¸a˜o de sistemas lineares e do problema de erros de arredondamento nos processos de ca´lculo onde interveˆm matrizes ou vetores. Norma de Vetor Definic¸a˜o 1.7 - Chama-se norma de um vetor x, em s´ımbolo, ‖ x ‖, qualquer func¸a˜o definida num espac¸o vetorial E, com valores em IR , satisfazendo as seguintes condic¸o˜es: N1) ‖ x ‖ ≥ 0 e ‖ x ‖ = 0 se e somente se x = θ , N2) ‖ λ x ‖ = |λ| ‖ x ‖ para todo escalar λ N3) ‖ x+ y ‖ ≤ ‖ x ‖ + ‖ y ‖ (desigualdade triangular). Um espac¸o vetorial E, onde esta´ definida uma norma e´ chamado espac¸o vetorial normado. Daremos a seguir alguns exemplos de norma no IRn. Exemplo 1.8 - Seja E = IRn, e seja x = (x1, x2, . . . , xn)t. Mostrar que, definindo: ‖ x ‖E = √√√√ n∑ i=1 x2i , (1.14) o IRn torna-se um espac¸o vetorial normado. Soluc¸a˜o: Vamos mostrar que as condic¸o˜es N1, N2 e N3 esta˜o satisfeitas, isto e´, que (1.14) e´ uma norma CAPI´TULO 1. CONCEITOS BA´SICOS 11 bem definida no IRn. De fato: N1) ‖ x ‖E = √√√√ n∑ i=1 x2i ≥ 0 (evidente). ‖ x ‖E = √√√√ n∑ i=1 x2i = 0 ⇔ n∑ i=1 x2i = 0 ⇔ xi = 0,∀i ⇔ x = θ. N2) ‖ λx ‖E = √√√√ n∑ i=1 λ2x2i = √√√√λ2 n∑ i=1 x2i = |λ| √√√√ n∑ i=1 x2i = |λ| ‖ x ‖E . N3) ‖ x+ y ‖2E = n∑ i=1 (xi + yi) 2 = (x1 + y1) 2 + (x2 + y2) 2 + . . .+ (xn + yn) 2 = x21 + 2x1y1 + y 2 1 + x 2 2 + 2x2y2 + y 2 2 + . . .+ x 2 n + 2xnyn + y 2 n = n∑ i=1 x2i + 2 n∑ i=1 xiyi + n∑ i=1 y2i ≤ n∑ i=1 x2i + 2 √√√√ n∑ i=1 x2i √√√√ n∑ i=1 y2i + n∑ i=1 y2i , onde usamos a desigualdade de Schwarz, isto e´: n∑ i=1 xiyi ≤ √√√√ n∑ i=1 x2i √√√√ n∑ i=1 y2i . Portanto, ‖ x+ y ‖2E ≤ ‖ x ‖2E + 2 ‖ x ‖E ‖ y ‖E + ‖ y ‖2E = (‖ x ‖E + ‖ y ‖E)2 . Assim: ‖ x + y ‖2E ≤ (‖ x ‖E + ‖ y ‖E)2. Extraindo-se a raiz quadrada de ambos os membros, temos que: ‖ x+ y ‖E ≤ ‖ x ‖E + ‖ y ‖E . Logo, (1.14) e´ uma boa definic¸a˜o de norma. No pro´ximo exemplo, a verificac¸a˜o de que as condic¸o˜es N1, N2 e N3 sa˜o satisfeitas, fica como exerc´ıcio. Exemplo 1.9 - Seja E = IRn, e seja x = (x1, x2, . . . xn)t. Definimos enta˜o: ‖ x ‖∞ = max 1≤i≤n |xi| , ‖ x ‖1 = n∑ i=1 |xi| , ‖ x ‖ = √ (x, x) , como normas no IRn. Observac¸o˜es: 1) ‖ x ‖= √(x, x) corresponde a` noc¸a˜o intuitiva de comprimento ou mo´dulo de um vetor. CAPI´TULO 1. CONCEITOS BA´SICOS 12 2) Se usarmos a definic¸a˜o usual de produto escalar no IRn , isto e´, se usarmos (1.8), enta˜o: ‖ x ‖ =√ (x, x) = √∑n i=1 x 2 i = ‖ x ‖E . Exemplo 1.10 - Seja x = (−1, 10, 3, 4, −20)t. Calcular ‖ x ‖E, ‖ x ‖∞ e ‖ x ‖1 . Soluc¸a˜o: Aplicando a definic¸a˜o de cada uma das normas, obtemos: ‖ x ‖E = √ (−1)2 + (10)2 + 32 + 42 + (−20)2 ' 22.93, ‖ x ‖∞ = max (| − 1|, |10|, |3|, |4|, | − 20|) = 20, ‖ x ‖1 = | − 1| + |10| + |3| + |4| + | − 20| = 38. Como voceˆ pode observar a aplicac¸a˜o de cada uma das normas definidas anteriormente fornece um resultado diferente. Entretanto, no IRn, todas as normas sa˜o equivalentes. Definic¸a˜o 1.8 - Duas normas ‖ · ‖a e ‖ · ‖b sa˜o equivalentes se existem constantes k1 e k2 tais que: k1 ‖ x ‖a ≤ ‖ x ‖b ≤ k2 ‖ x ‖a , ∀ x ∈ E. (1.15) Exemplo 1.11 - Como exemplos de normas equivalentes, no IRn, temos: a) ‖ x ‖∞ ≤ ‖ x ‖1 ≤ n ‖ x ‖∞ , b) ‖ x ‖∞ ≤ ‖ x ‖E ≤ √ n ‖ x ‖∞ , c) 1 n ‖ x ‖1 ≤ ‖ x ‖E ≤ √ x ‖ x ‖1 . Vamos verificar que o item a) e´ verdadeiro; a verificac¸a˜o das demais fica como exerc´ıcio. Soluc¸a˜o: Temos: ‖ x ‖∞ = max 1≤i≤n |xi| = max{|x1|, |x2|, . . . , |xn|} = |xk| ≤ |xk| + k−1∑ i=1 |xi| + n∑ i=k+1 |xi| = n∑ i=1 |xi| = ‖ x ‖1 = |x1| + |x2| + . . .+ |xn| ≤ {|xk| + |xk| + . . .+ |xk|︸ ︷︷ ︸ n vezes } = n|xk| = n max 1≤i≤n |xi| = n ‖ x ‖∞ . Teorema 1.4 - A desigualdade de Schwarz (1.13) pode ser escrita como: |(x, y)| ≤ ‖ x ‖ ‖ y ‖ . (1.16) Prova: A prova deste teorema fica como exerc´ıcio. Um vetor x, de E, e´ unita´rio se seu comprimento e´ igual a 1, isto e´, se ‖ x ‖= 1. Definic¸a˜o 1.9 - Seja E um espac¸o euclidiano de dimensa˜o n. Os vetores f1, f2, . . . , fn formam uma base ortonormal de E se eles forem vetores ortonormais, ou seja, se: (fi, fj) = δij = { 1 se i = j, 0 se i 6= j. CAPI´TULO 1. CONCEITOS BA´SICOS 13 Assim uma sequeˆncia de vetores e´ ortonormal se cada um dos seus elementos tem norma 1 e dois quaisquer distintos dentre eles sa˜o ortogonais. Teorema 1.5 - Num espac¸o euclidiano, um conjunto ortornormal de vetores e´ sempre linearmente in- dependente. Prova: (ana´loga ao do Teorema 1.1)). Definic¸a˜o 1.10 - Seja E um espac¸o euclidiano. Dados os vetores x e y ∈ E, definimos distaˆncia entre x e y, o comprimento do vetor x− y, isto e´: d(x, y) = ‖ x− y ‖ → d(x, y) = √ (x− y, x− y). Temos assim uma aplicac¸a˜o d : E × E → IR, que satisfaz as seguintes condic¸o˜es: D1) d(x, y) ≥ 0 e d(x, y) = 0 se e somente se x = y , D2) d(x, y) = d(y, x) , ∀x, y ∈ E , D3) d(x, y) ≤ d(x, z) + d(z, y) , ∀x, y, z ∈ E . Norma de Matriz Como ja´ dissemos anteriormente, o conjunto das matrizes (n × n), com as operac¸o˜es de soma de matrizes e produto de um escalar por uma matriz forma um espac¸o vetorial E de dimensa˜o n2. Podemos enta˜o falar em norma de uma matriz A ∈ E. Observe enta˜o que no caso de matrizes, vale a mesma definic¸a˜o de norma de vetor , isto e´: Definic¸a˜o 1.11 - Chama-se norma de uma matriz A, em s´ımbolo, ‖ A ‖, qualquer func¸a˜o definida no espac¸o vetorial das matrizes n× n, com valores em IR , satisfazendo as seguintes condic¸o˜es: M1) ‖ A ‖ ≥ 0 e ‖ A ‖ = 0 se e somente se A = θ(matriz nula) , M2) ‖ λ A ‖ = |λ| ‖ A ‖ para todo escalar λ , M3) ‖ A+B ‖ ≤ ‖ A ‖ + ‖ B ‖ (desigualdade triangular) . Daremos a seguir alguns exemplos de norma de matrizes. A verificac¸a˜o de que sa˜o normas bem definidas no espac¸o vetorial das matrizes n× n, fica a cargo do leitor. Exemplo 1.12 - Seja A uma matriz (n× n). Definimos enta˜o: a) ‖ A ‖∞ = max 1≤i≤n n∑ j=1 |aij | (norma linha) ; b) ‖ A ‖1 = max 1≤j≤n n∑ i=1 |aij | (norma coluna) ; c) ‖ A ‖E = √√√√ n∑ i,j=1 a2ij (norma euclidiana) . Para essas normas vale: ‖ AB ‖≤‖ A ‖‖ B ‖. (Prove). Exemplo 1.13 - Seja A = 3 2 −16 3 4 −1 2 1 . Calcular ||A||∞, ||A||1, ||A||E . CAPI´TULO 1. CONCEITOS BA´SICOS 14 Soluc¸a˜o: Usando cada uma das definic¸o˜es dadas anteriormente, obtemos: ||A||∞ = |6| + |3| + |4| = 13 , ||A||1 = |3| + |6| + | − 1| = 10 , ||A||E = (9 + 4 + 1 + 36 + 9 + 16 + 1 + 4 + 1)1/2 = 9 . Como no caso de vetor, as normas de matrizes tambe´m sa˜o equivalentes, isto e´, satisfazem uma relac¸a˜o do tipo (1.15), com o vetor x substitu´ıdo pela matriz A. A verificac¸a˜o das desigualdades no pro´ximo exemplo fica como exerc´ıcio. Exemplo 1.14 - Como exemplos de normas equivalentes, no espac¸o vetorial das matrizes de ordem n, temos: a) 1 n ‖ A ‖∞ ≤ ‖ A ‖E ≤ √ n ‖ A ‖∞ , b) 1 n ‖ A ‖1 ≤ ‖ x ‖E ≤ √ n ‖ x ‖1 , c) ‖ A ‖∞ ≤ n ‖ A ‖1 , d) ‖ A ‖1 ≤ n ‖ A ‖∞ . Definic¸a˜o 1.12 - Dada uma norma de vetor, podemos definir uma norma de matriz, que sera´ chamada de subordinada a ela do seguinte modo: ‖ A ‖= sup ‖x‖=1 ‖ Ax ‖ . Observe que a norma de matriz assim definida pode ser interpretada como sendo o comprimento do maior vetor no conjunto imagem {Ax} da esfera unita´ria {x / ‖ x ‖= 1} pela transformac¸a˜o x→ Ax. Definic¸a˜o 1.13 - Se uma norma de matriz e uma norma de vetor esta˜o relacionadas de tal modo que a desigualdade: ‖ Ax ‖ ≤ ‖ A ‖‖ x ‖ , e´ satisfeita para qualquer x, enta˜o dizemos que as duas normas sa˜o consistentes. Note que existe um vetor x0 tal que: ‖ Ax ‖=‖ A ‖‖ x ‖. Nestas condic¸o˜es: ‖ A ‖= mink tal que ‖ Ax ‖≤ k ‖ x ‖ . Exerc´ıcios 1.14 - Considere os vetores do IR6: x = (1, 2, 0, −1, 2, −10)t e y = (3, 1, −4, 12, 3, 1)t. Calcule a norma de cada um desses vetores usando as normas definidas no exemplo 1.9. 1.15 - No espac¸o vetorial IR4, munido do produto escalar usual, sejam x = (1, 2, 0, 1)t e y = (3, 1, 4, 2)t . Determine: (x, y), ‖ x ‖, ‖ y ‖, d(x, y) e x+ y‖ x+ y ‖ . 1.16 - Prove que num espac¸o euclidiano normado: a) ‖ x+ y ‖2 + ‖ x− y ‖2= 2(‖ x ‖2‖ +y ‖2), b) | ‖ x ‖ − ‖ y ‖ | ≤‖ x− y ‖. CAPI´TULO 1. CONCEITOS BA´SICOS 15 1.17 - Sejam u e v vetores de um espac¸o euclidiando tais que ‖ u ‖= 1, ‖ v ‖= 1 e ‖ u − v ‖= −2. Determine (u, v). 1.18 - Considere as seguintes matrizes: A = ( 2 1 3 2 ) ; B = 3 2 12 2 1 3 3 2 ; C = 2 1 3 −1 4 3 8 2 6 7 10 1 3 −1 0 1 . Calcule a norma de cada uma delas usando as normas definidas no exemplo 1.12. 1.3 Processo de Gram-Schmidt Em diversos problemas relacionados com espac¸o vetorial, a escolha de uma base para o espac¸o fica a crite´rio da pessoa que se propoˆs a resolver o problema. E´ claro que sempre a melhor estrate´gia sera´ escolher a base que melhor simplifique os ca´lculos. Em espac¸os euclidianos, tem-se muitas vezes o caso em que a melhor escolha da base e´ aquela onde todos os seus vetores sa˜o mutuamente ortogonais ou ortonormais. Vimos anteriormente que uma sequeˆncia ortonormal de vetores e´ sempre linearmente independente. Vamos agora mostrar que e´ sempre poss´ıvel construir, a partir de uma sequeˆncia de vetores linearmente independentes {f1, f2, . . . , fn}, uma sequeˆncia ortogonal {e1, e2, . . . , en}. Para obtermos uma sequeˆncia ortonormal {e∗1, e∗2, . . . , e∗n}, basta fazer: e∗i = ei ‖ ei ‖ , i = 1, 2, . . . , n. Teorema 1.6 - Todo espac¸o euclidiano n dimensional tem uma base ortogonal e uma base ortonormal. Prova: Todo espac¸o euclidiano E e´ um espac¸o vetorial, e, portanto tem uma base. Seja f1, f2, . . . , fn uma base desse espac¸o euclidiano. Vamos construir a partir de f1, f2, . . . , fn uma base ortogonal de E. Seja {e1, e2, . . . , en} a base procurada. Tomamos e1 como sendo igual ao primeiro elemento da sequeˆncia dada, isto e´: e1 = f1 . O elemento e2 sera´ tomado como combinac¸a˜o linear do segundo elemento da sequeˆncia dada e e1, ou seja: e2 = f2 + α1 e1 , onde α1 e´ escolhido de tal maneira que e2 seja ortogonal a e1. Assim: (e2, e1) = 0 → (f2 +α1 e1, e1) = 0. Portanto, segue que: α1 = − (f2, e1)(e1, e1) . Vamos supor que ja´ temos constru´ıdo os vetores: e1, e2, . . . , ek−1, dois a dois ortogonais. O elemento ek sera´ tomado como combinac¸a˜o linear do ko elemento da sequeˆncia dada e todos os ei, ja´ calculados, isto e´: ek = fk + αk−1 ek−1 + αk−2 ek−2 + . . .+ α1 e1 , CAPI´TULO 1. CONCEITOS BA´SICOS 16 onde os αi, i = 1, 2, . . . , k − 1, sa˜o determinados de tal maneira que ek seja ortogonal a todos os ei ja´ calculados. Assim, devemos ter: (ek, ei) = 0, i = 1, 2, . . . , k − 1, ou seja: (ek, e1) = (fk + αk−1ek−1 + . . .+ α1e1, e1) = 0 , (ek, e2) = (fk + αk−1ek−1 + . . .+ α1e1, e2) = 0 , ... (ek, ek−1) = (fk + αk−1ek−1 + . . .+ α1e1, ek−1) = 0 . Desde que os vetores e1, e2, . . . , ek−1 foram constru´ıdos dois a dois ortogonais, obtemos: (fk, e1) + α1 (e1, e1) = 0 , (fk, e2) + α2 (e2, e2) = 0 , ... (fk, ek−1) + αk−1 (ek−1, ek−1) = 0 . Portanto, segue que: α1 = − (fk, e1)(e1, e1 , α2 = − (fk, e2)(e2, e2) , ... αk−1 = − (fk, ek−1)(ek−1, ek−1) . Mostremos agora que ek 6= 0. De fato, temos que ek e´ combinac¸a˜o linear dos vetores e1, e2, . . . , ek−1, fk. Mas ek−1 pode ser escrito com combinac¸a˜o linear dos vetores e1, e2, . . . , ek−2, fk−1 e assim por diante. Enta˜o, substituindo, teremos: ek = a1 f1 + a2 f2 + . . .+ ak−1 fk−1 + fk , e como f1, f2, . . . , fk, sa˜o linearmente independentes, temos que ek 6= 0; qualquer que seja k. Assim, usando e1, e2, . . . , ek−1 e fk constru´ımos ek. Analogamente com e1, e2, . . . , ek e fk+1 cons- tru´ımos ek+1. Continuando o processo, constru´ımos os n vetores dois a dois ortogonais. Assim esses vetores formam uma base ortogonal de E. Tomando: e∗i = ei ‖ ei ‖ , i = 1, 2, . . . , n ; teremos uma base ortonormal de E. Chama-se processo de Gram-Schmidt a construc¸a˜o passo a passo (descrita na prova do teorema 1.6) para converter uma base arbitra´ria em base ortogonal. Exemplo 1.15 - Construir a partir de f1 = (1, −2, 0)t , f2 = (0, 1, 1)t , f3 = (1, 0, −1)t; uma sequeˆncia de vetores ortonormais e∗1, e ∗ 2, e ∗ 3, relativamente ao produto escalar usual do IR 3, usando o processo de Gram-Schmidt. CAPI´TULO 1. CONCEITOS BA´SICOS 17 Soluc¸a˜o: Temos: e1 = f1 = (1, −2, 0)t . e2 = f2 + α1 e1, onde α1 = − (f2, e1)(e1, e1) = − −2 5 = 2 5 ⇒ e2 = (0, 1, 1)t + 2 5 (1, −2, 0)t = ( 2 5 , 1 5 , 1 )t . e3 = f3 + α2e2 + α1e1, onde α2 = − (f3, e2)(e2, e2) = − −3/5 6/5 = 1 2 , α1 = − (f3, e1)(e1, e1) = − 1 5 ⇒ e3 = (1, 0, −1)t + 12 ( 2 5 , 1 5 , 1 ) − 1 5 (1, −2, 0)t = ( 1, 1 2 , −1 2 )t . Assim e1, e2, e3 sa˜o dois a dois ortogonais. Para obtermos a sequeˆncia ortonormal e∗1, e ∗ 2, e ∗ 3, fazemos: e∗1 = e1 ‖ e1 ‖ = e1√ (e1, e1) = (1, −2, 0)t√ 12 + (−2)2 + 02 = ( 1√ 5 , −2√ 5 , 0 )t ; e∗2 = e2 ‖ e2 ‖ = e2√ (e2, e2) = (2/5, 1/5, 1)t√ (2/5)2 + (1/5)2 + 12 = √ 5 6 ( 2 5 , 1 5 , 1 )t ; e∗3 = e3 ‖ e3 ‖ = e3√ (e3, e3) = (1, 1/2, −1/2)t√ 12 + (1/2)2 + (−1/2)2 = √ 2 3 ( 1, 12 , −12 )t . Exemplo 1.16 - Dada a sequeˆncia de polinoˆmios independentes {1, x, x2} obter, no intervalo [−1, 1], uma sequeˆncia ortogonal de polinoˆmios {P0(x), P1(x), P2(x)} relativamente ao produto escalar (f, g) =∫ 1 −1 f(x) g(x) dx . Soluc¸a˜o: Temos: P0(x) = 1 , P1(x) = x+ α0P0(x) , onde α0 = − (x, P0(x))(P0(x), P0(x)) = − ∫ 1 −1 x dx∫ 1 −1 dx = x2/2 x ] 1 −1 = 0 ⇒ P1(x) = x+ 0× 1 = x. P2(x) = x2 + α1P1(x) + α0P0(x), onde α1 = − (x 2, P1(x)) (P1(x), P1(x)) = − ∫ 1 −1 x 3 dx∫ 1 −1 x 2 dx = x4/4 x3/3 ] 1 −1 = 0 , α0 = − (x 2, P0(x)) (P0(x), P0(x)) = − ∫ 1 −1 x 2 dx∫ 1 −1 dx = − x 3/3 x ] 1 −1 = −2/3 2 = −1 3 ⇒ P2(x) = x2 + 0× x− 13 × 1 = x 2 − 1 3 . CAPI´TULO 1. CONCEITOS BA´SICOS 18 Assim P0(x), P1(x), P2(x) sa˜o dois a dois ortogonais. Observe que sempre que desejarmos obter uma sequeˆncia de polinoˆmios ortogonais sobre um determi- nado intervalo, podemos tomar a sequeˆncia 1, x, x2, . . . como sendo a sequeˆncia original e ortogonaliza´-la. Exerc´ıcios 1.19 - Usando o processo de Gram-Schmidt e o produto escalar usual do IR3, ortonormalizar a base: e1 = (1, 1, 1)t , e2 = (1, −1, 1)t , e3 = (−1, 0, 1)t . 1.20 - Os vetores {(0, 2, 1, 0)t, (1, −1, 0, 0)t, (1, 2, 0, −1)t, (1, 0, 0, 1)t} constituem uma base na˜o ortonormal do IR4. Construir a partir desses vetores, uma base ortonormal para o IR4, usando o processo de Gram-Schmidt. 1.21 - Ortonormalize a sequeˆncia de polinoˆmios obtida no exemplo 1.16. 1.22 - Usando o produto escalar usual em C[1, 2] e o processo de Gram-Schmidt construa uma sequeˆncia de polinoˆmios ortonormais. 1.4 Projec¸a˜o Ortogonal Veremos aqui a projec¸a˜o ortogonal de um vetor sobre outro bem como a projec¸a˜o ortogonal de um vetor sobre um sub-espac¸o. Esse u´ltimo sera´ utilizado no estudo de aproximac¸o˜es de func¸o˜es pelo me´todo dos mı´nimos quadrados. Projec¸a˜o Ortogonal de um Vetor sobre Outro Sejam x e y vetores na˜o nulos. Escolhemos um nu´mero real λ tal que λ y seja ortogonal a x − λ y, como sugere a Figura 1.2, no caso em que E = IR2. x− λ y λ y x y 6* - - Figura 1.2 De λ y ⊥ (x− λ y), conclu´ımos que (λ y, x− λ y) = 0. Portanto, aplicando P3, segue que: λ(y, x)− λ2(y, y) = 0 → λ = (x, y) (y, y) . Assim, obtemos a seguinte definic¸a˜o. Definic¸a˜o 1.14 - Num espac¸o euclidiano real, chama-se projec¸a˜o ortogonal de x sobre y, y 6= θ, o vetor z definido por: z = (projec¸a˜o de x sobre y) = (x, y)(y, y) y. CAPI´TULO 1. CONCEITOS BA´SICOS 19 Se ‖ y ‖= 1, enta˜o a projec¸a˜o de x sobre y e´ dada por (x, y) y. Projec¸a˜o Ortogonal de um Vetor sobre um Sub-Espac¸o Seja E um espac¸o euclidiano e seja E′, de dimensa˜o finita n, um sub-espac¸o de E. Seja v um vetor de E na˜o pertencente a E′. O problema que desejamos resolver agora e´ o de obter um vetor v0 ∈ E′ tal que v− v0 seja ortogonal a todo vetor de E′. (A Figura 1.3 ilustra o problema, para o caso em que E = IR3 e E′ = IR2). e1 e2 v − v0 v0 v R 6� 6 -- Figura 1.3 Seja {e1, e2, . . . , en} uma base de E′. Como v0 ∈ E′, v0 pode ser escrito como combinac¸a˜o linear dos vetores da base de E′, isto e´: v0 = γ1 e1 + γ2 e2 + . . .+ γn en . (1.17) O nosso problema consiste em determinar, caso poss´ıvel, as coordenadas γ1, γ2, . . . , γn de v0. Sabemos que se v− v0 deve ser ortogonal a todo vetor de E′ enta˜o e´ necessa´rio e suficiente que v− v0 seja ortogonal a todo vetor de uma base de E′ (Teorema 1.2). Enta˜o, devemos ter: (v − v0, ej) = 0 para j = 1, 2, . . . , n ; ou seja : (v − (γ1 e1 + γ2 e2 + . . .+ γn en) , ej) = 0 , j = 1, 2, . . . , n. A aplicac¸a˜o de P2 e P3, fornece: γ1 (e1, ej) + γ2 (e2, ej) + . . .+ γn (en, ej) = (v, ej) , j = 1, . . . , n . Tais equac¸o˜es sa˜o conhecidas por equac¸o˜es normais. Assim, para obtermos as coordenadas de v0 na base {e1, e2, . . . , en}, devemos resolver o sistema de equac¸o˜es lineares: (e1, e1) (e2, e1) . . . (en, e1) (e1, e2) (e2, e2) . . . (en, e2) . . . (e1, en) (e2, en) . . . (en, en) γ1 γ2 ... γn = (v, e1) (v, e2) ... (v, en) , (1.18) cuja matriz dos coeficientes e´ sime´trica. Mostremos agora que o sistema (1.18) tem uma e uma so´ soluc¸a˜o, isto e´, que o problema de deter- minac¸a˜o do vetor v0 ∈ E′, tal que v − v0 seja ortogonal a todo vetor de E′, tem soluc¸a˜o u´nica. CAPI´TULO 1. CONCEITOS BA´SICOS 20 O vetor v0 e´ denominado projec¸a˜o ortogonal de v sobre o sub-espac¸o E′. Vamos supor que nossa base de partida fosse uma base {e′1, e′2, . . . , e′n} ortonormal. Esta na˜o seria uma hipo´tese restritiva, uma vez que e´ sempre poss´ıvel passar-se de uma dada base para uma base ortonormal, (ver processo de Gram-Schmidt). Em termos da base ortonormal considerada o vetor v0 se exprimiria como: v0 = γ′1 e ′ 1 + γ ′ 2 e ′ 2 + . . .+ γ ′ n e ′ n. O sistema linear (1.18) se reduziria a: 1 © 1 . . . © 1 γ′1 γ′2 ... γ′n = (v, e′1) (v, e′2) ... (v, e′n) , ou simplesmente a: γ′j = ( v, e′j ) , j = 1, 2, . . . , n , (1.19) e portanto os γ′j seriam univocamente determinados. Sabemos que, conhecidas as coordenandas de um vetor numa base, suas coordenadas em outra qual- quer base sa˜o tambe´m univocamente determinadas. Assim, o sistema (1.18) tem uma u´nica soluc¸a˜o (γ1, γ2, . . . , γn)t e a matriz do sistema em aprec¸o e´ sempre na˜o singular. A projec¸a˜o ortogonal v0 de v sobre E′ e´, portanto, u´nica. Exemplo 1.17 - Seja E = C[−1, 1], com (f, g) = ∫ 1−1 f(x)g(x)dx. Seja K2(x) o sub-espac¸o dos po- linoˆmios de grau ≤ 2. O conjunto {L0(x) = 1, L1(x) = x, L2(x) = x2} constitui uma base de K2(x). Determinar a projec¸a˜o ortogonal de f(x) = 1x+ 4 sobre k2(x). Soluc¸a˜o: De (1.17) temos: f0 = γ0 L0(x) + γ1 L1(x) + γ2 L2(x). Assim, devemos determinar γ0, γ1, γ2. Para tanto, montamos o sistema (1.18): (L0, L0) (L1, L0) (L2, L0)(L0, L1) (L1, L1) (L2, L1) (L0, L2) (L1, L2) (L2, L2) γ0γ1 γ2 = (f, L0)(f, L1) (f, L2) ; onde: (L0, L0) = ∫ 1 −1 dx = x] 1−1 = 2 , (L1, L0) = (L0, L1) = ∫ 1 −1 x dx = x2 2 ] 1 −1 = 0 , (L2, L0) = (L0, L2) = ∫ 1 −1 x2 dx = x3 3 ] 1 −1 = 2 3 , (L1, L1) = ∫ 1 −1 x2dx = 2 3 , CAPI´TULO 1. CONCEITOS BA´SICOS 21 (L2, L1) = (L1, L2) = ∫ 1 −1 x3 dx = x4 4 ] 1 −1 = 0 , (L2, L2) = ∫ 1 −1 x4 dx = x5 5 ]1 −1 = 2 5 , (f, L0) = ∫ 1 −1 1 x+ 4 dx = (ln (x+ 4))] 1−1 = 0.51083 , (f, L1) = ∫ 1 −1 x x+ 4 dx = ∫ 1 −1 ( 1− 4 x+ 4 ) dx = (x− 4 ln (x+ 4))] 1−1 = −0.04332 , (f, L2) = ∫ 1 −1 x2 x+ 4 dx = ∫ 1 −1 ( x− 4 + 16 x+ 4 ) dx = ( x2 2 − 4 x+ 16 ln (x+ 4) )] 1 −1 = 0.17328 . Assim, obtemos o sistema linear: 2 0 2/30 2/3 0 2/3 0 2/5 γ0γ1 γ2 = 0.51083−0.04332 0.17328 , cuja soluc¸a˜o e´: γ0 = 0.24979 ; γ1 = − 0.06498 ; γ2 = 0.01688. Enta˜o, a projec¸a˜o ortogonal de f(x) = 1 x+ 4 sobre K2(x) e´: f0 = 0.24979 L0(x) − 0.06498 L1(x) + 0.01688 L2(x) = 0.24979 − 0.06498 x + 0.01688 x2. Teorema 1.7 - Teorema da Melhor Aproximac¸a˜o - Seja E′ um sub-espac¸o de dimensa˜o finita de um espac¸o euclidiano E. Se v for um vetor pertencente a E, enta˜o v0, a projec¸a˜o ortogonal de v sobre E′, sera´ a melhor aproximac¸a˜o para v no sentido de que ‖ v − v0 ‖ < ‖ v − y ‖ , (1.20) para qualquer que seja y ∈ E′, tal que y 6= v0. Prova: Devemos mostrar que a menor distaˆncia de v ao sub-espac¸o E′ e´ a distaˆncia entre v e o pe´ da perpendicular trac¸ada da extremidade de v sobre E′. (A Figura 1.3 ilustra o problema para o caso em que E = IR3 e E′ = IR2). CAPI´TULO 1. CONCEITOS BA´SICOS 22 v − y v0 − y y v0 v − v0 v � - R R 6� � � � � �� 6 - Figura 1.4 Como y, v0 ∈ E′ tambe´m v0−y ∈ E′ e e´ portanto ortogonal a v−v0. Assim, obtemos, sucessivamente: (v − y, v − y) = (v − y + v0 − v0, v − y + v0 − v0) = (v − v0, v − v0) + 2 (v − v0, v0 − y) + (v0 − y, v0 − y) . Portanto: ‖ v − y ‖2 = ‖ v − v0 ‖2 + ‖ v0 − y ‖2 . (1.21) Como, por hipo´tese, y 6= v0, conclu´ımos que ‖ v0 − y ‖ > 0. Da´ı, e da igualdade (1.21), obtemos, finalmente: ‖ v − y ‖ > ‖ v − v0 ‖ . Assim, a desigualdade (1.20) mostra que a projec¸a˜o ortogonal v0 de v sobre E′ e´ tal que a menor distaˆncia de v sobre E′ e´ a distaˆncia de v a v0. Exerc´ıcios 1.23 - Seja x = (1, 7, 10)t um vetor do IR3 em relac¸a˜o a` base canoˆnica. Considere o sub-espac¸o E′ do IR3, gerado pelos vetores f1 = (1, 1, 0)t e f2 = (0, 1, 1)t. Determine a projec¸a˜o ortogonal de x sobre E′. 1.24 - Seja E = C[0, 1], com (f, g) = ∫ 1 0 f(x)g(x)dx. Seja K2(x) o sub-espac¸o dos polinoˆmios de grau ≤ 2. O conjunto {Q0(x) = 3, Q1(x) = x− 3, Q2(x) = x2−x} constitui uma base de K2(x). Determinar a projec¸a˜o ortogonal de f(x) = 1 x4 sobre k2(x). 1.5 Auto-Valores e Auto-Vetores Nessa sec¸a˜o, investigaremos a teoria de um operador linear T num K-espac¸o vetorial V de dimensa˜o finita. Tambe´m associaremos um polinoˆmio ao operador T : seu polinoˆmio caracter´ıstico. Esse polinoˆmio e suas ra´ızes desempenham papel proeminente na investigac¸a˜o de T . Apresentaremos tambe´m alguns conceitos que sera˜o de grande utilidade na obtenc¸a˜o de me´todos para determinac¸a˜o nume´rica de auto- valores e auto-vetores de matrizes. Definic¸a˜o 1.15 - Uma transformac¸a˜o linear T de um K-espac¸o vetorial V em um K-espac¸o vetorial U , T : V → U , e´ uma correspondeˆncia que associa a cada vetor x de V um vetor T (x) em U de modo que: T (αx+ βy) = αT (x) + βT (y) ,∀x, y ∈ V,∀α, β ∈ K. CAPI´TULO 1. CONCEITOS BA´SICOS 23 Em particular, se U = V , enta˜o dizemos que T e´ um operador linear num K-espac¸o vetorial V . Definic¸a˜o 1.16 - Um escalar λ ∈ K e´ um auto-valor de T se existe um vetor na˜o nulo v ∈ V tal que: T (v) = λ v . Todo vetor v satisfazendo essa relac¸a˜o e´ um auto-vetor de T correspondente ao auto-valor λ. Observac¸o˜es: 1. Se λ e´ um auto-valor de T , enta˜o o operador linear pode apenas variar o mo´dulo e o sentido do vetor, nunca sua direc¸a˜o. 2. Os termos valor caracter´ıstico e vetor caracter´ıstico (ou valor pro´prio e vetor pro´prio) sa˜o frequen- temente usados ao inve´s de auto-valor e auto-vetor. Daremos a seguir alguns exemplos. Exemplo 1.18 - Seja I : V → V o operador identidade onde V = IRn. Determinar seus auto-valores e auto-vetores. Soluc¸a˜o: Para cada v ∈ V , temos que: I(v) = v = 1 · v . Portanto, 1 e´ auto-valor de I e todo vetor na˜o nulo em V e´ um auto-vetor correspondente ao auto-valor 1. Exemplo 1.19 - Seja D : V → V o operador diferencial onde V e´ o espac¸o vetorial das func¸o˜es dife- rencia´veis. Determinar um auto-valor de D e seu correspondente auto-vetor. Soluc¸a˜o: Temos que ekt ∈ V , e, sabemos que: D ( ekt ) = k ekt . Logo, k e´ um auto-valor de D e ekt e´ auto-vetor de D correspondente ao auto-valor k. Exemplo 1.20 - Seja T : IR2 → IR2 o operador linear que gira cada vetor v ∈ IR2 de um aˆngulo ψ. Determinar os auto-valores e correspondentes auto-vetores nos seguintes casos: a)ψ = 2npi , b)ψ = (2n+ 1)pi , c)ψ = ( 2n+ 1 2 ) pi . Soluc¸a˜o: Temos que o operador linear que gira cada vetor de um aˆngulo ψ e´ dado por uma matriz chamada matriz de rotac¸a˜o. No caso em que V = IR2 essa matriz e´ dada por: T = ( cos ψ sen ψ −sen ψ cosψ ) . Seja v ∈ IR2, enta˜o v = (v1, v2)t. Podemos considerar nos treˆs casos n = 1, visto que para valores maiores de n teremos apenas um nu´mero maior de rotac¸o˜es. Assim, para: a) ψ = 2pi, temos: ( cos 2pi sen 2pi −sen 2pi cos 2pi ) ( v1 v2 ) = ( v1 v2 ) = 1 ( v1 v2 ) , CAPI´TULO 1. CONCEITOS BA´SICOS 24 b) ψ = 3pi, temos: ( cos 3pi sen 3pi −sen 3pi cos 3pi ) ( v1 v2 ) = ( −v1 −v2 ) = −1 ( v1 v2 ) , c) ψ = 3pi2 ( cos 3pi2 sen 3pi 2 −sen 3pi2 cos 3pi2 ) ( v1 v2 ) = ( −v2 v1 ) 6= λ ( v1 v2 ) . Logo, os auto-valores de T sa˜o: 1 se ψ = 2npi , −1 se ψ = (2n+ 1)pi , e em ambos os casos todo vetor na˜o nulo do IR2 e´ auto-vetor de T . Se ψ = (2n+ 12 )pi, T na˜o tem auto-valores e portanto T na˜o tem auto-vetores. Observe que neste caso o operador linear esta´ variando a direc¸a˜o do vetor. Se A e´ uma matriz quadrada n× n sobre K, enta˜o um auto-valor de A significa um auto-valor de A encarado como operador em Kn. Isto e´, λ ∈ K e´ um auto-valor de A se, para algum vetor (coluna) na˜o nulo v ∈ Kn, Av = λv. Nesse caso, v e´ um auto-vetor de A correspondente a λ. Exemplo 1.21 - Seja: A = ( 3 4 2 1 ) . Determinar os auto-valores e auto-vetores de A. Soluc¸a˜o: Procuramos um escalar λ e um vetor na˜o nulo v = (v1, v2) t tais que Av = λv. Assim:( 3 4 2 1 ) ( v1 v2 ) = λ ( v1 v2 ) . A equac¸a˜o matricial acima e´ equivalente ao sistema homogeˆneo:{ 3v1 + 4v2 = λv1 2v1 + v2 = λv2 ou { (3− λ)v1 + 4v2 = 0 2v1 + (1− λ)v2 = 0 (1.22) Para que o sistema homogeˆneo tenha soluc¸a˜o na˜o nula, o determinante da matriz dos coeficientes deve ser igual a zero. Logo:∣∣∣∣ (3− λ) 42 (1− λ) ∣∣∣∣ = λ2 − 4λ− 5 = (λ− 5)(λ+ 1) = 0 . Assim, λ e´ um auto-valor de A se e somente se, λ = 5 ou λ = −1. Fazendo λ = 5 em (1.22), obtemos:{ −2v1 + 4v2 = 0 2v1 − 4v2 = 0 ou simplesmente, v1−2v2 = 0 ⇒ v1 = 2v2. Assim v = (v1, v2)t = (2, 1)t e´ um auto-vetor correspondente ao auto-valor λ = 5. Qualquer outro auto-vetor correspondente a λ = 5 e´ um mu´ltiplo de v. CAPI´TULO 1. CONCEITOS BA´SICOS 25 Fazendo λ = −1 em (1.22), obtemos:{ 4v1 + 4v2 = 0 2v1 + 2v2 = 0 ou simplesmente, v1 + v2 = 0 ⇒ v1 = −v2. Assim v = (v1, v2)t = (1, −1)t e´ um auto-vetor correspon- dente ao auto-valor λ = −1 e novamente, qualquer outro auto-vetor correspondente a λ−1 e´ um mu´ltiplo de v. Definic¸a˜o 1.17 - Dada uma matriz quadrada A,n× n, a matriz: A− λI = a11 − λ a12 . . . a1n a21 a22 − λ . . . a2n . . . . . . . . . . . . an1 an2 . . . ann − λ , onde I e´ a matriz identidade de ordem n e λ e´ um paraˆmetro, e´ chamada matriz caracter´ıstica de A. Seu determinante , |A−λI|, e´ um polinoˆmio de grau n em λ chamado polinoˆmio caracter´ıstico de A. Exemplo 1.22 - Seja A = ( 1 2 3 4 ) . Determinar seu polinoˆmio caracter´ıstico. Soluc¸a˜o: Para calcular o polinoˆmio caracter´ıstico de A, basta calcular o determinante de A−λI. Assim: |A− λI| = ∣∣∣∣ 1− λ 23 4− λ ∣∣∣∣ = λ2 − 5λ− 2 .︸ ︷︷ ︸ polinoˆmio caracter´istico. Exerc´ıcios 1.25 - Prove que os auto-valores de A sa˜o os zeros do polinoˆmio caracter´ıstico. 1.26 - Prove que: se λ1, λ2, . . . , λn sa˜o auto-valores de A enta˜o λk1 , λ k 2 , . . . , λ k n sa˜o auto-valores de Ak. Como ja´ dissemos anteriomente estudaremos, (no Cap´ıtulo 7), me´todos nume´ricos para determinac¸a˜o de auto-valores e auto-vetores de matrizes. Tais me´todos para serem obtidos dependem de alguns con- ceitos os quais passamos a discutir agora. Polinoˆmio de Matrizes Definic¸a˜o 1.18 Seja: P (t) = a0 tn + a1 tn−1 + . . .+ an−1 t+ an , um polinoˆmio de grau n onde os ai, i = 1, 2, . . . , n sa˜o reais. Se A e´ uma matriz quadrada real, enta˜o definimos: P (A) = a0 An + a1 An−1 + . . .+ an−1 A+ an I , como sendo o polinoˆmio da matriz A. Na expressa˜o acima I e´ a matriz identidade. Em particular, se P (A) = θ, (matriz nula), dizemos que A e´ um zero de P (t). CAPI´TULO 1. CONCEITOS BA´SICOS 26 Exemplo 1.23 - Seja A = ( 1 2 3 4 ) . Calcular P (A) e Q(A), sabendo que: P (t) = 2t3 − 3t + 7 e Q(t) = t2 − 5t− 2. Soluc¸a˜o: Temos que: P (A) = 2 ( 1 2 3 4 )3 − 3 ( 1 2 3 4 ) + 7 ( 1 0 0 1 ) = ( 18 14 21 39 ) , e Q(A) = ( 1 2 3 4 )2 − 5 ( 1 2 3 4 ) − 2 ( 1 0 0 1 ) = ( 0 0 0 0 ) . Assim, A e´ um zero de Q(t). Note que Q(t) e´ o polinoˆmio caracter´ıstico de A. Teorema 1.8 - (Teorema de Cayley-Hamilton) - Toda matriz e´ um zero do seu polinoˆmio caracter´ıstico. Prova: A prova desse teorema pode ser encontrada em [Barnett, 1990 ]. Transformac¸o˜es de Similaridades (ou Semelhanc¸a) Existem me´todos nume´ricos que determinam todos os auto-valores de uma matriz sem determinar a expressa˜o do polinoˆmio caracter´ıstico. Tais me´todos sa˜o obtidos usando-se transformac¸o˜es de similari- dade. Definic¸a˜o 1.19 - Uma matriz B e´ similar (ou semelhante) a uma matriz A se ∃ uma matriz C na˜o singular tal que: B = C−1AC , e dizemos que B foi obtida de A por transformac¸a˜o de semelhanc¸a. Teorema 1.9 - Sejam A e B matrizes similares. Enta˜o: i) A e B possuem os mesmos auto-valores. ii) Se v e´ auto-vetor de A associado a λ, enta˜o C−1v e´ auto-vetor de B = C−1AC associado a λ. Prova: Seja B = C−1AC, e suponha que λ e´ auto-valor de A e v seu correspondente auto-vetor. Temos enta˜o, que det(A− λI) e´ o polinoˆmio caracter´ıstico de A. i) Temos : det(B − λI) = det(C−1AC − λI) = det(C−1(A− λI)C) = detC−1det(A− λI)detC = det(A− λI)det(C−1C︸ ︷︷ ︸ =I ) = det(A− λI) . Portanto A e B possuem o mesmo polinoˆmio caracter´ıstico. Logo λ e´ auto-valor de B. ii) Agora Av = λv e desde que B = C−1AC ⇒ A = CBC−1. Portanto CBC−1v = λv. Assim: BC−1v = C−1λv = λC−1v . Portanto B(C−1v) = λ(C−1v). Logo C−1v e´ auto-vetor de B associado ao auto-valor λ. CAPI´TULO 1. CONCEITOS BA´SICOS 27 Lema 1.1 - Seja A uma matriz de ordem n com auto-valores λi e correspondentes auto-vetores vi, os quais vamos supor sejam linearmente independentes, e seja D = λ1 © λ2 λ3 . . . © λn . Enta˜o D = V −1AV se e somente a i-e´sima coluna de V e´ vi. Prova: Se a i-e´sima coluna de V e´ denotada por vi enta˜o a i-e´sima coluna de AV e V D sa˜o, Avi e λivi, respectivamente. Portanto os vetores vi sa˜o os auto-vetores de A se e somente se AV = V D. Esta equac¸a˜o pode ser rearranjada como: V −1AV desde que V seja invers´ıvel, e este e´ o caso pois as colunas de V sa˜o linearmente independentes. Matriz de Rotac¸a˜o e Matriz Ortogonal Alguns me´todos nume´ricos sa˜o obtidos usando-se matrizes que possuem caracter´ısticas especiais. As- sim, passamos a descrever tais matrizes. No IR2 as matrizes: ( cos ϕ sen ϕ −sen ϕ cos ϕ ) , ( cos ϕ −sen ϕ sen ϕ cos ϕ ) , rotacionam cada vetor do IR2, no sentido hora´rio e anti-hora´rio, respectivamente, de um aˆngulo ϕ, e porisso sa˜o chamadas de Matrizes de Rotac¸a˜o. No IR3 a matriz: cos ϕ 0 sen ϕ0 1 0 −sen ϕ 0 cos ϕ , e´ uma matriz de rotac¸a˜o, no sentido hora´rio, de um aˆngulo ϕ no plano x, z. No IRn a matriz: U = 1 . . . 1 cos ϕ 0 . . . 0 sen ϕ 1 ... . . . 1 −sen ϕ 0 . . . 0 cos ϕ . . . 1 (1.23) onde: upp = uqq = cosϕ upg = −uqp = senϕ uij = 1, i 6= p, i 6= q uij = 0, no resto CAPI´TULO 1. CONCEITOS BA´SICOS 28 e´ uma matriz de rotac¸a˜o de um aˆngulo ϕ no plano dos eixos p e q. Uma Matriz Ortogonal U e´ caracterizada por: U tU = UU t = I , onde I: matriz identidade. Portanto U t = U−1. Observe que matrizes de rotac¸a˜o sa˜o matrizes ortogonais. Propriedades de Matrizes Ortogonais 1) As linhas de U satisfazem: n∑ j=1 (uij)2 = 1 (produto de uma linha por ela mesma) , n∑ j=1 i 6=k uij ukj = 0 (produto de duas linhas distintas) . 2) ||Ux|| = ||x||, ∀x ∈ IRn. 3) A transformac¸a˜o ortogonal na˜o muda os aˆngulos entre dois vetores. Portanto uma transformac¸a˜o ortogonal ou e´ uma rotac¸a˜o ou e´ uma reflexa˜o. 4) Os auto-valores sa˜o: 1 ou -1. 5) O determinante e´ 1 ou -1. Para finalizar essa sec¸a˜o daremos um teorema que nos permite ter uma ide´ia da localizac¸a˜o dos auto- valores de uma matriz, seja ela sime´trica ou na˜o. Os auto-valores de matrizes na˜o sime´tricas podem, e´ lo´gico, serem complexos, e nestes casos o teorema fornece a localizac¸a˜o destes nu´meros no plano complexo. Existem situac¸o˜es onde na˜o e´ necessa´rio obter os auto-valores com muita precisa˜o, isto e´, existem ocasio˜es onde o que desejamos e´ saber se os auto-valores sa˜o positivos ou enta˜o se esta˜o contidos no c´ırculo unita´rio. O Teorema a seguir pode ser usado para responder a estas perguntas sem a necessidade de ca´lculos detalhados. Teorema 1.10 - Teoremas de Gerschgorin a) Primeiro Teorema de Gerschgorin - Os auto-valores de uma matriz A = (aij) esta˜o na reunia˜o dos c´ırculos de centro aii e raio ri = n∑ j=1 j 6=i |aij | , i = 1, 2, . . . , n , no plano complexo. b) Segundo Teorema de Gerschgorin - Se a unia˜o de q desses c´ırculos formam uma regia˜o conectada, isolada dos c´ırculos restantes, enta˜o existe q auto-valores nessa regia˜o. Prova: A prova deste teorema pode ser encontrada em [Wilkison, 1965]. CAPI´TULO 1. CONCEITOS BA´SICOS 29 Exemplo 1.24 - Localizar, usando o teorema de Gerschgorin, os auto-valores de: A = 4 −1 11 1 1 −2 0 −6 , B = 3 1 01 2 −1 0 −1 0 . Soluc¸a˜o: Os c´ırculos de Gerschgorin associados com a matriz A sa˜o dados por: C´ırculo Centro Raio C1 a11 = 4 r1 = | − 1|+ |1| = 2 C2 a22 = 1 r2 = |1|+ |1| = 2 C3 a33 = −6 r3 = | − 2|+ |0| = 2 Assim para a matriz A, obtemos os c´ırculos ilustrados na Figura 1.5: C3 C2 C1 � �� �2 @ @@ I 2 � �� �2 4 6 eixo imagina´rio 1−6 eixo real - Figura 1.5 O primeiro teorema de Gerschgorin indica que os auto-valores de A esta˜o inseridos nas regio˜es ha- churadas da Figura 1.5. Ale´m disso, desde que C1 ⋃ C2 na˜o intercepta C3, pelo segundo teorema de Gerschgorin, dois desses auto-valores esta˜o em C1 ⋃ C2 e os restantes dos auto-valores em C3. Para a matriz B, temos que os c´ırculos de Gerschgorin associados com essa matriz, sa˜o dados por: C´ırculo Centro Raio C1 b11 = 3 r1 = |1|+ |0| = 1 C2 b22 = 2 r2 = |1|+ | − 1| = 2 C3 b33 = 0 r3 = |0|+ | − 1| = 1 os quais esta˜o ilustrados na Figura 1.6. 0 C3 C2 C1 1 2 1 @@ I @ @ @I @@ I 6 2 3 Figura 1.6 - Podemos afirmar neste caso, usando os teoremas de Gerschgorin, que os auto-valores da matriz B esta˜o no intervalo [−1, 4], pois a matriz e´ real e sime´trica. CAPI´TULO 1. CONCEITOS BA´SICOS 30 Exerc´ıcios 1.27 - Dada as seguintes matrizes: A = ( 1 2 3 4 ) , B = 1 2 −1−1 0 1 2 1 −1 , calcule o polinoˆmio caracter´ıstico, seus auto-valores e auto-vetores. 1.28 - Seja A = ( 1 2 3 2 ) . Calcule os auto-valores de A,A2, A3. 1.29 - Seja A = ( 1 2 2 −1 ) . Calcular P (A) e Q(A), sabendo que: P (t) = 2t2 − 3t + 7 e Q(t) = t2 − 5. 1.6 Exerc´ıcios Complementares 1.30 - Se x = (1, 2, 3, 4)t e y = (0, 3, −2, 1)t, calcule: a) (x, y) (usando definic¸a˜o usual de produto escalar), b) ‖ x ‖ e ‖ y ‖, 1.31 - Mostre que num espac¸o euclidiano vale o Teorema de Pita´goras, isto e´: x ⊥ y =⇒ ‖ x+ y ‖2 = ‖ x ‖2 + ‖ y ‖2 . 1.32 - Mostre que num espac¸o euclidiano, vale: | ‖ x ‖ − ‖ y ‖ | ≤ ‖ x− y ‖ . 1.33 - Sejam x = (x1, x2)t e y = (y1, y2)t vetores do IR2. a) Prove que: (x, y) = x1 y1 − 2 x1 y2 − 2 x2 y1 + 5 x2 y2 , define um produto escalar no IR2. . b) Determine a norma de x = (1, 2)t ∈ IR2, em relac¸a˜o ao produto escalar do item a). 1.34 - Os vetores {(1, 1, 0)t, (0, 1, 1)t, (1, 0, 1)t} constituem uma base na˜o ortonormal do IR3. Construir a partir desses vetores, uma base ortonormal para o IR3, usando o processo de Gram-Schmidt. 1.35 - Obter, no intervalo [0, 1], uma sequeˆncia ortonormal de polinoˆmios, relativamente ao produto escalar.: (f, g) = ∫ 1 0 f(x) g(x) dx . 1.36 - Considere o espac¸o dos polinoˆmios de grau ≤ 2 com o produto escalar: (Pi, Pj) = ∫ 1 0 Pi(t) Pj(t) dt . Dada nesse espac¸o a base {3, t − 3, t2 − t}, obtenha a partir dela uma base ortogonal, usando o processo de Gram-Schmidt. CAPI´TULO 1. CONCEITOS BA´SICOS 31 1.37 - Sejam e1, e2, e3 a base canoˆnica do IR3, e seja v = (1, 1, 2)t. Determinar a projec¸a˜o ortogonal de v sobre o plano {e1, e2}. 1.38 - Seja E = C[1, 2], com (f, g) = ∫ 2 1 f(x)g(x)dx. Seja K1(x) o sub-espac¸o dos polinoˆmios de grau ≤ 1. O conjunto {1, x} constitui uma base de K1(x). Determinar a projec¸a˜o ortogonal de f(x) = ex sobre k1(x). 1.39 - Resolva o exerc´ıcio 1.24, usando para o sub-espac¸o a base ortogonal obtida no exerc´ıcio 1.36. Compare os resultados. 1.40 - Para cada uma das matrizes: A = ( −2 5 1 −3 ) , A = 1 4 30 3 1 0 2 −1 , encontre um polinoˆmio que tenha a matriz como raiz. 1.41 - Seja A uma matriz quadrada de ordem n e sejam λ1, λ2, · · · , λn seus auto-valores. Quais sa˜o os auto-valores de A− qI onde q e´ uma constante e I e´ a matriz identidade? 1.42 - Mostre que se v e´ auto-vetor de A e de B enta˜o v e´ auto-vetor de αA + βB, onde α, β sa˜o escalares quaisquer. 1.43 - Mostre que uma matriz A e sua transposta At possuem o mesmo polinoˆmio caracter´ıstico. 1.44 - Usando o Teorema 1.10, localizar os auto-valores das seguintes matrizes: A = 2 −1 0−1 2 −1 0 −1 1 , B = 4 0 1−2 1 0 −2 0 1 . Cap´ıtulo 2 Ana´lise de Arredondamento em Ponto Flutuante 2.1 Introduc¸a˜o Neste cap´ıtulo, chamamos atenc¸a˜o para o fato de que o conjunto dos nu´meros representa´veis em qualquer ma´quina e´ finito, e portanto discreto, ou seja na˜o e´ poss´ıvel representar em uma ma´quina todos os nu´meros de um dado intervalo [a, b]. A implicac¸a˜o imediata desse fato e´ que o resultado de uma simples operac¸a˜o aritme´tica ou o ca´lculo de uma func¸a˜o, realizadas com esses nu´meros, podem conter erros. A menos que medidas apropriadas sejam tomadas, essas impreciso˜es causadas, por exemplo, por simplificac¸a˜o no modelo matema´tico (algumas vezes necessa´rias para se obter um modelo matema´tico solu´vel); erro de truncamento (troca de uma se´rie infinita por uma finita); erro de arredondamento (devido a pro´pria estrutura da ma´quina); erro nos dados (dados imprecisos obtidos de experimentos, ou arredondados na entrada); etc, podem diminuir e algumas vezes destruir, a precisa˜o dos resultados, mesmo em precisa˜o dupla. Assim, nosso objetivo aqui sera´ o de alertar o leitor para os problemas que possam surgir durante a resoluc¸a˜o de um problema, bem como dar subs´ıdios para evita´-los e para uma melhor interpretac¸a˜o dos resultados obtidos. 2.2 Sistema de Nu´meros Discreto no Computador Inicialmente, descreveremos como os nu´meros sa˜o representados num computador. Representac¸a˜o de um Nu´mero Inteiro Em princ´ıpio, a representac¸a˜o de um nu´mero inteiro no computador na˜o apresenta qualquer difi- culdade. Qualquer computador trabalha internamente com uma base fixa β, onde β e´ um inteiro ≥ 2; e e´ escolhido como uma poteˆncia de 2. Assim dado um nu´mero inteiro n 6= 0, ele possui uma u´nica representac¸a˜o, n = ±(n−kn−k+1 . . . n−1n0) = ±(n0β0 + n−1β1 + . . . n−kβk), onde os ni, i = 0,−1, . . . ,−k sa˜o inteiros satisfazendo 0 ≤ ni < β e n−k 6= 0. 32 CAPI´TULO 2. ANA´LISE DE ARREDONDAMENTO EM PONTO FLUTUANTE 33 Por exemplo, na base β = 10, o nu´mero 1997 e´ representado por: 1997 = 7× 100 + 9× 101 + 9× 102 + 1× 103 , e e´ armazenado como n−3n−2n−1n0. Representac¸a˜o de um nu´mero real A representac¸a˜o de um nu´mero real no computador pode ser feita de duas maneiras: a) Representac¸a˜o em ponto fixo Este foi o sistema usado, no passado, por muitos computadores. Assim, dado um nu´mero real, x 6= 0, ele sera´ representado em ponto fixo por: x = ± n∑ i=k xi β −i , onde k e n sa˜o inteiros satisfazendo k < n e usualmente k ≤ 0 e n > 0 e os xi sa˜o inteiros satisfazendo 0 ≤ xi < β. Por exemplo, na base β = 10, o nu´mero 1997.16 e´ representado por: 1997.16 = 2∑ i=−3 xiβ −i = 1× 103 + 9× 102 + 9× 101 + 7× 100 + 1× 10−1 + 6× 10−2 = 1× 1000 + 9× 100 + 9× 10 + 7× 1 + 1× 0.1 + 6× 0.01 , e e´ armazenado como x−3x−2x−1x0.x1x2. b) Representac¸a˜o em Ponto Flutuante Esta representac¸a˜o, que e´ mais flex´ıvel que a representac¸a˜o em ponto fixo, e´ universalmente utilizada nos dias atuais. Dado um nu´mero real, x 6= 0, este sera´ representado em ponto flutuante por: x = ± d× βe , onde β e´ a base do sistema de numerac¸a˜o, d e´ a mantissa e e e´ o expoente. A mantissa e´ um nu´mero em ponto fixo, isto e´: d = n∑ i=k di β −i , onde, frequentemente, nos grandes computadores, k = 1, tal que se x 6= 0, enta˜o d1 6= 0; 0 ≤ di < β, i = 1, 2, . . . t, com t a quantidade de d´ıgitos significativos ou precisa˜o do sistema , β−1 ≤ d < 1 e −m ≤ e ≤M . Observac¸o˜es: a) d1 6= 0 caracteriza o sistema de nu´meros em ponto flutuante normalizado. b) o nu´mero zero pertence a qualquer sistema e e´ representado com mantissa igual a zero e e = −m. CAPI´TULO 2. ANA´LISE DE ARREDONDAMENTO EM PONTO FLUTUANTE 34 Exemplo 2.1 - Escrever os nu´meros: x1 = 0.35; x2 = −5.172; x3 = 0.0123; x4 = 5391.3 e x5 = 0.0003 , onde todos esta˜o na base β = 10, em ponto flutuante na forma normalizada. Soluc¸a˜o: Temos enta˜o: 0.35 = (3× 10−1 + 5× 10−2)× 100 = 0.35× 100 , −5.172 = −(5× 10−1 + 1× 10−2 + 7× 10−3 + 2× 10−4)× 101 = −0.5712× 101 , 0.0123 = (1× 10−1 + 2× 10−2 + 3× 10−3)× 10−1 = 0.123× 10−1 , 5391.3 = (5× 10−1 + 3× 10−2 + 9× 10−3 + 1× 10−4 + 3× 10−5)× 104 = 0.53913× 104 , 0.0003 = (3× 10−1)× 10−3 = 0.3× 10−3 . Agora, para representarmos um sistema de nu´meros em ponto flutuante normalizado, na base β, com t d´ıgitos significativos e com limites do expoente m e M , usaremos a notac¸a˜o: F(β, t,m,M). Assim um nu´mero em F (β, t,m,M) sera´ representado por: ± 0.d1d2 . . . dt × βe , onde d1 6= 0 e −m ≤ e ≤M . Exemplo 2.2 - Considere o sistema F (10, 3, 2, 2). Represente nesse sistema os nu´meros do exemplo anterior. Soluc¸a˜o: Temos enta˜o que nesse sistema um nu´mero sera´ representado por ± 0.d1d2d3 × 10e, onde −2 ≤ e ≤ 2. Assim: 0.35 = 0.350× 100 , −5.172 = −0.517× 101 , 0.0123 = 0.123× 10−1 , Observe que os nu´meros 5391.3 e 0.0003 na˜o podem ser representados no sistema. De fato, o nu´mero 5391.3 = 0.539 × 104 e portanto o expoente e´ maior que 2, causando overflow, por outro lado 0.0003 = 0.300× 10−3 e assim o expoente e´ menor que -2 causando underflow. Podemos enta˜o definir formalmente d´ıgitos significativos de um nu´mero. Definic¸a˜o 2.1 - Seja β a base do sistema de nu´meros em ponto flutuante. Dı´gitos significativos de um nu´mero x, sa˜o todos os algarismos de 0 a β − 1, desde que x esteja representado na forma normalizada. Para exemplificar as limitac¸o˜es da ma´quina, consideremos agora o seguinte exemplo. Exemplo 2.3 - Seja f(x) uma func¸a˜o cont´ınua real definida no intervalo [a, b], a < b e sejam f(a) < 0 e f(b) > 0. Enta˜o de acordo com o teorema do valor intermedia´rio, existe x, a < x < b tal que f(x) = 0. Seja f(x) = x3 − 3. Determinar x tal que f(x) = 0. Soluc¸a˜o: Para a func¸a˜o dada , consideremos t = 10 e β = 10. Obtemos enta˜o: f(0.1442249570× 101) = −0.2× 10−8 ; f(0.1442249571× 101) = 0.4× 10−8 . Observe que entre 0.1442249570 × 101 e 0.1442249571 × 101 na˜o existe nenhum nu´mero que possa ser representado no sistema dado e que a func¸a˜o f muda de sinal nos extremos desse intervalo. Assim, esta ma´quina na˜o conte´m o nu´mero x tal que f(x) = 0 e portanto a equac¸a˜o dada na˜o possui soluc¸a˜o. CAPI´TULO 2. ANA´LISE DE ARREDONDAMENTO EM PONTO FLUTUANTE 35 Exerc´ıcios 2.1 - Considere o sistema F (10, 4, 4, 4). Represente neste sistema os nu´meros: x1 = 4321.24, x2 = −0.0013523, x3 = 125.64, x4 = 57481.23 e x5 = 0.00034. 2.2 - Represente no sistema F (10, 3, 1, 3) os nu´meros do exerc´ıcio 2.1. Mudanc¸a de Base Como ja´ dissemos anteriormente a maioria dos computadores trabalham na base β onde β e´ um inteiro ≥ 2; e e´ normalmente escolhido como uma poteˆncia de 2. Assim um mesmo nu´mero pode ser representado em mais do que uma base. Ale´m disso sabemos que, atrave´s de uma mudanc¸a de base, e´ sempre poss´ıvel determinar a representac¸a˜o em uma nova base. Veremos enta˜o, atrave´s de exemplos, como se faz mudanc¸a de base. Exemplo 2.4 - Mudar a representac¸a˜o dos nu´meros: i) 1101 da base 2, para a base 10, ii) 0.110 da base 2, para a base 10, iii) 13 da base 10, para a base 2, iv) 0.75 da base 10, para a base 2, v) 3.8 da base 10, para a base 2. Soluc¸a˜o: Para cada nu´mero daremos qual o procedimento a ser seguido. Assim: i) 1101 que esta´ na base 2, para a base 10. Neste caso o procedimento e´ multiplicar cada algarismo do nu´mero na base 2 por poteˆncias crescente de 2, da direita para a esquerda e somar todas as parcelas. Assim: 1101 = 1× 20 + 0× 21 + 1× 22 + 1× 23 = 1 + 0 + 4 + 8 = 13 . Logo, (1101)2 = (13)10. ii) 0.110 que esta´ na base 2, para a base 10. Neste caso o procedimento e´ multiplicar cada algarismo do nu´mero na base 2, apo´s o ponto, por poteˆncias decrescente de 2, da esquerda para a direita e somar todas as parcelas. Assim: 0.110 = 1× 2−1 + 1× 2−2 + 0× 2−3 = 1 2 + 1 4 + 0 = 0.75 . Logo, (0.110)2 = (0.75)10. iii) 13 que esta´ na base 10, para a base 2. CAPI´TULO 2. ANA´LISE DE ARREDONDAMENTO EM PONTO FLUTUANTE 36 Neste caso o procedimento e´ dividir o nu´mero por 2. A seguir continuar dividindo o quociente por 2 ate´ que o u´ltimo quociente seja igual a 1. O nu´mero na base 2 sera´ enta˜o obtido tomando-se o u´ltimo quociente e todos os restos das diviso˜es anteriores. Assim: 13 | 2 1 6 | 2 0 3 | 2 1 1 Logo, (13)10 = (1101)2. iv) 0.75 que esta´ na base 10, para a base 2. Neste caso o procedimento e´ multiplicar a parte decimal por 2. A seguir continuar multiplicando a parte decimal do resultado obtido, por 2. O nu´mero na base 2 sera´ enta˜o obtido tomando-se a parte inteira do resultado de cada multiplicac¸a˜o. Assim: 0.75× 2 = 1.50 0.50× 2 = 1.00 0.00× 2 = 0.00 Logo, (0.75)10 = (0.110)2. v) 3.8 que esta´ na base 10, para a base 2. O procedimento neste caso e´ transformar a parte inteira seguindo o item iii) o que nos fornece (3)10 = (11)2 e a parte decimal seguindo o item iv). Assim, obtemos: 0.8× 2 = 1.6 0.6× 2 = 1.2 0.2× 2 = 0.4 0.4× 2 = 0.8 0.8× 2 = . . . Logo, (3.8)10 = (11.11001100 . . .)2. Portanto o nu´mero (3.8)10 na˜o tem representac¸a˜o exata na base 2. Esse exemplo ilustra tambe´m o caso de erro de arredondamento nos dados. No exemplo 2.4, mudamos a representac¸a˜o de nu´meros na base 10 para a base 2 e vice-versa. O mesmo procedimento pode ser utilizado para mudar da base 10 para uma outra base qualquer e vice- versa. A pergunta que surge naturalmente e´: qual o procedimento para representar um nu´mero que esta´ numa dada base β1 em uma outra base β2, onde β1 6= β2 6= 10? Nesse caso devemos seguir o seguinte procedimento: inicialmente representamos o nu´mero que esta´ na base β1 na base 10 e a seguir o nu´mero obtido na base 10, na base β2. Exemplo 2.5 - Dado o nu´mero 12.20 que esta´ na base 4, representa´-lo na base 3. Soluc¸a˜o: Assim, usando os procedimentos dados no exemplo 2.4, obtemos: 12 = 2× 40 + 1× 41 = 6. 0.20 = 2× 4−1 + 0× 4−2 = 2 4 = 0.5 . CAPI´TULO 2. ANA´LISE DE ARREDONDAMENTO EM PONTO FLUTUANTE 37 Portanto: (12.20)4 = (6.5)10. Agora: 6 | 3 0 2 0.5× 3 = 1.5 0.5× 3 = 1.5 ... Portanto: (6.5)10 = (20.11 . . .)3. Logo (12.20)4 = (20.111 . . .)3. Observe que o nu´mero dado na base 4, tem representac¸a˜o exata na base 10, mas na˜o na base 3. Exerc´ıcios 2.3 - Considere os seguintes nu´meros: x1 = 34, x2 = 0.125 e x3 = 33.023 que esta˜o na base 10. Escreva-os na base 2. 2.4 - Considere os seguintes nu´meros: x1 = 110111, x2 = 0.01011 e x3 = 11.0101 que esta˜o na base 2. Escreva-os na base 10. 2.5 - Considere os seguintes nu´meros: x1 = 33, x2 = 0.132 e x3 = 32.013 que esta˜o na base 4. Escreva-os na base 5. 2.3 Representac¸a˜o de Nu´meros no Sistema F (β, t,m,M) Sabemos que os nu´meros reais podem ser representados por uma reta cont´ınua. Entretanto, em ponto flutuante podemos representar apenas pontos discretos na reta real. Para ilustrar este fato consideremos o seguinte exemplo. Exemplo 2.6 - Quantos e quais nu´meros podem ser representados no sistema F (2, 3, 1, 2)? Soluc¸a˜o: Temos que β = 2 enta˜o os d´ıgitos podem ser 0 ou 1; m = 1 e M = 2 enta˜o −1 ≤ e ≤ 2 e t = 3. Assim, os nu´meros sa˜o da forma : ± 0.d1d2d3 × βe . Logo temos: duas possiblidades para o sinal, uma possiblidade para d1, duas para d2 , duas para d3 e quatro para as formas de βe. Fazendo o produto 2 × 1 × 2 × 2 × 4 obtemos 32. Assim neste sistema podemos representar 33 nu´meros visto que o zero faz parte de qualquer sistema. Para responder quais sa˜o os nu´meros, notemos que as formas da mantissa sa˜o : 0.100, 0.101, 0.110 e 0.111 e as formas de βe sa˜o: 2−1, 20, 21, 22. Assim, obtemos os seguintes nu´meros: 0.100× 2−1 = (0.25)10 20 = (0.5)10 21 = (1.0)10 22 = (2.0)10 , desde que (0.100)2 = (0.5)10; 0.101× 2−1 = (0.3125)10 20 = (0.625)10 21 = (1.25)10 22 = (2.5)10 , CAPI´TULO 2. ANA´LISE DE ARREDONDAMENTO EM PONTO FLUTUANTE 38 desde que (0.101)2 = (0.625)10; 0.110× 2−1 = (0.375)10 20 = (0.75)10 21 = (1.5)10 22 = (3.0)10 , desde que (0.110)2 = (0.75)10; 0.111× 2−1 = (0.4375)10 20 = (0.875)10 21 = (1.75)10 22 = (3.5)10 , desde que (0.111)2 = (0.875)10 . Exemplo 2.7 - Considerando o mesmo sistema do exemplo 2.6, represente os nu´meros: x1 = 0.38, x2 = 5.3 e x3 = 0.15 dados na base 10. Soluc¸a˜o: Fazendo os ca´lculos obtemos que: (0.38)10 = 0.110× 2−1, (5.3)10 = 0.101× 23 e (0.15)10 = 0.100 × 2−2. Assim apenas o primeiro nu´mero pode ser representado no sistema, pois para o segundo teremos overflow e para o terceiro underflow. Observe que o nu´mero (0.38)10 tem no sistema dado, a mesma representac¸a˜o que o nu´mero (0.375)10 . Exerc´ıcios 2.6 - Considere o sistema F (3, 3, 2, 1). a) Quantos e quais nu´meros podemos representar neste sistema? b) Represente no sistema os nu´meros: x1 = (0.40)10, x2 = (2.8)10. 2.7 - Considere o sistema F (2, 5, 3, 1). a) Quantos nu´meros podemos representar neste sistema? b) Qual o maior nu´mero na base 10 que podemos representar neste sistema (sem fazer arredonda- mento)? Todas as operac¸o˜es num computador sa˜o arredondadas. Para ilustrar este fato, consideremos o seguinte exemplo. Exemplo 2.8 - Calcular o quociente entre 15 e 7. Soluc¸a˜o: Temos treˆs representac¸o˜es alternativas: x1 = 15 7 , x2 = 2 1 7 , x3 = 2.142857. Note que x1 e x2 sa˜o representac¸o˜es exatas e x3 e´ uma aproximac¸a˜o do quociente. Suponha agora que so´ dispomos de 4 d´ıgitos para representar o quociente 157 . Da´ı, 15 7 = 2.142. Mas na˜o seria melhor aproximarmos 157 por 2.143? A resposta e´ sim e isso significa que o nu´mero foi arredondado. Mas o que significa arredondar um nu´mero? CAPI´TULO 2. ANA´LISE DE ARREDONDAMENTO EM PONTO FLUTUANTE 39 Arredondamento em Ponto Flutuante Definic¸a˜o 2.2 - Arredondar um nu´mero x, por outro com um nu´mero menor de d´ıgitos significativos, consiste em encontrar um nu´mero x¯, pertecente ao sistema de numerac¸a˜o, tal que |x¯ − x| seja o menor poss´ıvel. Assim para o exemplo dado |2.142− x3| = 0.000857 e |2.143− x3| = 0.000143. Logo 2.143 representa a melhor aproximac¸a˜o para 157 , usando 4 d´ıgitos significativos. Daremos a seguir a regra de como arredondar um nu´mero. Dado x, seja x¯ sua representac¸a˜o em F (β, t,m,M) adotando arredondamento. Se x = 0 enta˜o x¯ = 0. Se x 6= 0, enta˜o escolhemos s e e tais que: |x| = s× βe onde β−1(1− 1 2 β−t) ≤ s < 1− 1 2 β−t. (2.1) Se e esta´ fora do intervalo [−m,M ] na˜o temos condic¸o˜es de representar o nu´mero no sistema. Se e ∈ [−m,M ] enta˜o calculamos: s+ 1 2 β−t = 0.d1d2 . . . dtdt+1 . . . e truncamos em t d´ıgitos. Assim o nu´mero arredondado sera´: x¯ = (sinalx)(0.d1d2 . . . dt)× βe. Exemplo 2.9 - Considere o sistema F (10, 3, 5, 5). Represente neste sistema os nu´meros: x1 = 1234.56, x2 = −0.00054962, x3 = 0.9995, x4 = 123456.7 e x5 = −0.0000001 . Soluc¸a˜o: Primeiramente, analisemos quais os valores permitidos para s. Desde que β = 10 e t = 3, usando (2.1), segue que: 10−1(1− 1 2 10−3) ≤ s < 1− 1 2 10−3 , e fazendo os ca´lculos obtemos que: 0.09995 ≤ s < 0.9995 . Podemos agora tentar representar os nu´meros no sistema dado. Assim: i) Para x1 = 1234.56, obtemos: |x1| = 0.123456× 104, s+ 1210 −3 = 0.123456 + 0.0005 = 0.123956, x¯1 = 0.123× 104 ; ii) para x2 = −0.00054962, obtemos: |x2| = 0.54962× 10−3, s+ 1210 −3 = 0.54962 + 0.0005 = 0.55012, x¯2 = −0.550× 10−3 ; CAPI´TULO 2. ANA´LISE DE ARREDONDAMENTO EM PONTO FLUTUANTE 40 iii) para x3 = 0.9995, observe que na˜o podemos considerar |x3| = 0.9995 × 100, pois neste caso s na˜o pertence ao seu intervalo, e o nu´mero arredondado na˜o estaria escrito na forma dos elementos do sistema. Assim neste caso consideramos: |x3| = 0.09995× 101, s+ 1210 −3 = 0.09995 + 0.0005 = 0.10045, x¯3 = 0.100× 101 ; iv) para x4 = 123456.7, obtemos: |x4| = 0.1234567× 106, v) para x5 = −0.0000001, obtemos: |x5| = 0.1× 10−6 . Observe que tanto em iv) como em v) na˜o podemos representar o nu´mero no sistema dado pois em iv) teremos overflow e em v) underflow. Assim, em linhas gerais, para arredondar um nu´mero, na base 10, devemos apenas observar o primeiro d´ıgito a ser descartado. Se este d´ıgito e´ menor que 5 deixamos os d´ıgitos inalterados e se e´ maior ou igual a 5 devemos somar 1 ao u´ltimo d´ıgito remanescente. Exerc´ıcio 2.8 - Considere o sistema F (10, 4, 4, 4). a) Qual o intervalo para s neste caso? b) Represente os nu´meros do exemplo 2.9 nesse sistema. 2.4 Operac¸o˜es Aritme´ticas em Ponto Flutuante Considere uma ma´quina qualquer e uma se´rie de operac¸o˜es aritme´ticas. Pelo fato do arredondamento ser feito apo´s cada operac¸a˜o temos, ao contra´rio do que e´ va´lido para nu´meros reais, que as operac¸o˜es aritme´ticas (adic¸a˜o, subtrac¸a˜o, divisa˜o e multiplicac¸a˜o) na˜o sa˜o nem associativas e nem distributivas. Ilustraremos esse fato atrave´s de exemplos. Nos exemplos desta sec¸a˜o considere o sistema com base β = 10, e 3 d´ıgitos significativos. Exemplo 2.10 - Efetue as operac¸o˜es indicadas: i) (11.4 + 3.18) + 5.05 e 11.4 + (3.18 + 5.05) , ii) 3.18× 11.45.05 e ( 3.18 5.05 ) × 11.4 , iii) 3.18× (5.05 + 11.4) e 3.18× 5.05 + 3.18× 11.4 . CAPI´TULO 2. ANA´LISE DE ARREDONDAMENTO EM PONTO FLUTUANTE 41 Soluc¸a˜o: Para cada item, fazendo o arredondamento apo´s cada uma das operac¸o˜es efetuada, segue que: i) (11.4 + 3.18) + 5.05 = 14.6 + 5.05 = 19.7 , enquanto 11.4 + (3.18 + 5.05) = 11.4 + 8.23 = 19.6 . ii) 3.18× 11.45.05 = 36.35.05 = 7.19 , enquanto ( 3.18 5.05 ) × 11.4 = 0.630× 11.4 = 7.18 . iii) 3.18× (5.05 + 11.4) = 3.18× 16.5 = 52.3 , enquanto 3.18× 5.05 + 3.18× 11.4 = 16.1 + 36.3 = 52.4 . Exemplo 2.11 - Somar 13 dez vezes consecutivas usando arredondamento. Soluc¸a˜o: Temos enta˜o: 0.333 + 0.333 + . . .+ 0.333︸ ︷︷ ︸ 10 vezes = 3.31 . Entretanto podemos obter um resultado melhor se multiplicarmos 0.333 por 10, obtendo assim 3.33. Exemplo 2.12 - Avaliar o polinoˆmio P (x) = x3 − 6 x2 + 4 x − 0.1 , no ponto 5.24 e comparar com o resultado exato. Soluc¸a˜o: Para calcular o valor exato consideremos todos os d´ıgitos de uma ma´quina, sem usar arredon- damento a cada operac¸a˜o. Assim: P (5.24) = 143.8777824 − 164.7456 + 20.96 − 0.1 = −0.00776 ( valor exato). Agora, usando arredondamento a cada operac¸a˜o efetuada, obtemos: P (5.24) = 5.24× 27.5 − 6× 27.5 + 4× 5.24 − 0.1 = 144. − 165. + 21.0 − 0.1 = −0.10 (somando da esquerda para a direita) = 0.00 (somando da direita para a esquerda). Entretanto, observe que P (x) pode ser escrito como: P (x) = x (x (x − 6) + 4) − 0.1 . Assim: P (5.24) = 5.24 (5.24 (5.24 − 6) + 4) − 0.1 = 5.24 (−3.98 + 4) − 0.1 = 5.24 (0.02) − 0.1 = 0.105 − 0.1 = 0.005 (sinal errado). CAPI´TULO 2. ANA´LISE DE ARREDONDAMENTO EM PONTO FLUTUANTE 42 Observando os treˆs u´ltimos exemplos, vemos que erros considera´veis podem ocorrer durante e execuc¸a˜o de um algoritmo. Isso se deve ao fato de que existem limitac¸o˜es da ma´quina e tambe´m que os erros de arredondamento sa˜o introduzidos a cada operac¸a˜o efetuada. Em consequeˆncia, podemos obter resultados diferentes mesmo utilizando me´todos nume´ricos matematicamente equivalentes. Assim, devemos ser capazes de conseguir desenvolver um algoritmo tal que os efeitos da aritme´tica discreta do computador permanec¸a inofensivo quando um grande nu´mero de operac¸o˜es sa˜o executadas. Exerc´ıcios 2.9 - Considere o sistema F (10, 3, 5, 5). Efetue as operac¸o˜es indicadas: i) (1.386− 0.987) + 7.6485 e 1.386− (0.987− 7.6485) , ii) 1.338− 2.0384.577 e ( 1.338 4.577 ) − ( 2.038 4.577 ) , 2.10 - Seja x = 17.678 3.471 + (9.617)2 3.716× 1.85 a) Calcule x com todos os algarismos da sua calculadora, sem efetuar arredondamento. b) Calcule x considerando o sistema F (10, 3, 4, 3). Fac¸a arredondamento a cada operac¸a˜o efetu- ada. 2.11 - Seja P (x) = 2.3 x3 − 0.6 x2 + 1.8 x− 2.2 . Deseja-se obter o valor de P (x) para x = 1.61. a) Calcule P (1.61) com todos os algarismos da sua calculadora, sem efetuar arredondamento. b) Calcule P (1.61) considerando o sistema F (10, 3, 4, 3). Fac¸a arredondamento a cada operac¸a˜o efetuada. 2.12 - Seja: S = n∑ i=1 = n(n+ 1) 2 . Calcule S, considerando n = 1000 e efetuando a soma dos termos em: a) ordem crescente, b) ordem decrescente. 2.5 Efeitos Nume´ricos Ale´m dos problemas dos erros causados pelas operac¸o˜es aritme´ticas, das fontes de erros citadas no in´ıcio deste cap´ıtulo, existem certos efeitos nume´ricos que contribuem para que o resultado obtido na˜o tenha cre´dito. Alguns dos mais frequentes sa˜o: • Cancelamento • Propagac¸a˜o do Erro • Instabilidade Nume´rica • Mal Condicionamento CAPI´TULO 2. ANA´LISE DE ARREDONDAMENTO EM PONTO FLUTUANTE 43 2.5.1 Cancelamento O cancelamento ocorre na subtrac¸a˜o de dois nu´meros quase iguais. Vamos supor que estamos operando com aritme´tica de ponto flutuante. Sejam x e y dois nu´meros com expoente e. Quando formamos a diferenc¸a x− y ela tambe´m tera´ o expoente e. Se normalizarmos o nu´mero obtido, veremos que devemos mover os d´ıgitos para a esquerda de tal forma que o primeiro seja diferente de zero. Assim, uma quantidade de d´ıgitos iguais a zero aparecem no final da mantissa do nu´mero normalizado. Estes zeros na˜o possuem significado algum.Veremos este fato atrave´s de exemplos, onde iremos considerar que estamos trabalhando com o sistema F (10, 10, 10, 10). Exemplo 2.13 - Calcular: √ 9876− √ 9875 . Soluc¸a˜o: Temos que: √ 9876 = 0.9937806599× 102 e √ 9875 = 0.9937303457× 102 . Portanto: √ 9876− √ 9875 = 0.0000503142× 102 . A normalizac¸a˜o muda este resultado para: 0.5031420000 × 10−4. Assim os quatro zeros no final da mantissa na˜o teˆm significado e assim perdemos 4 casas decimais. A pergunta que surge naturalmente e´: podemos obter um resultado mais preciso? Neste caso a resposta e´ sim. Basta consideramos a identidade: √ x−√y = x− y√ x+ √ y , e assim, no nosso caso, obtemos: √ 9876− √ 9875 = 1√ 9876 + √ 9875 = 0.5031418679× 10−4 . que e´ um resultado com todos os d´ıgitos corretos. Exemplo 2.14 - Resolver a equac¸a˜o: x2 − 1634 x+ 2 = 0 . Soluc¸a˜o: Temos: x = 1634±√(1634)2 − 4(2) 2 = 817± √ 667487 . Assim: x1 = 817 + 816.9987760 = 0.1633998776× 103 , x2 = 817− 816.9987760 = 0.1224000000× 10−2 . Os seis zeros da mantissa de x2 sa˜o resultado do cancelamento e portanto na˜o teˆm significado algum. Uma pergunta que surge naturalmente e´: podemos obter um resultado mais preciso? Neste caso a resposta e´ sim. Basta lembrar que o produto das ra´ızes e´ igual ao termo independente da equac¸a˜o, ou seja: x1 × x2 = 2 → x2 = 2 x1 . CAPI´TULO 2. ANA´LISE DE ARREDONDAMENTO EM PONTO FLUTUANTE 44 Logo: x2 = 0.1223991125× 10−2, onde agora todos os d´ıgitos esta˜o corretos. Nos exemplos dados foi razoavelmente fa´cil resolver o problema do cancelamento. Entretanto, cabe sa- lientar, que nem sempre existe uma maneira trivial de resolver problemas ocasionados pelo cancelamento. 2.5.2 Propagac¸a˜o do erro O cancelamento na˜o ocorre somente quando dois nu´meros quase iguais sa˜o subtraidos diretamente um do outro. Ele tambe´m ocorre no ca´lculo de uma soma quando uma soma parcial e´ muito grande quando comparada com o resultado final. Para exemplificar, consideremos que: sk = n∑ k=1 ak , seja a soma a ser calculada, onde os ak podem ser positivos ou negativos. Vamos supor que o ca´lculo seja feito atrave´s de uma sequeˆncia de somas parciais da seguinte forma: s1 = a1 , sk = sk−1 + ak , k = 2, 3, . . . , n , tal que s = sn. Se a soma e´ calculada em aritme´tica de ponto fixo, enta˜o cada ak esta´ afetado de algum erro, os quais sa˜o limitados por algum � para todo k. Se nenhum overflow ocorre, o erro na soma final s sera´ de no ma´ximo n�. Agora devido ao fato de nem todos os ak terem o mesmo sinal enta˜o o erro sera´ menor do que n�. Mas se a soma e´ calculada em aritme´tica de ponto flutuante um novo fenoˆmeno pode ocorrer. Vamos supor que uma das somas intermedia´rias sk e´ consideravelmente grande em relac¸a˜o a` soma final s, no sentido que o expoente de sk excede o expoente de s em, digamos, p unidades. E´ claro que isso so´ pode ocorrer se nem todos os ak possuem o mesmo sinal. Se simularmos tal soma em aritme´tica de ponto fixo (usando para todas as somas parciais o mesmo expoente de s) enta˜o devemos trocar os u´ltimos p d´ıgitos de sk por zeros. Estes d´ıgitos infuenciam os u´ltimos d´ıgitos de s, e, como em geral, esta˜o errados, na˜o podemos falar que o erro final sera´ pequeno. A perda de algarismos significativos devido a uma soma intermedia´ria grande e´ chamada de Pro- pagac¸a˜o do Erro. Veremos este fato atrave´s de exemplos. Exemplo 2.15 - Calcular e−5.25, utilizando 5 d´ıgitos significativos em todas as operac¸o˜es. Soluc¸a˜o: O seguinte resultado matema´tico e´ bem conhecido: para todo nu´mero real x, e−x = ∞∑ k=0 (−1)k x k k! . Se e−x e´ calculado usando esta fo´rmula, a se´rie deve ser truncada. Assim ja´ estaremos introduzindo um erro de truncamento. Vamos considerar os primeiros 20 termos da se´rie acima para avaliar e−5.25. Temos enta˜o: e−5.25 = (0.10000− 0.52500)101 + (0.13781− 0.24117 + 0.31654− 0.33236 + 0.29082− 0.21811 + 0.14314)102 + (−0.83497 + 0.43836− 0.20922)101 + (0.91532− 0.36965 + 0.13862)100 + (−0.48516 + 0.15919)10−1 + (−0.49164 + 0.14339)10−2 + (−0.39620 + 0.10401)10−3 + (−0.26003)10−4 + (0.62050− 0.14163)10−5 + (0.30982)10−6 . CAPI´TULO 2. ANA´LISE DE ARREDONDAMENTO EM PONTO FLUTUANTE 45 Efetuando os ca´lculos obtemos: e−5.25 = 0.65974 × 10−2. Observe que, usando uma calculadora, o resultado de e−5.25 e´ 0.52475×10−2. Essa diferenc¸a entre os valores obtidos ocorreu porque na expressa˜o acima temos parcelas da ordem de 102 que desprezam toda grandeza inferior a 10−3 (ver Tabela 2.1), enquanto que o resultado real de e−5.25 e´ constituido quase que exclusivamente de grandezas dessa ordem. A pergunta que surge naturalmente e´: podemos obter um resultado mais preciso? A resposta e´ sim. Basta lembrar que e−5.25 = 1 e5.25 e que: ex = ∞∑ k=0 xk k! . para todo nu´mero real x. Somando todas as parcelas da expressa˜o de e5.25, (desde que a expansa˜o de ex e e−x diferem apenas em termos de sinal), obtemos: e5.25 = 0.19057 × 103, e assim e−5.25 = 1 e5.25 = 1 0.19057× 103 = 0.52475× 10 −2. Na Tabela 2.1, apresentamos os ca´lculos de e−5.25, e−5.25 e 1 e5.25 , considerando a expansa˜o ate´ o termo de ordem 10k , k = 1, 0,−1, . . . ,−6. Tabela 2.1 10k e−5.25 e5.25 1 e5.25 101 0.64130(100) 0.18907(103) 0.52890(10−2) 100 0.42990(10−1) 0.19049(103) 0.52496(10−2) 10−1 0.10393(10−1) 0.19056(103) 0.52477(10−2) 10−2 0.69105(10−2) 0.19056(103) 0.52477(10−2) 10−3 0.66183(10−2) 0.19057(103) 0.52475(10−2) 10−4 0.65929(10−2) 0.19057(103) 0.52475(10−2) 10−5 0.65971(10−2) 0.19057(103) 0.52475(10−2) 10−6 0.65974(10−2) 0.19057(103) 0.52475(10−2) Exemplo 2.16 - Deseja-se determinar numericamente o valor exato da integral: yn = ∫ 1 0 xn x+ a dx , para um valor fixo de a >> 1 e, n = 0, 1, . . . , 10. Soluc¸a˜o: Sabemos que os nu´meros yn sa˜o positivos. Ale´m disso, como para 0 < x < 1, xn+1 < xn, os nu´meros yn formam uma sequeˆncia monotonicamente decrescente, e ainda:∫ 1 0 xn 1 + a dx < yn < ∫ 1 0 xn a dx , e portanto podemos afirmar que: 1 (n+ 1)(1 + a) < yn < 1 (n+ 1)a . CAPI´TULO 2. ANA´LISE DE ARREDONDAMENTO EM PONTO FLUTUANTE 46 Assim para a = 10 e n = 10, temos que: 0.0082645 < y10 < 0.0090909 . (2.2) Agora para calcular numericamente o valor da integral dada, podemos primeiramente expressar o integrando usando o Teorema binomial, isto e´: xn = [(x+ a)− a]n = n∑ k=0 (−1)k ( n k ) (x+ a)n−kak . Substituindo xn na expressa˜o para yn, obtemos: yn = ∫ 1 0 n∑ k=0 (−1)k ( n k ) (x+ a)n−k−1ak dx = n∑ k=0 (−1)kak ( n k )∫ 1 0 (x+ a)n−k−1 dx = n−1∑ k=0 (−1)kak ( n k )∫ 1 0 (x+ a)n−k−1 dx + (−1)nan ( n n )∫ 1 0 (x+ a)−1 dx e assim: yn = n−1∑ k=0 (−1)kak ( n k )[ 1 n− k ((1 + a) n − k − an−k) ] (2.3) + (−a)n ln 1 + a a . Para a = 10 e n = 10, utilizando (2.3) para calcular yn, obtemos yn = −2.000000, que comparado com (2.2), esta´ totalmente errado. A raza˜o para isso e´ uma extrema propagac¸a˜o de erro. Para n = 10, o termo correspondente a k = 5 na soma (2.3) e´ igual a: (−1)5a5 ( 10 5 )[ 1 5 ((1 + a)5 − a5) ] = −3.13× 1011 . Assim para uma calculadora com 10 d´ıgitos na mantissa, no mı´nimo dois d´ıgitos antes do ponto decimal do resultado sa˜o na˜o confia´veis, bem como os d´ıgitos depois do ponto decimal. 2.5.3 Instabilidade Nume´rica Se um resultado intermedia´rio de um ca´lculo e´ contaminado por um erro de arredondamento, este erro pode influenciar todos os resultados subsequentes que dependem desse resultado intermedia´rio. Os erros de arredondamento podem propagar-se mesmo que todos os ca´lculos subsequentes sejam feitos com precisa˜o dupla. Na realidade, cada novo resultado intermedia´rio introduz um novo erro de arredonda- mento. E´ de se esperar portanto, que todos esses erros influenciem o resultado final. Numa situac¸a˜o simples como o caso de uma soma, o erro final pode ser igual a soma de todos os erros intemedia´rios. CAPI´TULO 2. ANA´LISE DE ARREDONDAMENTO EM PONTO FLUTUANTE 47 Entretanto, os erros intermedia´rios podem, algumas vezes, cancelar-se uns com os outros no mı´nimo parcialmente. Em outros casos (tal como em processos iterativos) os erros intermedia´rios podem ter um efeito desprez´ıvel no resultado final. Algoritmos com essa propriedade sa˜o chamados esta´veis. Instabilidade Nume´rica ocorre se os erros intermedia´rios tem uma influeˆncia muito grande no resultado final. Veremos esse fato atrave´s do seguinte exemplo. Exemplo 2.17 - Resolver a integral: In = e−1 ∫ 1 0 xnex dx . Soluc¸a˜o: Vamos tentar encontrar uma fo´rmula de recorreˆncia para In. Integrando por partes, segue que: In = e−1 { [xnex]10 − ∫ 1 0 n xn−1ex dx } = 1− n e−1 ∫ 1 0 xn−1ex dx = 1− n In−1 . Assim, obtemos uma fo´rmula de recorreˆncia para In, isto e´: In = 1− n In−1 , n = 1, 2, . . . , (2.4) e desde que: I0 = e−1 ∫ 1 0 ex dx = e−1(e− 1) = 0.6321, e´ conhecido, podemos, teoricamente, calcular In, usando (2.4). Fazendo os ca´lculos, obtemos: I0 = 0.6321 , I1 = 0.3679 , I2 = 0.2642 , I3 = 0.2074 , I4 = 0.1704 , I5 = 0.1480 , I6 = 0.1120 , I7 = 0.216 . O resultado obtido para I7 esta´ claramente errado, desde que: I7 < e −1 max 0≤x≤1 (ex) ∫ 1 0 xn dx < 1 n+ 1 , isto e´, I7 < 18 = 0.1250. Ale´m disso a sequeˆncia In e´ uma sequeˆncia decrescente. Para ver que a instabilidade existe, vamos supor que o valor de I0 esteja afetado de um erro �0. Vamos supor ainda que todos as operac¸o˜es aritme´ticas subsequentes sa˜o calculadas exatamente. Denotando por In o valor exato da integral e por I˜n o valor calculado assumindo que so´ existe erro no valor inicial, obtemos que: I˜0 = I0 + �0 , e assim: I˜n = 1− n I˜n−1 , n = 1, 2, . . . . (2.5) Seja rn o erro, isto e´: rn = I˜n − In . CAPI´TULO 2. ANA´LISE DE ARREDONDAMENTO EM PONTO FLUTUANTE 48 Subtraindo (2.4) de (2.5), segue que: rn = −n rn−1 , n = 1, 2, . . . . Aplicando essa fo´rmula repetidamente, obtemos: rn = −nrn−1 = (−n)2rn−2 = . . . = (−n)nr0 , e portanto rn = (−n)n �0 , desde que r0 = �0. Assim, a cada passo do ca´lculo, o erro cresce do fator n. Surge enta˜o a pergunta: Como encontrar o valor exato de In? Para este caso em particular, observe que: uma relac¸a˜o de recorreˆncia ser insta´vel na direc¸a˜o crescente de n na˜o impede de ser esta´vel na direc¸a˜o decrescente de n. Assim, resolvendo (2.4), para In−1, obtemos: In−1 = (1− In) n . (2.6) Se usada nessa forma, a relac¸a˜o tambe´m precisa de um valor inicial. Entretanto, na˜o e´ fa´cil encontrar esse valor pois todo In onde n > 0 e´ desconhecido. Mas sabemos que In → 0 quando n → ∞. Assim, tomando I20 = 0 e usando (2.6) para n = 20, 19, 18, . . ., obtemos: I7 = 0.1123835 onde agora todos os d´ıgitos esta˜o corretos. E´ interessante notar que comec¸ando com I7 = 0, obtemos I0 = 0.6320. Isto ocorre porque neste caso o erro esta´ sendo reduzido substancialmente a cada passo, isto e´, a cada passo o erro decresce do fator 1n . 2.5.4 Mal Condicionamento A maioria dos processos nume´ricos seguem a seguinte linha geral: • Dados sa˜o fornecidos, • Os dados sa˜o processados de acordo com um plano pre´-estabelecido (algoritmo), • Resultados sa˜o produzidos. Analisaremos aqui problemas onde os resultados dependem continuamente dos dados. Tais problemas sa˜o chamados de problema bem posto. Problemas que na˜o dependem continuamente dos dados sa˜o chamados de problema mal posto. Vamos enta˜o analisar como pertubac¸o˜es nos dados podem ou na˜o influenciar os resultados. Exemplo 2.18 - Resolver o sistema: { x + y = 2 x + 1.01y = 2.01 Soluc¸a˜o: A soluc¸a˜o desse sistema pode ser facilmente obtida, por exemplo, por substituic¸a˜o. Fazendo isso, obtemos: x = y = 1. Se o nu´mero 2.01, da segunda equac¸a˜o e´ mudado para 2.02, obtemos que a soluc¸a˜o do sistema e´ agora x=0 e y=2. Portanto uma pequena mudanc¸a nos dados produz uma grande mudanc¸a no resultado. Vamos enta˜o interpretar geometricamente o resultado. A soluc¸a˜o do sistema e´ o ponto de intersec¸a˜o das duas retas: y = 2-x e y = (2.01 -x)/1.01. Essas retas esta˜o desenhadas na Figura 2.1. E´ claro que o ponto de intersec¸a˜o e´ muito sens´ıvel a pequenas pertubac¸o˜es em cada uma dessas retas desde que elas sa˜o praticamente paralelas. De fato, se o coeficiente de y na segunda equac¸a˜o e´ 1.00, as duas retas sa˜o exatamente paralelas e o sistema na˜o tem soluc¸a˜o. Isto e´ t´ıpico de problemas mal condicionados. Eles sa˜o tambe´m chamados de problemas cr´ıticos, pois ou possuem infinitas soluc¸o˜es ou na˜o possuem nenhuma. CAPI´TULO 2. ANA´LISE DE ARREDONDAMENTO EM PONTO FLUTUANTE 49 Figura 2.1 (1,1) y = (2.01− x)/1.01 y = 2− x @ @ @ @ @ @ 6 - Exemplo 2.19 - Determinar a soluc¸a˜o do problema de valor inicial: y ′′ = y y(0) = a y′(0) = b onde a e b sa˜o dados. Soluc¸a˜o: A soluc¸a˜o teo´rica desse problema de valor inicial e´: y(x) = C1ex + C2e−x , (2.7) onde C1 e C2 dependem de a e b. Assim, se tomarmos a = 1 e b = −1, enta˜o desde que y′(x) = C1e x − C2e−x, obtemos o sistema linear:{ y(0) = C1 + C2 = 1 y′(0) = C1 − C2 = −1 cuja soluc¸a˜o e´: C1 = 0 e C2 = 1. Substituindo esses valores em (2.7) obtemos que y(x) = e−x. Logo, quando x→∞ a soluc¸a˜o decresce rapidamente para zero. Mas se tomarmos a = 1 e b = −1 + δ, onde |δ| pode ser arbitrariamente pequeno, enta˜o, como anteriormente, obtemos o sistema linear:{ C1 + C2 = 1 C1 − C2 = −1 + δ cuja soluc¸a˜o e´: C1 = δ2 e C2 = 1− δ2 . Assim a soluc¸a˜o do novo problema de valor inicial e´: y(x) = δ 2 ex + (1− δ 2 )e−x = e−x + δ 2 (ex − e−x) = e−x + δ senh x . Portanto a soluc¸a˜o difere da soluc¸a˜o do problema anterior de δ senh x. Assim a caracter´ıstica matema´tica da soluc¸a˜o foi mudada completamente, pois enquanto no primeiro resultado a soluc¸a˜o → 0, quando x→∞ ela agora →∞ quando x→∞. Tudo isso ocorreu apesar da dependeˆncia de y(x) sobre os dados a e b ser claramente cont´ınua. Torna-se enta˜o necessa´rio introduzir uma medida para o grau de continuidade de um problema. Tal medida e´ essencial em muitas definic¸o˜es de continuidade. Seja X o espac¸o dos dados; os elementos x de X podem ser nu´meros, pontos de um espac¸o euclidiano, vetores, matrizes, func¸o˜es, etc.... Podemos enta˜o falar em continuidade se pudermos ser capazes de medir a distaˆncia entre os elementos de X. Suponhamos que o espac¸o X esta´ dotado com uma func¸a˜o distaˆncia d(x, y) que mede a distaˆncia entre os elementos x e y de X. Se por exemplo, X e´ o espac¸o dos nu´meros reais, a func¸a˜o distaˆncia e´ definida por: d(x, y) = |x− y|. Para X = IRn, veja Definic¸a˜o 1.7. CAPI´TULO 2. ANA´LISE DE ARREDONDAMENTO EM PONTO FLUTUANTE 50 Seja P o processo nos quais os dados x sa˜o transformados no resultado y, isto e´: y = P (x). Se o processo P e´ cont´ınuo num ponto x, enta˜o a definic¸a˜o de continuidade (matema´tica) exige que para cada � > 0, ∃ δ(�) > 0 tais que: |P (x˜)− P (x)| < � sempre que |x˜− x| < δ(�) . Quanto maior a func¸a˜o δ(�) pode ser escolhida, mais cont´ınuo e´ o processo P . No caso em que grandes mudanc¸as nos dados produzem somente pequenas mudanc¸as nos resultados, ou se δ(�) pode ser escolhido grande, a condic¸a˜o do problema e´ boa, e o problema e´ chamado bem condicionado. Por outro lado, se pequenas mudanc¸as nos dados produzem grandes mudanc¸as nos resultados, ou se δ(�) deve ser escolhido pequeno, a condic¸a˜o do problema e´ ma´, e o problema e´ chamado mal condicionado. Exemplo 2.20 - Analisar o problema de valor inicial do exemplo 2.19. Soluc¸a˜o: Se queremos que a soluc¸a˜o y(x) num ponto x seja mudada por na˜o mais que uma quan- tidade �, enta˜o a condic¸a˜o inicial y′(0) = −1 deve ser mudada por na˜o mais que: δ(�) = � senh x , o qual pode ser feito arbitrariamente pequeno escolhendo x grande. Por exemplo para x = 10, obtemos: δ(�) = 0.9× 10−4 �. Assim temos um problema mal condicionado. Podemos tambe´m verificar se um problema e´ ou na˜o mal condicionado analisando o nu´mero de condic¸a˜o do problema. O problema sera´ bem condicionado se o nu´mero de condic¸a˜o for pequeno e sera´ mal condicionado se o nu´mero de condic¸a˜o for grande. Entretanto a definic¸a˜o de nu´mero de condic¸a˜o depende do problema. Seja y = P (x), com P diferencia´vel. Enta˜o a mudanc¸a em y causada pela mudanc¸a em x pode ser aproximada, (no sentido do ca´lculo diferencial) pelo diferencial de y, isto e´: dy = P ′(x) dx. Assim o comprimento de |P ′(x)| do operador linear P (x) representa o nu´mero de condic¸a˜o do problema num ponto x. O nu´mero de condic¸a˜o relativa e´ definido por: cr = |P ′(x)| |P (x)| | . Assim se cr ≤ 1 dizemos que o problema e´ relativamente bem condicionado. Exemplo 2.21 - Analisar o problema de calcular: f(x) = ( ln 1 x )−18 , num ponto x qualquer. Soluc¸a˜o: Desde que f e´ diferencia´vel o nu´mero de condic¸a˜o e´ simplesmente |f ′(x)|. Assim: f ′(x) = −1 8 ( ln 1 x )−98 −1/x2 1/x = 1 8 x ( ln 1 x )−98 , CAPI´TULO 2. ANA´LISE DE ARREDONDAMENTO EM PONTO FLUTUANTE 51 e o nu´mero de condic¸a˜o relativa e´ dada por: cr = ∣∣∣∣f ′(x)f(x) ∣∣∣∣ = 18 x ln 1x . Para x = 0, e x = 1 tanto o nu´mero de condic¸a˜o como o nu´mero de condic¸a˜o relativa sa˜o infinito, e assim nestes pontos o problema e´ extremamente mal condicionado. Para aproximadamente 0.1537 ≤ x ≤ 0.5360, cr ≤ 1. Portanto neste intervalo o problema de calcular f e´ bem condicionado. O problema de resolver um sistema linear, como vimos, e´ um outro exemplo de problema onde pequenas pertubac¸o˜es nos dados podem alterar de modo significativo o resultado. A ana´lise do problema de mal condicionamento de sistemas lineares, encontra-se no Cap´ıtulo 4. Teoricamente, o termo mal condicionado e´ usado somente para modelos matema´ticos ou problemas e o termo instabilidade somente para algoritmos. Entretanto, na pra´tica os dois termos sa˜o usados sem distinc¸a˜o. O leitor interessado em maiores detalhes sobre os to´picos apresentados nesse cap´ıtulo, deve consultar os livros: [Forsythe, 19 .. ] e [Henrice, 1982]. Exerc´ıcios 2.13 - Considere a integral do exerc´ıcio 2.13, com a = 10. a) Calcule y0 usando a integral. b) Mostre que uma relac¸a˜o de recorreˆncia para yn e´ dada por: yn = 1 n − a yn−1 . c) Calcule yn, n = 1, 2 . . . , 10, usando a relac¸a˜o de recorreˆncia. Os valores obtidos sa˜o confia´veis? 2.14 - Considere agora a relac¸a˜o de recorreˆncia do exerc´ıcio anterior escrita na forma: yn−1 = 1 a − ( 1 n − yn ) . Considere ainda que y20 = 0. Usando este dado e a relac¸a˜o de recorreˆncia obtenha os valores de y10, y9, . . . , y1. Os resultados agora sa˜o melhores? Como voceˆ explica isso? 2.6 Exerc´ıcios Complementares 2.15 - Dados os nu´meros: (13.44)5, (122.35)6, (31.202)4. Existe algum com representac¸a˜o exata no sistema F (2, 10, 10, 10)? 2.16 - Considere o sistema F (2, 8, 4, 4) e os nu´meros x1 = 0.10110011× 22 e x2 = 0.10110010× 22. Qual dos dois nu´meros representa melhor (2.8)10? 2.17 - Seja o sistema F (2, 3,−1, 2). Exiba todos os nu´meros representa´veis neste sistema e coloque-os sobre um eixo ordenado. CAPI´TULO 2. ANA´LISE DE ARREDONDAMENTO EM PONTO FLUTUANTE 52 2.18 - Considere o sistema F (2, 8, 10, 10). Represente no sistema os nu´meros: x1 = √ 8, x2 = e2, x3 = 3.57, onde todos esta˜o na base 10. Existe algum com representac¸a˜o exata nesse sistema? 2.19 - Mostre que se x e´ um nu´mero no sistema F (β, t,m,M) enta˜o x¯ = x(1 + δ) onde |δ| ≤ 12β1−t. 2.20 - Mostre que 12β 1−t e´ o melhor limitante para |δ|. 2.21 - Efetue as operac¸o˜es indicadas, utilizando aritme´tica de ponto flutuante com 3 algarismos signi- ficativos. a) (19.3− 1.07)− 10.3 e 19.3− (1.07 + 10.3) , b) 27.2× 1.3− 327.× 0.00251 , c) 10.1− 3.1× 8.2 14.1 + 7.09× 3.22 , d) (367.+ 0.6) + 0.5 e 367.+ (0.6 + 0.5) , e) ∑100 i=1 0.11 . (Compare seu resultado com 100× 0.11) . 2.22 - Deseja-se calcular: S = 10∑ k=1 2 k2 , no sistema F (10, 3, 5, 4), usando arredondamento em todas as operac¸o˜es. Assim, efetue a soma: a) da direita para a esquerda, b) da esquerda para a direita, Os valores obtidos em a) e b sa˜o iguais? 2.23 - Usando arredondamento para 4 d´ıgitos significativos, efetue as operac¸o˜es indicadas, e escreva o resultado na forma normalizada. a) 0.5971× 103 + 0.4268× 100 , b) 0.5971× 10−1 − 0.5956× 10−2 , c) 0.5971× 103 0.4268× 10−1 , d) (0.5971× 103)× (0.4268× 100) , 2.24 - Usando arredondamento, a cada operac¸a˜o efetuada, calcule: n∑ i=1 i2 − n∑ i=2 i2 = 1 , somando os termos em: a) ordem crescente, b) ordem decrescente. CAPI´TULO 2. ANA´LISE DE ARREDONDAMENTO EM PONTO FLUTUANTE 53 Considere n = 100. Os valores obtidos sa˜o iguais? 2.25 - Deseja-se calcular e−0.15. a) Obtenha atrave´s de uma calculadora o valor exato de e−0.15. b) Considere o sistema F (10, 5, 10, 10) e a se´rie truncada em 25 termos. Calcule: b.1) e−0.15 b.2) 1 e0.15 e compare os resultados. 2.26 - Se a, b e c sa˜o reais e a 6= 0, enta˜o a equac¸a˜o a x2 + b x + c = 0 , e´ satisfeita para exatamente dois valores de x: (I) x1 = −b + √ b2 − 4 a c 2 a , x2 = −b − √ b2 − 4 a c 2 a . Entretanto, desde que, a x2 + b x + c = a (x − x1) (x − x2) obtemos que: a x1 x2 = c e assim podemos reescrever (I) na seguinte forma: (II) x1 = −b + sinal de (b) √ b2 − 4 a c 2 a , x2 = ca x1 , Temos ainda que x1 e x2 podem ser escritos como: (III) x1 = −2 c b + √ b2 − 4 a c , x2 = ca x1 . Utilizando (I), (II) e (III) calcule as ra´ızes das equac¸o˜es para os valores de a, b e c dados a seguir: i) a = 1 ; b = −105 ; c = 1 , ii) a = 1 ; b = −4 ; c = 3.9999999 , iii) a = 6 ; b = 5 ; c = −4 . 2.27 - A func¸a˜o de Bessel satisfaz a seguinte relac¸a˜o de recorreˆncia: Jn+1(x)− 2 n x Jn(x) + Jn−1(x) = 0 . Se x = 1, J0(1) = 0.7652 e J1(1) = 0.4401, calcule Jn(1) para n = 2, 3, . . . , 10. Refac¸a os ca´lculos comec¸ando com valores mais precisos: J0(1) = 0.76519769 e J1(1) = 0.44005059. Como voceˆ explica seus resultados com o fato que Jn(1) → 0 quando n cresce? CAPI´TULO 2. ANA´LISE DE ARREDONDAMENTO EM PONTO FLUTUANTE 54 2.28 - Fac¸a J10(1) = 0 e J9(1) = µ. Use a fo´rmula do exerc´ıcio anterior, na forma: Jn−1(1) = 2 nJn(1)− Jn+1(1) . e calcule J8(1), J7(1), . . .. Encontre µ atrave´s da identidade: J0(x) + 2 J2(x) + 2 J4(x) + 2 J6(x) + . . . = 1 , e calcule J9(1), J8(1), . . . , J0(1). Como esses resultados se comparam com os valores exatos? Cap´ıtulo 3 Equac¸o˜es na˜o Lineares 3.1 Introduc¸a˜o Um dos problemas que ocorrem mais frequentemente em trabalhos cient´ıficos e´ calcular as ra´ızes de equac¸o˜es da forma: f(x) = 0 , onde f(x) pode ser um polinoˆmio em x ou uma func¸a˜o transcendente. Em raros casos e´ poss´ıvel ob- ter as ra´ızes exatas de f(x) = 0, como ocorre por exemplo, supondo-se f(x) um polinoˆmio fatora´vel. Atrave´s de te´cnicas nume´ricas, e´ poss´ıvel obter uma soluc¸a˜o aproximada, em alguns casos, ta˜o pro´xima da soluc¸a˜o exata, quanto se deseje. A maioria dos procedimentos nume´ricos fornecem uma sequeˆncia de aproximac¸o˜es, cada uma das quais mais precisa que a anterior, de tal modo que a repetic¸a˜o do proce- dimento fornece uma aproximac¸a˜o a qual difere do valor verdadeiro por alguma toleˆrancia pre´-fixada. Estes procedimentos sa˜o portanto muito semelhantes ao conceito de limite da ana´lise matema´tica. Va- mos considerar va´rios me´todos iterativos para a determinac¸a˜o de aproximac¸o˜es para ra´ızes isoladas de f(x) = 0. Sera´ dada uma atenc¸a˜o especial a`s equac¸o˜es polinomiais em virtude da importaˆncia que as mesmas gozam em aplicac¸o˜es pra´ticas. Inicialmente recordemos um importante resultado da A´lgebra. Teorema 3.1 - Se uma func¸a˜o cont´ınua f(x) assume valores de sinais opostos nos pontos extremos do intervalo [a, b], isto e´, se f(a) × f(b) < 0, enta˜o existe pelo menos um ponto x¯ ∈ [a, b], tal que f(x¯) = 0. Prova: A prova deste teorema pode ser encontrada em [.. , 19..] Definic¸a˜o 3.1 - Se f : [a, b] → IR e´ uma func¸a˜o dada, um ponto x¯ ∈ [a, b] e´ um zero (ou raiz) de f se f(x¯) = 0. Ilustraremos graficamente esses conceitos nos exemplos a seguir. Exemplo 3.1 - Seja f : (0,∞) → IR. Determinar as ra´ızes de f(x) = ln x. Soluc¸a˜o: O gra´fico de ln x e´ dado na Figura 3.1. 55 CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 56 ln x 1 −1 321 6 - Figura 3.1 Nesse caso vemos que f(0.5) × f(1.5) < 0. Portanto existe uma raiz de f(x) no intervalo (0.5, 1.5). Ale´m disso a curva intercepta o eixo dos x num u´nico ponto, pois trata-se de uma func¸a˜o crescente. Enta˜o x¯ = 1 e´ a u´nica raiz de f(x) = 0. Exemplo 3.2 - Seja f : (0,∞) → IR. Determinar as ra´ızes de f(x) = ex. Soluc¸a˜o: O gra´fico de ex e´ dado na Figura 3.2. 5 3 1 21 ex - 6 Figura 3.2 Nesse caso vemos a curva na˜o intercepta o eixo dos x, logo na˜o existe x¯ tal que f(x¯) = 0 . Exemplo 3.3 - Seja f : [0, 2pi] → IR. Determinar as ra´ızes de f(x) = cos x. Soluc¸a˜o: O gra´fico de cos x e´ dado na Figura 3.3. cosx 42 −1 1 6 - Figura 3.3 CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 57 Nesse caso vemos que: f(1) × f(2) < 0 e f(4) × f(5) < 0, ou seja a curva intercepta o eixo dos x em dois pontos. Assim temos uma raiz x¯ no intervalo (1, 2) e outra no intervalo (4, 5). Sabemos da trigonometria que: x¯ = pi2 ' 1.5708 e x¯ = 3 pi2 ' 4.7124 sa˜o ra´ızes de f(x) = 0. Definic¸a˜o 3.2 - Um ponto x¯ ∈ [a, b] e´ uma raiz de multiplicidade m da equac¸a˜o f(x) = 0 se f(x) = (x− x¯)m g(x); com g(x¯) 6= 0 em [a, b]. Exemplo 3.4 - Seja f : IR→ IR. Determinar as ra´ızes de f(x) = x2 + 2 x+ 1 = (x+ 1)2 = 0. Soluc¸a˜o: O gra´fico de f(x) e´ dado na Figura 3.4. (x+ 1)2 3 1 −3 −1 1 6 - Figura 3.4 Nesse caso vemos que a curva apenas toca o eixo dos x. Assim, x¯ = 1 e´ raiz de multiplicidade 2 de f(x) = 0. Como vimos nos exemplos anteriores, podemos obter o nu´mero exato de ra´ızes e sua localizac¸a˜o exata ou aproximada trac¸ando o gra´fico da func¸a˜o e encontrando o ponto onde a curva intercepta o eixo dos x. Entretanto algumas vezes e´ mais conveniente rearranjar a equac¸a˜o dada como y1(x) = y2(x), para duas func¸o˜es y1 e y2, cujos gra´ficos sa˜o mais fa´ceis de serem trac¸ados do que o da f . As ra´ızes da equac¸a˜o original sa˜o dadas enta˜o pelos pontos onde o gra´fico de y1 intercepta o de y2. Ilustraremos este fato no pro´ximo exemplo. Exemplo 3.5 - Seja f : IR→ IR. Determinar as ra´ızes de f(x) = (x+ 1)2 e(x2−2) − 1 = 0. Soluc¸a˜o: Podemos rearranjar a equac¸a˜o dada, por exemplo, como: (x+ 1)2 = e(2−x 2). Fazendo y1 = (x+1)2 , y2 = e(2−x 2) e colocando as duas curvas no mesmo gra´fico, obtemos a Figura 3.5. CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 58 y2 y1 6 4 2 21¯x−1x¯−2 - 6 Figura 3.5 E´ claro observando-se a Figura 3.5 que as duas curvas se interceptam apenas duas vezes. Portanto a equac¸a˜o dada tem precisamente duas ra´ızes. Uma raiz x¯ no intervalo (−2,−1) e outra no intervalo (0, 1). Este u´ltimo exemplo ilustra bem a raza˜o da utilizac¸a˜o de me´todos nu´mericos para determinar a soluc¸a˜o de equac¸o˜es na˜o lineares. Ao contra´rio dos exemplos anteriores, onde foi razoavelmente fa´cil determinar as ra´ızes da func¸a˜o dada, aqui fica dif´ıcil dizer com exatida˜o qual e´ o valor de x¯ tal que f(x¯) = 0. Para descrevermos um me´todo nume´rico extremamente simples, e de fa´cil compreensa˜o, suponha que f(x) seja uma func¸a˜o cont´ınua em [a, b]. Pelo Teorema 3.1, temos que se f(x) em x = a e x = b tem sinais opostos, enta˜o f(x) tem no mı´nimo um zero em [a, b]. Esse resultado fornece um caminho simples, mas efetivo, para encontrar a localizac¸a˜o aproximada dos zeros da f . Considere novamente a equac¸a˜o do exemplo 3.5, isto e´, f(x) = (x + 1)2 e(x 2−2) − 1. Valores de f(x) para x = −3,−2, . . . , 3 esta˜o contidos na tabela a seguir: x −3 −2 −1 0 1 2 3 f(x) 4385.5 6.4 −1.0 −0.9 0.5 65.5 17545.1 A func¸a˜o portanto possui zeros no intervalo [−2,−1] e [0, 1]. (Note que o mesmo resultado foi obtido graficamente). Estamos agora em condic¸o˜es de descrever um me´todo nume´rico, conhecido como Me´todo da Bissecc¸a˜o, o qual reduz o comprimento do intervalo que conte´m a raiz, de maneira sistema´tica. Considere o intervalo [a, b] para o qual f(a) × f(b) < 0. No me´todo da bissecc¸a˜o calculamos o valor da func¸a˜o f(x) no ponto me´dio: x1 = a+ b2 . Portanto existem treˆs possiblidades. Primeiramente, fi- car´ıamos felizes, (embora seja quase imposs´ıvel), se o valor da func¸a˜o calculado no ponto x1 fosse nulo, isto e´: f(x1) = 0. Nesse caso x1 e´ o zero da f e na˜o precisamos fazer mais nada. Em segundo lugar, se f(a)× f(x1) < 0, enta˜o f tem um zero entre a e x1. O processo pode ser repetido sobre o novo intervalo [a, x1]. Finalmente, se f(a) × f(x1) > 0, segue que f(b) × f(x1) < 0, desde que e´ conhecido que f(a) e f(b) teˆm sinais opostos. Portanto f tem um zero entre x1 e b, e o processo pode ser repetido com [x1, b]. A repetic¸a˜o do me´todo e´ chamado iterac¸a˜o e as aproximac¸o˜es sucessivas sa˜o os termos iterados. Assim, o me´todo da bissecc¸a˜o pode ser descrito como: Para k = 1, 2, . . ., fac¸a: xk = a+ b 2 . Se f(a)× f(xk) < 0 enta˜o b = xk , > 0 enta˜o a = xk . Uma interpretac¸a˜o geome´trica do me´todo da bissecc¸a˜o e´ dada na Figura 3.6. CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 59 x3 x2 x1 x x¯ b a f(b) f(a) 6f(x) - Figura 3.6 Para ilustrar o me´todo da bissecc¸a˜o, considere que desejamos calcular a raiz positiva da equac¸a˜o do Exemplo 3.5, iniciando com o intervalo [0, 1]. Para essa equac¸a˜o temos que f(0) < 0 e f(1) > 0. O ponto me´dio e´ x1 = 0.5, com f(x1) = −0.6090086. Desde que f(0)× f(0.5) > 0, deduzimos que a raiz da equac¸a˜o esta´ em [0.5, 1]. Os primeiros passos do me´todo da bissecc¸a˜o, para esta equac¸a˜o, esta˜o mostrados na tabela: k a b xk f(xk) 1 0 1 0.5 -0.609009 2 0.5 1 0.75 -0.272592 4 0.75 1 0.875 0.023105 4 0.75 0.875 0.8125 -0.139662 5 0.8125 0.875 0.84375 -0.062448 6 0.84375 0.875 0.859375 -0.020775 ... Continuando o processo obteremos: x16 = 0.866868 e x17 = 0.866876. Isso significa que o intervalo incial [0, 1] foi reduzido ao intervalo[0.866868, 0.866876], e portanto a raiz positiva da equac¸a˜o dada e´ aproximadamente: x¯ = 0.86687. Note que ate´ agora na˜o falamos como devemos proceder para obter o resultado com uma quantidade de casas decimais corretas. Isso sera´ discutido mais adiante. Exerc´ıcios 3.1 - Dadas as func¸o˜es: a) x3 + 3 x− 1 = 0, b) x2 − sen x = 0, pesquisar a existeˆncia de ra´ızes reais e isola´-las em intervalos. 3.2 - Justifique que a func¸a˜o: f(x) = cos pi(x+ 1) 8 + 0.148 x− 0.9062 , CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 60 possui uma raiz no intervalo (−1, 0) e outra no intervalo (0, 1). Existem va´rios me´todos nume´ricos para determinac¸a˜o (aproximada) das ra´ızes da equac¸a˜o f(x) = 0, mais eficientes que o me´todo da bissecc¸a˜o. Descreveremos a seguir alguns desses me´todos, discutindo suas vantagens e desvantagens. Antes, pore´m, daremos um procedimento que deve ser seguido na aplicac¸a˜o de qualquer me´todo nume´rico para determinar um zero de f(x) = 0, com uma precisa˜o pre´-fixada. Processo de Parada 1) Para aplicar qualquer me´todo nume´rico deveremos ter sempre uma ide´ia sobre a localizac¸a˜o da raiz a ser determinada. Essa localizac¸a˜o e´ obtida , em geral, atrave´s de gra´fico. (Podemos tambe´m localizar o intervalo que conte´m a raiz fazendo uso do Teorema 3.1). A partir da localizac¸a˜o da raiz, escolhemos enta˜o x0 como uma aproximac¸a˜o inicial para a raiz x¯ de f(x) = 0. Com essa aproximac¸a˜o inicial e um me´todo nume´rico refinamos a soluc¸a˜o ate´ obteˆ-la com uma determinada precisa˜o (nu´mero de casas decimais corretas) . 2) Para obtermos uma raiz com uma determinada precisa˜o � devemos, durante o processo iterativo, efetuar o seguinte teste: Se |xk+1 − xk| |xk+1| < � , (erro relativo) , onde � e´ uma precisa˜o pre´-fixada; xk e xk+1 sa˜o duas aproximac¸o˜es consecutivas para x¯, enta˜o xk+1 e´ a raiz procurada, isto e´, tomamos x¯ = xk+1. Observac¸o˜es: a) Em relac¸a˜o a` precisa˜o pre´-fixada, normalmente tomamos � = 10−m onde m e´ o nu´mero de casas decimais que queremos corretas no resultado. b) Apesar de alguns autores considerarem como teste de parada o fato de |f(xk+1)| < �, e´ preciso ter muito cuidado pois a menos que se tenha uma ide´ia muito clara do comportamento da func¸a˜o o fato desse teste ser satisfeito na˜o implica necessariamente que xk+1 esteja pro´ximo da raiz procurada, como pode ser observado no seguinte exemplo: considere f(x) = x−3 lnx = 0, onde a u´nica raiz e´ x¯ = 1. Calculando f(x) para x = 2, 4, 8, 16, 32, . . . obtemos, respectivamente: 0.0866, 0.0217, 0.00406,0.0006769,0.0001058,. . . isto e´, quanto mais longe estamos de x¯, menor e´ o valor de f(x). c) Alguns autores consideram como teste de parada o fato de |xk+1 − xk| < �, chamado de erro absoluto. Entretanto, se esses nu´meros forem muito grandes e � for muito pequeno, pode na˜o ser poss´ıvel calcular a raiz com uma precisa˜o ta˜o exigente. Como exemplo, resolva a equac¸a˜o f(x) = (x − 1)(x − 2000) = 0 com � = 10−4 usando os crite´rios de erro relativo e erro absoluto. Voceˆ ira´ verificar que o nu´mero de iterac¸o˜es e´ muito maior para o crite´rio do erro absoluto. Isso ocorre porque a raiz que estamos procurando tem mo´dulo grande e portanto e´ muito mais dif´ıcil tornar o erro absoluto menor do que �. Quando fazemos um programa computacional, devemos considerar o erro relativo escrito na seguinte forma: |xk+1 − xk| < � ∗max{1, |xk+1|} , pois se |xk+1| estiver pro´ximo de zero o processo na˜o estaciona. Ale´m do teste do erro relativo, devemos colocar um nu´mero ma´ximo de iterac¸o˜es pois se o programa na˜o estiver bem, ou se o me´todo na˜o se aplicar ao problema que se esta´ resolvendo, o programa entrara´ em looping. CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 61 3.2 Iterac¸a˜o Linear A fim de introduzir o me´todo de iterac¸a˜o linear para o ca´lculo de uma raiz da equac¸a˜o: f(x) = 0 , (3.1) onde f(x) e´ uma func¸a˜o cont´ınua num intervalo que contenha a raiz procurada, expressamos, inicialmente, a equac¸a˜o (3.1) na forma: x = ψ(x) , (3.2) de maneira que qualquer soluc¸a˜o de (3.2) seja, tambe´m, soluc¸a˜o de (3.1). Para qualquer func¸a˜o ψ, qualquer soluc¸a˜o de (3.2) e´ chamada de ponto fixo de ψ(x). Assim, o problema de determinar um zero de f(x) foi transformado no problema de determinar o ponto fixo de ψ(x), e essa transformac¸a˜o na˜o deve alterar a posic¸a˜o da raiz procurada. Em geral, ha´ muitos modos de expressar f(x) na forma (3.2). Basta considerarmos: ψ(x) = x+A(x) f(x) , para qualquer A(x) tal que A(x¯) 6= 0. Nem todas, pore´m, sera˜o igualmente satisfato´rias para as nossas finalidades. Algumas formas poss´ıveis da equac¸a˜o: f(x) = x2 − x− 2 = 0; (3.3) cujas ra´ızes sa˜o -1 e 2, por exemplo, sa˜o: a) x = x2 − 2 c) x = 1 + 2x b) x = √ 2 + x d) x = x − x2 − 2x− 8m , m 6= 0. E´ claro, que na˜o necessitamos de um me´todo nu´merico para calcular as ra´ızes de uma equac¸a˜o do segundo grau, contudo esse exemplo ilustrara´ de maneira objetiva os nossos propo´sitos. Como ja´ dissemos anteriormente, geometricamente, (3.1) tem como soluc¸a˜o a intersecc¸a˜o do gra´fico da f com o eixo x, enquanto que uma raiz de (3.2) e´ um nu´mero x¯, para o qual a reta y1 = x intercepta a curva y2 = ψ(x). Pode ocorrer, naturalmente, que estas curvas na˜o se interceptem, caso em que na˜o havera´ raiz real. Admitiremos, contudo, que essas curvas se interceptem no mı´nimo, uma vez; que estamos interessados em determinar uma dessas ra´ızes, digamos x¯, e que ψ(x) e ψ′(x) sejam cont´ınuas num intervalo que contenha essa raiz. Seja x0 uma aproximac¸a˜o inicial para a raiz x¯ de (3.2). Obtemos as aproximac¸o˜es sucessivas xk para a soluc¸a˜o desejada x¯, usando o processo iterativo definido por: xk+1 = ψ (xk) , k = 0, 1, . . . . (3.4) Esse processo e´ chamado Me´todo Iterativo Linear. Para que esse processo seja vantajoso, devemos obter aproximac¸o˜es sucessivas xk, convergentes para a soluc¸a˜o desejada x¯. Contudo, e´ fa´cil obter exemplos para os quais a sequeˆncia xk diverge. Exemplo 3.6 - Considerando em (3.3), x = x2 − 2 e tomando x0 = 2.5, determinar a raiz x¯ = 2. Soluc¸a˜o: Usando (3.4), obtemos: x1 = ψ (x0) = x20 − 2 = (2.5)2 − 2 = 4.25 x2 = ψ (x1) = x21 − 2 = (4.25)2 − 2 = 16.0625 x3 = ψ (x2) = x22 − 2 = (16.0625)2 − 2 = 256.00391 ... CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 62 e e´ o´bvio que se trata de uma sequeˆncia divergente. Assim, a escolha de ψ(x) = x2 − 2 na˜o produz um processo iterativo que seja convergente. As condic¸o˜es suficientes que a func¸a˜o ψ(x) deve satisfazer para assegurar a convergeˆncia da iterac¸a˜o linear esta˜o contidas no Teorema 3.4. Vejamos antes dois teoremas que sera˜o utilizados na prova desse Teorema. Teorema 3.2 - Teorema do Valor Me´dio - Se f e´ cont´ınua em [a,b] e diferencia´vel em (a,b) enta˜o existe pelo menos um ponto ξ entre a e b tal que: f ′(ξ) = f(b)− f(a) b− a , isto e´ , f(b)− f(a) = f ′(ξ)(b− a) . Prova: A prova deste teorema pode ser encontrada em [Swokowski,1983]. Teorema 3.3 - Teorema da Permaneˆncia do Sinal - Seja f uma func¸a˜o real de varia´vel real definida e cont´ınua numa vizinhanc¸a de x0. Se f(x0) 6= 0 enta˜o f(x) 6= 0 para todo x pertencente a um vizinhanc¸a suficientemente pequena de x0. Prova: A prova deste teorema pode ser encontrada em [Swokowski,1983]. Teorema 3.4 - Seja ψ(x) uma func¸a˜o cont´ınua, com derivadas primeira e segunda cont´ınuas num in- tervalo fechado I da forma I = (x¯− h, x¯ + h), cujo centro x¯ e´ soluc¸a˜o de x = ψ(x). Seja x0 ∈ I e M um limitante da forma, |ψ′(x)| ≤ M < 1 em I. Enta˜o: a) a iterac¸a˜o xk+1 = ψ(xk), k = 0, 1, . . ., pode ser executada indefinidamente, pois xk ∈ I, ∀ k. b) |xk − x¯| → 0. c) Se ψ′(x¯) 6= 0 ou ψ′(x¯) = 0 e ψ′′(x¯) 6= 0 e se |x0 − x¯| for suficientemente pequeno enta˜o a sequeˆncia x1, x2, . . . sera´ monotoˆnica ou oscilante. Prova: a) Usaremos induc¸a˜o para provar que xk ∈ I, ∀ k. i) Por hipo´tese x0 ∈ I. ii) Supomos que x0, x1, . . . , xk ∈ I. iii) Provemos que xk+1 ∈ I. Temos: xk+1 − x¯ = ψ (xk) − ψ (x¯) . Usando o teorema do Valor Me´dio, obtemos: xk+1 − x¯ = ψ′ (ξk) (xk − x¯) onde ξk esta´ entre xk e x¯. Tomando mo´dulo, segue que: |xk+1 − x¯| = |ψ′ (ξk) ||xk − x¯| ≤ M |xk − x¯| desde que pela hipo´tese de induc¸a˜o xk ∈ I ⇒ ξk ∈ I e sobre I, |ψ′(x)| ≤ M < 1. Assim: |xk+1 − x¯| ≤ M |xk − x¯|. CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 63 Como M < 1, temos que xk+1 ∈ I. b) Pelo item a) temos que: |xk − x¯| ≤ M |xk−1 − x¯| ≤ M2 |xk−2 − x¯| ≤ . . . ≤ Mk|x0 − x¯| . Como M < 1, passando ao limite, obtemos: lim k→∞ Mk → 0 e portanto |xk − x¯| → 0 . c) Aqui dividiremos a prova em duas partes. Assim: c.1) Seja ψ′(x¯) 6= 0. Pelo Teorema da Permaneˆncia do Sinal temos que numa vizinhanc¸a de x¯ suficientemente pequena, ψ′(x) tera´ o mesmo sinal. Assim de: xk+1 − x¯ = ψ′ (ξk) (xk − x¯) , temos que: (I) Se ψ′(x¯) > 0 e xk ≤ x¯ ⇒ xk+1 ≤ x¯ xk ≥ x¯ ⇒ xk+1 ≥ x¯ (II) Se ψ′(x¯) < 0 e xk ≤ x¯ ⇒ xk+1 ≥ x¯ xk ≥ x¯ ⇒ xk+1 ≤ x¯ Como |xk − x¯| → 0, a convergeˆncia sera´ monotoˆnica em (I) e em (II) sera´ oscilante em torno de x¯. c.2) Seja ψ′(x¯) = 0 e ψ′′(x¯) 6= 0. Usando o teorema do Valor Me´dio, temos que: ψ′(ξk) = ψ′(ξk) − ψ′(x¯) = ψ′′(θk)(ξk − x¯) , onde θk esta´ entre ξk e x¯. Assim: xk+1 − x¯ = ψ′′ (θk) (ξk − x¯) (xk − x¯) . Pelo teorema da Permaneˆncia do Sinal, ψ′′(x) tera´ o mesmo sinal numa vizinhanc¸a suficientemente pequena de x¯. Como (ξk − x¯)(xk − x¯) ≥ 0, pois ξk e xk encontram-se do mesmo lado de x¯, segue que, se: ψ′′(x¯) > 0 ⇒ xk+1 ≥ x¯, ∀ k , ψ′′(x¯) < 0 ⇒ xk+1 ≤ x¯, ∀ k . Neste caso a sequeˆncia x1, x2, . . . sera´ monotoˆnica independente do sinal de x0 − x¯. Isso completa a prova do Teorema 3.4. Consideremos novamente a equac¸a˜o (3.3). Se nosso objetivo e´ encontrar a raiz x¯ = 2, usando o problema de ponto fixo equivalente (3.3.a), teremos: x = x2 − 2 = ψ(x). CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 64 Para que o processo xk+1 = x2k−2 seja convergente devemos ter |ψ′(x)| < 1 na vizinhanc¸a de x¯ = 2. Temos que ψ′(x) = 2x, e desde que |ψ′(x)| > 1 para x > 12 , o Teorema 3.4 na˜o pode ser usado para garantir convergeˆncia. Entretanto, a iterac¸a˜o xk+1 = x2k−2 divergira´ para qualquer escolha de x0 > 12 , como vimos anteriormente. Por outro lado se usarmos o problema de ponto fixo (3.3.b), teremos ψ(x) = √ 2 + x, e assim ψ′(x) = 1 2 √ 2 + x . Portanto |ψ′(x)| < 1 , se e somente se x > −1.75. Assim, pelo Teorema 3.4, podemos crer que a iterac¸a˜o: xk+1 = √ 2 + xk , sera´ convergente para qualquer escolha de x0 > −1.75, como pode ser observado no pro´ximo exemplo. Exemplo 3.7 - Considerando em (3.3), x = √ 2 + x e tomando x0 = 2.5, determinar a raiz x¯ = 2. Soluc¸a˜o: Tomando x0 = 2.5, obteremos a sequeˆncia de aproximac¸o˜es: x1 = ψ(x0) = √ 2 + 2.5 = √ 4.5 = 2.1213203 x2 = ψ(x1) = √ 2 + 2.1213203 = √ 4.1213203 = 2.0301035 x3 = ψ(x2) = √ 2 + 2.0301035 = √ 4.0301035 = 2.0075118 x4 = ψ(x3) = √ 2 + 2.0075118 = √ 4.0075118 = 2.0018771 x5 = ψ(x4) = √ 2 + 2.0018771 = √ 4.0018771 = 2.0004692 x6 = ψ(x5) = √ 2 + 2.0004692 = √ 4.0004692 = 2.0001173 x7 = ψ(x6) = √ 2 + 2.0001173 = √ 4.0001173 = 2.0000293 ... a qual e´, obviamente, convergente para a raiz x¯ = 2. Este exemplo ilustra, tambe´m, a importaˆncia da disposic¸a˜o apropriada de (3.1) na forma (3.2). Uma ilustrac¸a˜o geome´trica da na˜o convergeˆncia e da convergeˆncia do me´todo iterativo xk+1 = ψ(xk) em ambos os casos: xk+1 = x2k − 2 e xk+1 = √ 2 + x e´ dada pelas Figuras 3.7 e 3.8, respectivamente. Observe que em cada uma das figuras, escolhido o ponto x0 caminhamos verticalmente ate´ encontrar a curva ψ(x); em seguida caminhamos horizontalmente ate´ encontrar a reta y = x, e finalmente caminha- mos verticalmente ate´ encontra o eixo dos x onde estara´ localizado o ponto x1. O processo e´ repetido partindo-se de x1, e assim sucessivamente.Temos enta˜o: a) para x = x2 − 2: CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 65 - 53x0x¯1 x2 − 2 x - 6 P1 x1 P0 6 20 15 10 5 6 - Figura 3.7 b) para x = √ 2 + x: P1 P0 √ x+ 2 x 3x0x1x¯1 2 1 ff 6 6 - � � � � � � � � � � � � � � � Figura 3.8 Representamos na Figura 3.7 os pontos: P0 : (x0, ψ (x0)) , P1 : (x1, ψ (x1)), etc. Estes pontos esta˜o, obviamente, afastando-se da intersec¸a˜o das duas curvas y1 = x e y2 = ψ(x), e, ao mesmo tempo, xk esta´ se afastando de x¯. Na Figura 3.8, os pontos P0, P1, etc. esta˜o, obviamente, aproximando-se do ponto de intersec¸a˜o das duas curvas y1 = x e y2 = ψ(x), e, ao mesmo tempo, xk esta´ se aproximando de x¯. Assim em a) temos que o processo iterativo e´ divergente e em b) que o processo iterativo e´ convergente. Ordem de Convergeˆncia A ordem de convergeˆncia de um me´todo mede a velocidade com que as iterac¸o˜es produzidas por esse me´todo aproximam-se da soluc¸a˜o exata. Assim, quanto maior for a ordem de convergeˆncia melhor sera´ o me´todo nume´rico pois mais rapidamente obteremos a soluc¸a˜o. Analisaremos aqui a ordem de CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 66 convergeˆncia do me´todo iterativo linear. Antes pore´m apresentamos a definic¸a˜o de ordem de convergeˆncia de um me´todo nume´rico. Definic¸a˜o 3.3 - Sejam {xk} o resultado da aplicac¸a˜o de um me´todo nume´rico na iterac¸a˜o k e ek = xk−x¯ o seu erro . Se existirem um nu´mero p ≥ 1 e uma constante c > 0 tais que: limk→∞ |ek+1| |ek|p = c enta˜o p e´ chamado de ordem de convergeˆncia desse me´todo. Teorema 3.5 - A ordem de convergeˆncia do me´todo iterativo linear e´ linear, ou seja, p = 1. Prova: Do teorema 3.4, temos que: xk+1 − x¯ = ψ′(ξk)(xk − x¯) onde ξk esta´ entre xk e x¯. Assim, |xk+1 − x¯| |xk − x¯| ≤ |ψ ′(ξk)| ≤ M. Assim a definic¸a˜o 3.3 esta´ satisfeita com p = 1 e c = M , ou seja a ordem de convergeˆncia e´ p = 1. Da´ı o nome de me´todo Iterativo Linear. Ale´m disso, o erro em qualquer iterac¸a˜o e´ proporcional ao erro na iterac¸a˜o anterior, sendo que o fator de proporcionalidade e´ ψ′(ξk). Observac¸o˜es: a) A convergeˆncia do processo iterativo sera´ tanto mais ra´pida quanto menor for o valor de ψ′(x). b) Por outro lado, se a declividade ψ′(x) for maior que 1 em valor absoluto, para todo x pertencente a um intervalo numa vizinhanc¸a da raiz, vimos que a iterac¸a˜o xk+1 = ψ(xk), k = 0, 1, . . ., divergira´. c) Da definic¸a˜o 3.3 podemos afirmar que para k suficientemente grande temos: |ek+1| ' c |ek|p , |ek| ' c |ek−1|p . Dividindo uma equac¸a˜o pela outra eliminamos a constante c e obtemos: ek+1 ek ' ( ek ek−1 )p . Assim, uma aproximac¸a˜o para o valor de p pode ser obtido aplicando-se logaritmo em ambos os membros da expressa˜o acima. Fazendo isso segue que: p ' log ( ek+1 ek ) log ( ek ek−1 ) (3.5) Exemplo 3.8 - Com os valores obtidos no exemplo 3.7, verifique que o me´todo iterativo linear realmente possui ordem de convergeˆncia p = 1. CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 67 Soluc¸a˜o: Do resultado do exemplo 3.7, fazendo os ca´lculos para os valores de |xk+1 − x¯| e usando (3.5), obtemos a tabela: k xk+1 = √ 2 + xk ek = |xk − x¯| p 0 2.5 0.5 1 2.1213203 0.1213203 2 2.0301035 0.0301035 0.984 3 2.0075118 0.0075118 0.996 4 2.0018771 0.0018771 0.999 5 2.0004692 0.0004692 0.999 6 2.0001173 0.0001173 0.999 7 2.0000293 0.0000293 1.001 Pela tabela vemos que a medida que k aumenta, o valor de p→ 1, mostrando que realmente a ordem de convergeˆncia do me´todo iterativo linear e´ 1. Assim podemos dizer que a importaˆncia do me´todo iterativo linear esta´ mais nos conceitos que sa˜o introduzidos em seu estudo que em sua eficieˆncia computacional. Ale´m disso, tem a desvantagem de que e´ preciso testar se |ψ′(x)| < 1 no intervalo que conte´m a raiz, se desejamos ter garantia de convergeˆncia. Exerc´ıcios 3.3 - Justifique que a equac¸a˜o: f(x) = 4 x − ex = 0 possui uma raiz no intervalo (0, 1) e outra no intervalo (2, 3). 3.4 - Considere a equac¸a˜o f(x) = 2 x2 − 5 x+ 2 = 0, cujas ra´ızes sa˜o: x1 = 0.5 e x2 = 2.0. Considere ainda os processos iterativos: a) xk+1 = 2 x2k + 2 5 , b ) xk+1 = √ 5 xk 2 − 1. Qual dos dois processos voceˆ utilizaria para obter a raiz x1? Por que? 3.5 - Considere as seguintes func¸o˜es: a) ψ1(x) = 2 x− 1, b) ψ2(x) = x2 − 2 x+ 2, c) ψ3(x) = x2 − 3 x+ 3. Verifique que 1 e´ raiz de todas estas func¸o˜es. Qual delas voceˆ escolheria para obter a raiz 1, utilizando o processo iterativo xk+1 = ψ(xk)? Com a sua escolha, exiba a sequeˆncia gerada a partir da condic¸a˜o inicial x0 = 1.2. 3.6 - Deseja-se obter a raiz positiva da equac¸a˜o: b x2 + x − a = 0, a > 0, b > 0, atrave´s do processo iterativo definido por: xk+1 = a − b x2k .Qual a condic¸a˜o que devemos impor para a e b para que haja convergeˆncia? Por que? 3.7 - A equac¸a˜o: x2 − a = 0 possui uma raiz x¯ = √a. Explicar alge´brica e geometricamente por que a sequeˆncia {xk}, obtida atrave´s do processo iterativo definido por: xk+1 = axk , na˜o converge para √ a qualquer que seja o valor de x0. CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 68 3.3 Me´todo de Newton O me´todo de Newton e´ uma das te´cnicas mais populares para se determinar ra´ızes de equac¸o˜es na˜o lineares. Existem va´rias maneiras de deduzir o me´todo de Newton, a que apresentaremos aqui e´ baseada no me´todo de iterac¸a˜o linear. Assim, para descrever tal me´todo, consideremos a equac¸a˜o (3.2), isto e´: ψ(x) = x+A(x)f(x) , com f ′(x) 6= 0 , (3.6) onde a func¸a˜o A(x) deve ser escolhida de tal forma que A(x¯) 6= 0. Vimos pelo Teorema 3.4 que temos garantia de convergeˆncia se max|ψ′(x)| < 1 para x ∈ I. Assim se escolhermos A(x) tal que ψ′(x¯) = 0, teremos que para x ∈ I, (I suficientemente pequeno), max |ψ′(x)| < 1, garantindo enta˜o a convergeˆncia do me´todo. Derivando (3.6) em relac¸a˜o a x, obtemos: ψ′(x) = 1 + A′(x)f(x) + A(x)f ′(x). Fazendo x = x¯, segue que: ψ′(x¯) = 1 + A(x¯)f ′(x¯) , pois f(x¯) = 0 , e colocando: ψ′(x¯) = 0, teremos A(x¯) = − 1 f ′(x¯) 6= 0 desde que f ′(x¯) 6= 0 . Tomando enta˜o: A(x) = − 1 f ′(x) , obtemos ψ(x) = x − f(x) f ′(x) e o processo iterativo enta˜o definido por: xk+1 = xk − f (xk) f ′ (xk) (3.7) e´ chamado Me´todo de Newton, que converge sempre que |x0 − x¯| for suficientemente pequeno. Uma interpretac¸a˜o geome´trica do me´todo de Newton e´ dada na Figura 3.9. f(xk) x¯ xk+1 α xk f(x) x 6 - Figura 3.9 Dado xk, o valor xk+1 pode ser obtido graficamente trac¸ando-se pelo ponto (xk, f(xk)) a tangente a` curva y = f(x). O ponto de intersec¸a˜o da tangente com o eixo dos x determina xk+1. CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 69 De fato, pela lei da tangente: f ′ (xk) = tg α = f (xk) xk − xk+1 ⇒ xk − xk+1 = f (xk)f ′ (xk) ⇒ xk+1 = xk − f (xk) f ′ (xk) . Devido a` sua interpretac¸a˜o geome´trica o me´todo de Newton e´ tambe´m chamado de Me´todo das Tangentes. Exemplo 3.9 - Determinar, usando o me´todo de Newton, a menor raiz positiva da equac¸a˜o: 4 cos x − ex = 0 , com erro inferior a 10−2. Soluc¸a˜o: O processo mais simples e eficaz para se obter um valor inicial e´ o me´todo gra´fico. Com esse objetivo dividimos a equac¸a˜o inicial f(x) = 0 em outras duas equac¸o˜es mais simples, que chamaremos de y1 e y2. Note que o rearranjo para obter essas duas equac¸o˜es deve apenas levar em considerac¸a˜o a igualdade f(x) = 0. Tomando: y1 = 4 cos x , y2 = ex, observe que poder´ıamos ter tomado y1 = cos x e y2 = e x 4 , e colocando as duas func¸o˜es no mesmo gra´fico, obtemos a Figura 3.10. 4 3 2 1 y2 = e x y1 = 4cos x 21x¯ - 6 Figura 3.10 Como ja´ dissemos anteriormente, o ponto de intersec¸a˜o das duas curvas e´ a soluc¸a˜o x¯ procurada. Analisando a Figura 3.10, vemos que x¯ esta´ nas vizinhanc¸as do ponto 1.0 e portanto vamos tomar x0 = 1.0. Por outro lado, da equac¸a˜o original, obtemos: f(xk) = 4 cos xk − exk ; f ′(xk) = −4 sen xk − exk . Para efetuar os ca´lculos seguintes, observe se sua calculadora esta´ em radianos, pois a func¸a˜o dada envolve operac¸o˜es trigonome´tricas. Ale´m disso, como queremos o resultado com erro inferior a 10−2 basta efetuar os ca´lculos com treˆs casas decimais. Assim: f(x0) = f(1.0) = 4 cos (1.0)− e1.0 = 4 × (0.540)− 2.718 = −0.557 ; f ′(x0) = f ′(1.0) = −4 sen (1.0)− e1.0 = −4 × (0.841)− 2.718 = −6.084 ; CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 70 Usando (3.7), obtemos: x1 = 1.0 − f(1.0) f ′(1.0) ⇒ x1 = 1.0 − (−0.557)(−6.048) ⇒ x1 = 0.908 . Calculando o erro relativo, temos: ∣∣∣∣x1 − x0x1 ∣∣∣∣ ' 0.101 . que e´ maior que 10−2. Devemos fazer uma nova iterac¸a˜o, para tanto calculemos: f(x1) = f(0.908) = 4 cos (0.908)− e0.908 = 4 × (0.615)− 2.479 = −0.019 , f ′(x1) = f ′(0.908) = −4 sen (0.908)− e0.908 = −4 × (0.788)− 2.479 = −5.631 . Novamente, usando (3.7), obtemos: x2 = 0.908 − f(0.908) f ′(0.908) ⇒ x2 = 0.908 − (−0.019)(−5.631) ⇒ x2 = 0.905 . Calculando o erro relativo, segue que:∣∣∣∣x2 − x1x2 ∣∣∣∣ ' 0.0033 , ou seja a aproximac¸a˜o x2 = 0.905 possui duas casas decimais corretas. De fato, a soluc¸a˜o exata e´ 0.9047882. Logo, a menor raiz positiva da equac¸a˜o 4 cos x− ex = 0, com � < 0.01, e´ x¯ = 0.905. Observe, da Figura 3.10, que a raiz encontrada e´ a u´nica raiz positiva da equac¸a˜o dada. Ordem de Convergeˆncia Analisemos agora a convergeˆncia do me´todo de Newton. Teorema 3.6 - Se f, f ′, f ′′ sa˜o cont´ınuas em I cujo centro x¯ e´ soluc¸a˜o de f(x) = 0 e se f ′(x¯) 6= 0 enta˜o a ordem de convergeˆncia do me´todo de Newton e´ quadra´tica, ou seja, p = 2. Prova: Subtraindo a equac¸a˜o x¯ = ψ(x¯) de (3.7), obtemos: xk+1 − x¯ = ψ(xk) − ψ(x¯) onde ψ(x) = x − f(x) f ′(x) . Desenvolvendo ψ(xk) em se´rie de Taylor em torno do ponto x¯, obtemos: xk+1 − x¯ = ψ(x¯) + (xk − x¯) ψ′(x¯) + (xk − x¯) 2 2! ψ′′(ξk) − ψ(x¯) . Agora, no me´todo de Newton, ψ′(x¯) = 0, (lembre-se que esta condic¸a˜o foi imposta para a determinac¸a˜o de A(x)), e portanto: |xk+1 − x¯| |xk − x¯|2 = ψ′′(ξk) 2! ≤ C. CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 71 Portanto a ordem de convergeˆncia e´ p = 2. Assim a vantagem do me´todo de Newton e´ que sua convergeˆncia e´ quadra´tica, isto significa que a quantidade de d´ıgitos significativos corretos duplica a` medida que os valores da sequeˆncia se aproxima de x¯. Note que essa correc¸a˜o na˜o acontece em relac¸a˜o a`s primeiras iterac¸o˜es realizadas. A desvantagem do me´todo de Newton esta´ no fato de termos que calcular a derivada da func¸a˜o e em cada iterac¸a˜o calcular o seu valor nume´rico, o que pode ser muito caro computacionalmente. Ale´m disso a func¸a˜o pode ser na˜o diferencia´vel em alguns pontos do domı´nio. Exerc´ıcios 3.8 - Considere a equac¸a˜o dada no exemplo 3.9. Obtenha a raiz positiva com quatro casas decimais corretas. Usando (3.5) confirme que a ordem de convergeˆncia do me´todo de Newton e´ quadra´tica, isto e´, p = 2. 3.9 - Usando o me´todo de Newton, com erro inferior a 10−2, determinar uma raiz das seguintes equac¸o˜es: a) 2 x = tg x, b) 5 x3 + x2 − 12 x+ 4 = 0, c) sen x− ex = 0, d) x4 − 8 = 0. 3.10 - Considere a fo´rmula para determinar a raiz cu´bica de Q: xk+1 = 1 3 [ 2xk + Q x2k ] , k = 0, 1, . . . . a) Mostre que a fo´rmula acima e´ um caso especial de iterac¸a˜o de Newton. b) Usando a fo´rmula dada no item a) calcule 3 √ 4 com precisa˜o de 10−2, determinando o valor inicial atrave´s de gra´fico. 3.11 - Usando o me´todo de Newton, determine o valor de pi com 3 algarismos significativos corretos. Use como valor inicial x0 = 3. 3.4 Me´todo das Secantes Como foi observado anteriormente, uma se´ria desvantagem do me´todo de Newton e´ a necessidade de se obter f ′(x), bem como calcular seu valor nume´rico, a cada passo. Ha´ va´rias maneiras de modificar o me´todo de Newton a fim de eliminar essa desvantagem. Uma modificac¸a˜o consiste em substituir a derivada f ′(xk) pelo quociente das diferenc¸as: f ′ (xk) ∼= f (xk) − f (xk−1) xk − xk−1 , (3.8) onde xk, xk−1 sa˜o duas aproximac¸o˜es quaisquer para a raiz x¯. Note que f ′(xk) e´ o limite da relac¸a˜o (3.8) para xk−1 → xk. CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 72 O me´todo de Newton, quando modificado desta maneira, e´ conhecido como Me´todo das Secantes. Substituindo (3.8) em (3.7) obtemos: xk+1 = xk − f (xk)f (xk) − f (xk−1) (xk − xk−1) = xk − (xk − xk−1) f (xk) f (xk) − f (xk−1) Assim, colocando o segundo membro sobre o mesmo denominador, obtemos uma expressa˜o mais simples para o me´todo das secantes: xk+1 = xk−1 f (xk) − xk f (xk−1) f (xk) − f (xk−1) . (3.9) Observe que devem estar dispon´ıveis duas aproximac¸o˜es iniciais, antes que (3.9) possa ser usada. Na Figura 3.11, ilustramos graficamente como uma nova aproximac¸a˜o, pode ser obtida de duas anteriores. α α xkxk−1x¯xk+1 f(xk)− f(xk−1) f(xk−1) f(xk) y x 6 - Figura 3.11 Pela Figura 3.11 vemos que, geometricamente, o me´todo das secantes consiste em considerar, como aproximac¸a˜o seguinte, a intersec¸a˜o da corda que une os pontos (xk−1, f(xk−1)) e (xk, f(xk)) com o eixo dos x. Tomando: xk+1 = xk − f (xk) (xk − xk−1)f (xk) − f (xk−1) ⇒ xk+1 − xk f(xk) = xk − xk−1 f (xk) − f (xk−1) ⇒ f (xk)xk+1 − xk = f (xk) − f (xk−1) xk−1 − xk = tg α. Exemplo 3.10 - Determinar a raiz positiva da equac¸a˜o: √ x − 5 e−x = 0 , pelo me´todo das secantes, com erro inferior a 10−2. CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 73 Soluc¸a˜o: Novamente, para obtermos os valores iniciais x0 e x1 necessa´rios para iniciar o processo iterativo, dividimos a equac¸a˜o original f(x) = 0 em outras duas y1 e y2, com y1 = √ x e y2 = 5e−x, que colocadas no mesmo gra´fico, produz a Figura 3.12: y2 = 5e −x y1 = √ x 32x¯1 1 2 3 6 - Figura 3.12 O ponto de intersec¸a˜o das duas curvas e´ a soluc¸a˜o x¯ procurada. Analisando a Figura 3.12, vemos que x¯ esta´ nas vizinhanc¸as do ponto 1.4. Assim, tomando x0 = 1.4 e x1 = 1.5, obtemos: f (x0) = f(1.4) = √ 1.4− 5 e−1.4 = 1.183− 5 × 0.247 = −0.052 , f (x1) = f(1.5) = √ 1.5− 5 e−1.5 = 1.225− 5 × 0.223 = 0.110 . Portanto, usando (3.9), obtemos que: x2 = 1.4 f (1.5) − 1.5 f (1.4) f (1.5) − f (1.4) . ⇒ x2 = 1.4 (0.110) − 1.5 (−0.052)0.110 − (−0.052) ⇒ x2 = 1.432 . Calculando o erro relativo: ∣∣∣∣x2 − x1x2 ∣∣∣∣ ' 0.047 observamos que este e´ maior que 10−2. Devemos portanto fazer mais uma iterac¸a˜o. Calculemos enta˜o: f(x2) = f(1.432) = √ 1.432 − 5 e−1.432 = 1.197 − 5 × 0.239 = 0.002. Novamente, usando (3.9), obtemos: x3 = 1.5 f (1.432) − 1.432 f (1.5) f (1.432) − f (1.5) . ⇒ x3 = 1.5 (0.002) − 1.432 (0.110)0.002 − (0.110) ⇒ x3 = 1.431 . Fazendo: ∣∣∣∣x3 − x2x3 ∣∣∣∣ ' 0.0007 < 10−2. Logo, a raiz positiva da equac¸a˜o √ x − 5 e−x = 0, com � < 10−2, e´ x¯ = 1.431. CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 74 Ordem de Convergeˆncia Daremos aqui a ordem de convergeˆncia do me´todo das secantes. Teorema 3.7 - A ordem de convergeˆncia do me´todo das secantes e´ p = (1 + √ 5)/2 ' 1.618. Prova: A prova deste teorema pode ser encontrada em [Ostrowski,1966]. Observe que apesar da ordem de convergeˆncia do me´todo das secantes ser inferior a` do me´todo de Newton, ele fornece uma alternativa via´vel, desde que requer somente um ca´lculo da func¸a˜o f por passo, enquanto que dois ca´lculos (f(xk) e f ′(xk)) sa˜o necessa´rios para o me´todo de Newton. Exerc´ıcios 3.12 - Considere a equac¸a˜o dada no exemplo 3.10. Obtenha a raiz positiva com quatro casas decimais corretas. Usando (3.5) confirme que a ordem de convergeˆncia do me´todo das secantes e´ p ' 1.618. 3.13 - Determinar, pelo me´todo das secantes, uma raiz de cada uma das equac¸o˜es: a) x = 2.7 ln x, b) log x − cos x = 0, c) e−x − log x = 0. 3.14 - A equac¸a˜o x = tgx tem uma raiz entre pi2 e 3pi 2 . Determina´-la pelo me´todo das secantes com erro inferior a 10−3. 3.5 Me´todo Regula Falsi O me´todo Regula Falsi, e´ uma variac¸a˜o do me´todo das secantes. Ele consiste em tomar duas aproximac¸o˜es iniciais x0 e x1 tais que f(x0) e f(x1) tenham sinais opostos, isto e´: f (x0) × f (x1) < 0. Uma nova aproximac¸a˜o e´ determinada usando o me´todo das secantes, ou seja: x2 = x0 f (x1) − x1 f (x0) f (x1) − f (x0) . Se ∣∣∣∣x2 − x0x2 ∣∣∣∣ < � ou ∣∣∣∣x2 − x1x2 ∣∣∣∣ < � , para um � pre´-fixado, enta˜o x2 e´ a raiz procurada. Caso contra´rio, calculamos f(x2) e escolhemos entre x0 e x1 aquele cuja f tenha sinal oposto ao da f(x2). Com x2 e esse ponto calculamos x3 usando a fo´rmula das secantes, isto e´, usando (3.9) e assim sucessivamente. O processo iterativo deve ser continuado ate´ que se obtenha a raiz com a precisa˜o pre´-fixada. Uma interpretac¸a˜o geome´trica do me´todo regula falsi e´ dada na Figura 3.13. Observe que, na Figura 3.13, xk+1 e´ o ponto de intersec¸a˜o da corda que une os pontos (xk−1, f(xk−1)) e (xk, f(xk)) com o eixo dos x. Nesse caso o novo intervalo contendo a raiz sera´ (xk−1, xk+1). A aproximac¸a˜o xk+2 sera´ o ponto de intersec¸a˜o da corda que une os pontos (xk−1, f(xk−1)) e (xk+1, f(xk+1)) com o eixo dos x. Observe ainda que a aplicac¸a˜o do me´todo regula falsi sempre mante´m a raiz procurada entre as aproximac¸o˜es mais recentes. CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 75 x¯ xk−1 xk+2 B BN ? xk+1 xk x f(x) - 6 Figura 3.13 Exemplo 3.11 - Determinar a menor raiz positiva da equac¸a˜o: x − cos x = 0 , pelo me´todo regula falsi, com erro inferior a 10−3. Soluc¸a˜o: Novamente, para obtermos os valores iniciais x0 e x1 necessa´rios para iniciar o processo iterativo, dividimos a equac¸a˜o original f(x) = 0 em y1 = x e y2 = cos x que colocadas no mesmo gra´fico, produz a Figura 3.14: y2 y1 2 1 21x¯ � � � � � � � � �� 6 - Figura 3.14 O ponto de intersec¸a˜o das duas curvas e´ a soluc¸a˜o x¯ procurada. Analisando a Figura 3.14, vemos que x¯ esta´ nas vizinhanc¸as do ponto 0.7. Assim, tomando x0 = 0.7 e x1 = 0.8, obtemos: f (x0) = f(0.7) = 0.7− cos 0.7 = 0.7− 0.7648 = −0.0648 , f (x1) = f(0.8) = 0.8− cos 0.8 = 0.8− 0.6967 = 0.1033 , CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 76 e portanto: f (x0) × f (x1) < 0. Portanto, usando (3.9), obtemos que: x2 = 0.7 f (0.8) − 0.8 f (0.7) f (0.8) − f (0.7) . ⇒ x2 = 0.7 (0.1033) − 0.8 (−0.0648)0.1033 − (−0.0648) ⇒ x2 = 0.7383. Fazendo: ∣∣∣∣x2 − x0x2 ∣∣∣∣ ' 0.052 e ∣∣∣∣x2 − x1x2 ∣∣∣∣ ' 0.084 obtemos que ambos sa˜o maiores que 10−3. Calculando: f (x2) = f(0.7383) = 0.7383 − cos 0.7383 = 0.7383 − 0.7396 = −0.0013. vemos que f(x2) × f(x1) < 0, e portanto a raiz esta´ entre x1 e x2. Assim, usando novamente (3.9), segue que: x3 = 0.8 f (0.7383) − 0.7383 f (0.8) f (0.7383) − f (0.8) . ⇒ x3 = 0.8 (−0.0013) − 0.7383 (0.1033)−0.0013 − (0.1033) ⇒ x3 = 0.7390. Calculando o erro relativo: ∣∣∣∣x3 − x2x3 ∣∣∣∣ ' 0.00095 , vemos que este e´ menor 10−3. Assim, a menor raiz positiva, (observe pela Figura 3.14, que a raiz positiva e´ u´nica) , da equac¸a˜o x− cos x = 0, com � < 10−3, e´ x¯ = 0.7390. Ordem de Convergeˆncia A ordem de convergeˆncia do me´todo regula falsi e´ semelhante ao do me´todo das secantes uma vez que o procedimento para o ca´lculo das aproximac¸o˜es sa˜o os mesmos em ambos os casos. Assim a ordem de convergeˆncia do me´todo regula falsi tambe´m e´ p = (1 + √ 5)/2 ' 1.618. Exerc´ıcios 3.15 - Considere a equac¸a˜o dada no exemplo 3.11. Obtenha a raiz positiva com cinco casas decimais corretas. Usando (3.5) confirme que a ordem de convergeˆncia do me´todo regula falsi e´ p ' 1.618. 3.16 - Determinar uma raiz de cada uma das equac¸o˜es: a) sen x − x ex = 0, b) cos x = ex, usando o me´todo regula falsi. 3.17 - A equac¸a˜o: x − 2 sen x = 0 possui uma raiz no intervalo [1.8, 2.0]. Determina´-la pelo me´todo regula falsi, com duas casas decimais corretas. CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 77 3.6 Sistemas de Equac¸o˜es na˜o Lineares Nesta sec¸a˜o consideramos o problema da determinac¸a˜o de ra´ızes de equac¸o˜es na˜o lineares simultaˆneas da forma: f1(x1, x2, . . . , xm) = 0 f2(x1, x2, . . . , xm) = 0 ... fm(x1, x2, . . . , xm) = 0 onde cada fi, i = 1, 2, . . . ,m e´ uma func¸a˜o real de m varia´veis reais. Embora esse to´pico seja de consi- dera´vel importaˆncia, daremos aqui apenas uma breve introduc¸a˜o. Para maiores detalhes os interessados podem consultar, por exemplo, [Ortega, 70]. Assim, para efeito de simplicidade, e sem perda de generalidade, consideraremos apenas o caso de duas equac¸o˜es a duas inco´gnitas, isto e´, sistemas na˜o lineares da forma:{ f(x, y) = 0 g(x, y) = 0 (3.10) Geometricamente, as ra´ızes deste sistema sa˜o os pontos do plano (x, y), onde as curvas definidas por f e g se interceptam. 3.6.1 Iterac¸a˜o Linear A resoluc¸a˜o de sistemas na˜o lineares atrave´s do me´todo de iterac¸a˜o linear e´ muito semelhante ao me´todo iterativo linear estudado anteriormente. Assim, um primeiro passo ao se aplicar iterac¸a˜o linear e´ reescrever o sistema (3.10) na forma: { x = F (x, y) y = G(x, y). (3.11) de forma que qualquer soluc¸a˜o de (3.11) seja, tambe´m, soluc¸a˜o de (3.10). Sejam (x¯, y¯) uma soluc¸a˜o de (3.10) e (x0, y0) uma aproximac¸a˜o para (x¯, y¯). Obtemos as aproximac¸o˜es sucessivas (xk, yk) para a soluc¸a˜o desejada (x¯, y¯), usando o processo iterativo definido por:{ xk+1 = F (xk, yk) yk+1 = G(xk, yk). (3.12) Esse processo e´ chamado Me´todo Iterativo Linear para Sistemas na˜o Lineares. O processo (3.12) convergira´ sob as seguintes condic¸o˜es suficientes (mas na˜o necessa´rias): a) F , G e suas derivadas parciais de primeira ordem sejam cont´ınuas numa vizinhanc¸a V da raiz (x¯, y¯). b) As seguintes desigualdades sejam satisfeitas: |Fx| + |Fy| ≤ k1 < 1 |Gx| + |Gy| ≤ k2 < 1, para todo ponto (x, y) pertencente a` uma vizinhanc¸a V de (x¯, y¯), onde: Fx = ∂F∂x , Fy = ∂F ∂y , etc. c) A aproximac¸a˜o inicial (x0, y0) pertenc¸a a vizinhanc¸a V de (x¯, y¯). Para obtermos uma soluc¸a˜o com uma determinada precisa˜o � devemos, durante o processo iterativo, calcular o erro relativo para todas as componentes do vetor soluc¸a˜o. CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 78 Exemplo 3.12 - Considere o seguinte sistema na˜o linear:{ f(x, y) = 0.2 x2 + 0.2 x y − x+ 0.6 = 0 g(x, y) = 0.4 x+ 0.1x y2 − y + 0.5 = 0 a) Verifique que reescrevendo o sistema dado na forma:{ x = 0.2 x2 + 0.2 x y + 0.6 = F (x, y) y = 0.4 x+ 0.1 x y2 + 0.5 = G(x, y) as condic¸o˜es suficientes para garantir a convergeˆncia sa˜o satisfeitas. b) Aplique o me´todo iterativo linear para resolver o sistema dado. Soluc¸a˜o: Uma soluc¸a˜o desse sistema, facilmente comprova´vel, e´ o ponto:(x¯, y¯) = (1, 1). E´ claro que na˜o conhecemos, a priori, a soluc¸a˜o do sistema , mas este e´ apenas um exemplo para ilustrar a verificac¸a˜o das condic¸o˜es suficientes de convergeˆncia , bem como a aplicac¸a˜o do me´todo iterativo linear. Mais adiante mostraremos como determinar os valores iniciais. Para verificar as condic¸o˜es suficientes, calculemos inicialmente, as derivadas parciais de F e G. Assim: Fx = 0.4 x+ 0.2 y , Fy = 0.2 x , Gx = 0.4 + 0.1 y2 , Gy = 0.2 x y , Se escolhermos, por exemplo, (x0, y0) = (0.9, 1.1), vemos que F,G e suas derivadas parciais sa˜o cont´ınuas em (x0, y0). Ale´m disso, as desigualdades que figuram nas condic¸o˜es para convergeˆncia, sa˜o satisfeitas, pois temos: |Fx| + |Fy| = |(0.4)(0.9)| + |(0.2)(1.1)| + |(0.2)(0.9)| = 0.76 < 1 |Gx| + |Gy| = |(0.4) + (0.1)(1.1)2| + |(0.2)(0.9)(1.1)| = 0.719 < 1. E e´ claro que (x0, y0) esta´ na vizinhanc¸a de (x¯, y¯). Tomando enta˜o (x0, y0) = (0.9, 1.1) e usando o processo iterativo definido por(3.12), obtemos: x1 = F (x0, y0) = (0.2)(0.9)2 + (0.2)(0.5)(1.1) + 0.6 ⇒ x1 = 0.96 y1 = G (x0, y0) = (0.4)(0.9) + (0.1)(0.9)(1.1)2 + 0.5 ⇒ y1 = 0.9689 x2 = F (x1, y1) = (0.2)(0.96)2 + (0.2)(0.96)(0.9689) + 0.6 ⇒ x2 = 0.9703 y2 = G (x1, y1) = (0.4)(0.96) + (0.1)(0.96)(0.0.9689)2 + 0.5 ⇒ y2 = 0.9791 x3 = F (x2, y2) = (0.2)(0.9703)2 + (0.2)(0.9703)(0.9791) + 0.6 ⇒ x3 = 0.9773 y3 = G (x2, y2) = (0.4)(0.9703) + (0.1)(0.9703)(0.9791)2 + 0.5 ⇒ y3 = 0.9802 ... E´ claro que a sequeˆncia (xk, yk) esta´ convergindo para (1, 1). Ale´m disso, podemos dizer que a soluc¸a˜o (x¯, y¯), com erro relativo inferior a 10−2, e´ (0.9773, 0.9802), desde que |x3 − x2|x3 ' 0.007 e|y3 − y2| y3 ' 0.001. Observe ainda que mesmo se uma das componentes estiver com a precisa˜o desejada, mas a outra na˜o, o processo deve ser continuado ate´ que todas estejam com a precisa˜o pre´-fixada. CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 79 Exerc´ıcios 3.18 - Usando o me´todo iterativo linear determinar a soluc¸a˜o de:{ x = 0.7 sen x+ 0.2 cos y y = 0.7 cos x− 0.2 sen y pro´xima a (0.5,0.5). 3.19 - O sistema na˜o linear: { x2 + x y2 = 2 x y − 3 x y3 = −4 possui uma raiz pro´xima a (0.8,1.2). Usando o me´todo iterativo linear determine essa raiz com precisa˜o de 10−1. 3.6.2 Me´todo de Newton Para adaptar o me´todo de Newton a sistemas na˜o lineares, procedemos como se segue: Seja (x0, y0) uma aproximac¸a˜o para a soluc¸a˜o (x¯, y¯) de (3.10). Admitindo que f e g sejam suficiente- mente diferencia´veis, expandimos f(x, y) e g(x, y), usando se´rie de Taylor para func¸o˜es de duas varia´veis, em torno de (x0, y0). Assim:{ f(x, y) = f (x0, y0) + fx (x0, y0) (x− x0) + fy (x0, y0) (y − y0) + . . . g(x, y) = g (x0, y0) + gx (x0, y0) (x− x0) + gy (x0, y0) (y − y0) + . . . Admitindo que (x0, y0) esteja suficientemente pro´ximo da soluc¸a˜o (x¯, y¯) a ponto de poderem ser abandonados os termos de mais alta ordem, podemos determinar uma nova aproximac¸a˜o para a raiz (x¯, y¯) fazendo f(x, y) = g(x, y) = 0. Obtemos, enta˜o, o sistema:{ fx (x− x0) + fy (y − y0) = −f gx (x− x0) + gy (y − y0) = −g (3.13) onde esta´ entendido que todas as func¸o˜es e derivadas parciais em (3.13) devem ser calculadas em (x0, y0). Observe que (3.13) e´ agora um sistema linear. Ale´m disso, se na˜o tivessemos desprezado os termos de mais alta ordem no desenvolvimento de Taylor , enta˜o (x, y) seria a soluc¸a˜o exata do sistema na˜o linear. Entretanto, a resoluc¸a˜o de (3.13) fornecera´ uma soluc¸a˜o que chamaremos de (x1, y1). Devemos, enta˜o, esperar que (x1, y1) esteja mais pro´xima de (x¯, y¯) do que (x0, y0). Resolvendo (3.13) pela regra de Cramer obtemos: x1 − x0 = ∣∣∣∣ −f fy−g gy ∣∣∣∣∣∣∣∣ fx fygx gy ∣∣∣∣ = [−fgy + gfy J(f, g) ] (x0,y0) y1 − y0 = ∣∣∣∣ fx − fgx − g ∣∣∣∣∣∣∣∣ fx fygx gy ∣∣∣∣ = [−gfx + fgx J(f, g) ] (x0,y0) onde J(f, g) = fxgy − fygx 6= 0 em (x0, y0). A func¸a˜o J(f, g) e´ denominada de Jacobiano das func¸o˜es f e g. A soluc¸a˜o (x1, y1) desse sistema fornece, agora, uma nova aproximanc¸a˜o para (x¯, y¯). A repetic¸a˜o CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 80 desse processo conduz ao Me´todo de Newton para Sistemas na˜o Lineares. Assim, o me´todo de Newton para sistemas na˜o lineares e´ definido por: xk+1 = xk − [ fgy − gfy J(f, g) ] (xk, yk) yk+1 = yk − [ gfx − fgx J(f, g) ] (xk, yk) (3.14) com J(f, g) = fxgy − fygx. Observac¸o˜es: 1) Quando essa iterac¸a˜o converge, a convergeˆncia e´ quadra´tica. 2) O me´todo de Newton converge sob as seguintes condic¸o˜es suficientes: a) f, g e suas derivadas parciais ate´ segunda ordem sejam cont´ınuas e limitadas numa vizinhanc¸a V contendo (x¯, y¯). b) O Jacobiano J(f, g) na˜o se anula em V . c) A aproximac¸a˜o inicial (x0, y0) seja escolhida suficientemente pro´xima da raiz (x¯, y¯). 3) O me´todo de Newton pode ser, obviamente, aplicado a um sistema de n equac¸o˜es a n inco´gnitas. Em cada etapa da iterac¸a˜o teremos, enta˜o, que calcular n2 func¸o˜es derivadas parciais e n func¸o˜es. Isso representa um considera´vel custo computacional. Novamente, a menos que seja dispon´ıvel uma informac¸a˜o, a priori, a respeito da localizac¸a˜o da raiz desejada, ha´, claramente, a possibilidade da iterac¸a˜o na˜o convergir ou que ela convirja para uma outra raiz. A soluc¸a˜o de um sistema de n equac¸o˜es, sendo n um valor elevado, torna-se muito dif´ıcil mesmo com o uso de computadores. Exemplo 3.13 - Determinar uma raiz do sistema:{ x2 + y2 = 2 x2 − y2 = 1 com precisa˜o de 10−3, usando o me´todo de Newton. Soluc¸a˜o: Temos: f(x, y) = x2+y2−2 = 0 e g(x, y) = x2−y2−1 = 0. Para obter o valor inicial (x0, y0), trac¸amos no mesmo gra´fico as duas equac¸o˜es dadas. Para o sistema dado, obtemos a Figura 3.15: 1.5x¯.5 y¯ 1 .5 6 - Figura 3.15 CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 81 Da Figura 3.15, observamos que o sistema dado admite 4 soluc¸o˜es, uma em cada quadrante. Vamos aqui determinar apenas a que se encontra no 1o quadrante. O ponto de intersec¸a˜o das duas equac¸o˜es e´ a soluc¸a˜o (x¯, y¯) procurada. Analisando a Figura 3.15, vemos que (x¯, y¯) esta´ nas vizinhanc¸as do ponto (1.2, 0.7). Tomemos enta˜o: (x0, y0) = (1.2, 0.7). Calculamos primeiramente as derivadas parciais: fx = 2 x , fy = 2 y , gx = 2 x , gy = −2 y . Assim: f(x0, y0) = f(1.2, 0.7) = (1.2)2 + (0.7)2 − 2 = −0.07 , g(x0, y0) = g(1.2, 0.7) = (1.2)2 − (0.7)2 − 1 = −0.05 , fx(x0, y0) = fx(1.2, 0.7) = 2× (1.2) = 2.4 = gx(x0, y0) , gx(x0, y0) = gx(1.2, 0.7) = 2× (0.7) = 1.4 = −gy(x0, y0) . Enta˜o, usando (3.14), obtemos: x1 = 1.2− [ fgy − gfy fxgy − fygx ] (1.2,0.7) = 1.2− [ (−0.07)(−1.4)− (−0.05)(1.4) −(2.4)(1.4)− (2.4)(1.4) ] = 1.225 , y1 = 0.7− [ gfx − fgx fxgy − fygx ] (1.2,0.7) = 0.7− [ (−0.05)(2.4)− (−0.07)(2.4) −(2.4)(1.4) − (2.4)(1.4) ] = 0.7071. Calculando o erro relativo: ∣∣∣∣x1 − x0x1 ∣∣∣∣ ' 0.02 e ∣∣∣∣y1 − y0y1 ∣∣∣∣ ' 0.01 observamos que ambos sa˜o maiores que 10−3. Assim, devemos fazer nova iterac¸a˜o. Calculemos enta˜o: f(x1, y1) = f(1.225, 0.7071) = (1.225)2 + (0.7071)2 − 2 = −0.000615 g(x1, y1) = g(1.225, 0.7071) = (1.225)2 − (0.7071)2 − 1 = −0.000635 . fx(x1, y1) = fx(1.225, 0.7071) = 2× (1.225) = 2.45 = gx(x1, y1) , gx(x1, y1) = gx(1.225, 0.7071) = 2× (0.7071) = 1.4142 = −gy(x1, y1) Novamente, usando (3.14), segue que: x2 = 1.225− [ fgy − gfy fxgy − fygx ] (1.225,0.7071) = 1.225− [ (−0.000615)(−1.4142)− (−0.000635)(1.4142) −(2.45)(1.4142) − (2.45)(1.4142) ] = 1.2253 y2 = 0.7071− [ gfx − fgx fxgy − fygx ] (1.225,0.7071) = 0.7071− [ (−0.000635)(2.45)− (−0.000615)(2.45) −(2.45)(1.4142) − (2.45)(1.4142) ] = 0.7070. CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 82 Calculando o erro relativo:∣∣∣∣x2 − x1x2 ∣∣∣∣ ' 0.0002 e ∣∣∣∣y2 − y1y2 ∣∣∣∣ ' 0.0001 vemos que estes sa˜o menores que 10−3. Assim, a soluc¸a˜o do sistema dado e´ (x¯, y¯) = (1.2252, 0.7070) com � < 10−3. Exerc´ıcios: 3.20 - Usando o me´todo de Newton determine, com precisa˜o de 10−3, uma raiz para cada um dos seguintes sistemas na˜o lineares: i) { 3x2y − y3 = 4 x2 + xy3 = 9 com (x0, y0) = (2; 2.5). ii) { x2 + y2 − 1 = 0 x2 + y2 + 12 = 0 com (x0, y0) = (1; 3). iii) { (x− 1)2 + y2 = 4 x2 + (y − 1)2 = 4 com (x0, y0) = (2; 1). 3.7 Equac¸o˜es Polinomiais Embora as equac¸o˜es polinomiais possam ser resolvidas por qualquer dos me´todos iterativos discuti- dos previamente, elas surgem ta˜o frequentemente que recebem um tratamento especial. Em particular, apresentaremos alguns algoritmos eficientes para a determinac¸a˜o de ra´ızes isoladas de polinoˆmios, sejam elas reais ou complexas. Seja P (x) = an xn + an−1 xn−1 + . . . + a1 x + a0 = ∑n i=0 aix i, an 6= 0. (3.15) um polinoˆmio de grau n com an 6= 0. Enta˜o, os seguintes resultados sa˜o va´lidos para P (x): a) P (x) possui, pelo menos, uma raiz. b) P (x) possui, exatamente, n ra´ızes, desde que uma raiz de multiplicidade k seja considerada k vezes. c) Se os valores nume´ricos de dois polinoˆmios de grau ≤ n coincidem para mais do que n valores distintos de x, os polinoˆmios sa˜o ideˆnticos. d) Se x1, x2, . . . , xn forem as ra´ızes de P (x), enta˜o P (x) pode ser expresso univocamente na forma fatorada: P (x) = an(x− x1)(x− x2) . . . (x− xn) . e) Se os coeficientes ak, (k = 0, 1, . . . , n) forem reais, e se a+ bi for uma raiz complexa de P (x), enta˜o a− bi sera´ tambe´m uma raiz de P (x). CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 83 3.7.1 Determinac¸a˜o de Ra´ızes Reais Inicialmente deduziremos um algoritmo para a determinac¸a˜o das ra´ızes reais de polinoˆmios. Conside- raremos apenas polinoˆmios contendo coeficientes reais. Em qualquer me´todo iterativo para determinac¸a˜o de uma raiz de um polinoˆmio, teremos que calcular, frequentemente, o valor nume´rico do polinoˆmio para um determinado nu´mero real. Portanto, e´ importante realizar esse ca´lculo de uma forma ta˜o precisa quanto poss´ıvel. Por exemplo, usando o me´todo de Newton, temos: xk+1 = xk − P (xk) P ′ (xk) . Para medir a eficieˆncia dos algoritmos para calcular o valor do polinoˆmio num ponto, usemos a seguinte notac¸a˜o: • µ = tempo de processamento de uma multiplicac¸a˜o, • α = tempo de processamento de uma adic¸a˜o, Se P (x) e´ calculado pela fo´rmula (3.15), enta˜o devemos calcular as poteˆncias de x fazendo xk = x × xk−1, os quais requerem (n − 1)µ; termos da forma akxn−k, os quais requerem nµ; e a soma dos termos, os quais requerem nα. Assim, nessa maneira de ca´lculo, o total e´ (2n − 1)µ + nα. Ale´m disso, quase a mesma quantidade e´ requerida se P ′(x) e´ calculado por esse me´todo. Em vista da simplicidade do problema, e´ surpreendente que exista um algoritmo que calcula P (x), P ′(x) e tambe´m as derivadas de ordem superior de P (x), caso se deseje, com uma quantidade muito inferior de tempo de processamento. Esse algoritmo, chamado de Algoritmo de Briot- Ruffini-Horner, e´ obtido escrevendo a fo´rmula para P (x) da seguinte maneira: ( Vamos considerar n = 4, para simplicidade.) P (x) = a4x4 + a3x3 + a2x2 + a1x+ a0 = (((a4x+ a3)x+ a2)x+ a1)x+ a0 . Desse modo temos que o tempo de processamento requerido e´: 4µ + 4α. Assim, de um modo geral, para um polinoˆmio de grau n podemos formular o algoritmo da seguinte maneira: Dados an, an−1, . . . , a0, calcular bn, bn−1, . . . , b0, de acordo com: bn = an , bn−k = xbn−k+1 + an−k , k = 1, 2, . . . , n . (3.16) Portanto, b0 = P (x) = valor de P em x. Assim, x¯ e´ uma raiz de P (x) se e somente se, no algo- ritmo de Briot-Riffini-Horner, formado com o nu´mero x¯, resultar que b0 = 0. Observe que o tempo de processamento requerido agora e´: nµ+ nα. Vamos aplicar agora a bk o mesmo algoritmo que aplicamos a ak. Fazendo isso, obtemos nu´meros ck de acordo com: cn = bn , cn−k = xcn−k+1 + bn−k , k = 1, 2, . . . , n− 1 . (3.17) Para nossa surpresa, c1 = P ′(x), e assim o valor da derivada do polinoˆmio em x e´ obtida, com tempo de processamento igual a (n−1)(µ+α). A prova anal´ıtica de que c1 = P ′(x), e´ feita por diferenciac¸a˜o da relac¸a˜o de recorreˆncia dada por (3.16), lembrando que bk e´ func¸a˜o de x enquanto que os ak na˜o. Assim, derivando (3.16), obtemos: b′n = 0 , b ′ n−k = xb ′ n−k+1 + bn−k+1 , k = 1, 2, . . . , n . Vemos que b′n−1 = bn, e que as quantidades ck = b ′ k−1 sa˜o ideˆnticas aos ck definidos por (3.17). Portanto desde que b0 = P (x), segue que : c1 = b′0 = P ′(x). CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 84 Seja x = z, enta˜o os valores de P (z), fo´rmulas (3.16), e P ′(z), fo´rmulas (3.17), podem ser obtidos atrave´s do esquema pra´tico: Seja P (x) = an xn + an−1 xn−1 + . . .+ a1 x + a0. Enta˜o: an an−1 an−2 . . . a2 a1 a0 ↓ + + + + + z zbn zbn−1 . . . zb3 zb2 zb1 bn bn−1 bn−2 . . . b2 b1 b0 ↓ + + + + z zcn zcn−1 . . . zc3 zc2 cn cn−1 cn−2 . . . c2 c1 com b0 = P (z) e c1 = P ′(z). Note que o esquema pra´tico acima quando utilizado para calcular apenas o valor do polinoˆmio num ponto e´ o conhecido algoritmo de Briot-Ruffini. O esquema de Briot-Ruffini-Horner, na verdade, fornece o valor de P ′(z) 1! , e pode ser continuado para obtenc¸a˜o de P ′′(z) 2! , P ′′′(z) 3! , etc. (ver [Henrice, 1977]). Assim, quando f(x) e´ um polinoˆmio, o me´todo de Newton, fo´rmula (3.9), pode ser expresso como: xk+1 = xk − b0(xk) c1(xk) , (3.18) onde b0(xk) e c1(xk) representam, respectivamente, o valor do polinoˆmio e da derivada do polinoˆmio avaliados em xk. Vamos assumir agora que z e´ um zero de P (x). Se P (z) = 0 enta˜o b0 = 0. Afirmamos enta˜o que: Os nu´meros bn, bn−1, . . . , b1 sa˜o os coeficientes do polinoˆmio Q(x), obtido da divisa˜o de P (x) pelo fator linear x− z, isto e´: Q(x) = bn xn−1 + bn−1 xn−2 + . . . + b1 = P (x) x− z . De fato, (bn xn−1 + bn−1 xn−2 + . . . + b1)(x− z) = bn xn + (bn−1 − z bn) xn−1 + . . . + (b1 − z b2) x + (b0 − z b1) = anxn + an−1xn−1 + . . .+ a1x+ a0 = P (x) . onde usamos a fo´rmula de recorreˆncia dada por (3.16), com x substituido por z. Assim, se z e´ uma raiz de P (x), podemos escrever que: P (x) = (x− z)Q(x) , e portanto conclu´ımos que qualquer raiz de Q(x) e´, tambe´m, uma raiz de P (x). Isto nos permite operar com um polinoˆmio de grau n− 1, ou seja , com Q(x), para calcular as ra´ızes subsequentes de P (x). Esse processo recebe o nome de Deflac¸a˜o. Usando esse processo evitamos que um mesmo zero seja calculado va´rias vezes. Exemplo 3.14 - Determinar todas as ra´ızes de: P (x) = x3 + 2 x2 − 0.85 x− 1.7 , com precisa˜o de 10−2, usando o me´todo de Newton, para o ca´lculo da primeira raiz positiva. CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 85 Soluc¸a˜o: Seja y1 = x3 e y2 = − 2 x2 + 0.85 x + 1.7. Plotando ambas as curvas no mesmo gra´fico, obtemos: 21x¯ y2 y1 1 2 6 - Figura 3.16 Vemos enta˜o que x¯, esta´ nas vizinhanc¸as de 0.9. Assim, seja x0 = 0.9. Calculemos inicialmente P (0.9) e P ′(0.9), usando o algoritmo de Briot-Ruffini-Horner. Portanto: 1 2 −0.85 −1.7 0.9 0.9 2.61 1.584 1 2.9 1.76 −0.1164 0.9 0.9 3.42 1 3.8 5.18 Portanto, usando (3.18), segue que: x1 = 0.9 − b0(0.9) c1(0.9) ⇒ x1 = 0.9 − −0.11645.18 ⇒ x1 = 0.9224 . Calculando o erro relativo, ∣∣∣∣x1 − x0x1 ∣∣∣∣ ' 0.02 , vemos que o mesmo e´ maior que 10−2. Assim devemos fazer nova iterac¸a˜o. 1 2 −0.85 −1.7 0.9224 0.9224 2.6956 1.7024 1 2.9224 1.8456 0.0024 0.9224 0.9224 3.5464 1 3.8448 5.392 Logo: x2 = 0.9224 − b0(0.9224) c1(0.9224) ⇒ x2 = 0.9224 − 0.00245.392 ⇒ x2 = 0.9220 . Calculando o erro relativo: ∣∣∣∣x2 − x1x2 ∣∣∣∣ ' 0.0004 , vemos que este e´ menor que 10−2, e assim x¯ = 0.9220 e´ uma raiz de P (x) com a precisa˜o exigida. As duas ra´ızes restantes podem ser obtidas, agora, a partir do polinoˆmio do segundo grau: Q(x) = b3x2+b2x+b1. Aplicando novamente o algoritmo de Briot-Ruffini-Horner, obtemos: CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 86 1 2 −0.85 −1.7 0.9220 0.9220 2.6941 1.7002 1 2.9220 1.8441 0.0002 e assim podemos escrever que: Q(x) = x2 + 2.9220 x + 1.8441 . Usando a fo´rmula que nos fornece as ra´ızes de uma equac¸a˜o do segundo grau, obtemos que as outras duas ra´ızes de P (x) sa˜o: x¯ = −0.9235 e x¯ = −1.9985. Exerc´ıcios 3.21 - Calcular P (5) e P ′(5) para o polinoˆmio: P (x) = x5 − 3x4 + 2x2 − 3x+ 5. 3.22 - Determinar todas as ra´ızes do polinoˆmio: P (x) = x3 − 5x2 − x+ 5 = 0, com precisa˜o de 10−2, usando o me´todo de Newton e o algoritmo de Briot-Ruffini-Horner para o ca´lculo da primeira raiz. 3.23 - Use o me´todo das secantes e o algoritmo de Briot-Ruffini para determinar a u´nica raiz negativa da equac¸a˜o f(x) = x3 − 2x2 − x+ 2 = 0, com precisa˜o de 10−2. 3.24 - A equac¸a˜o f(x) = x3 − 0.5 = 0 possui uma raiz entre 0.5 e 1.0. usando o me´todo Regula Falsi e o algoritmo de Briot-Ruffini determinar essa raiz com precisa˜o de 10−2. 3.7.2 Determinac¸a˜o de Ra´ızes Complexas O me´todo de Newton pode ser usado tambe´m para calcular as ra´ızes complexas de polinoˆmios. Neste caso entretanto devemos usar aritme´tica complexa. Veremos aqui como determinar as ra´ızes complexas de um polinoˆmio usando aritme´tica real. Se P (x) e´ um polinoˆmio da forma (3.15) com coeficientes reais, as ra´ızes complexas ocorrem, enta˜o, em pares conjugados, e, correspondendo a cada par de ra´ızes complexas conjugadas, ha´ um fator quadra´tico de P (x) da forma: x2 − α x − β , onde α e β sa˜o nu´meros reais. Consideremos, primeiramente, a divisa˜o de um polinoˆmio P (x) de grau n > 2 por um fator quadra´tico. E´ claro que, em geral, podemos expressar P (x) na forma: P (x) = ( x2 − α x − β)Q(x) + b1(x− α) + b0 , (3.19) onde Q(x) e´ um polinoˆmio de grau n− 2, que representamos na forma: Q(x) = bn xn−2 + bn−1 xn−3 + . . . + b2 , (3.20) e b1(x− α) + b0 e´ o resto. E´ conhecido da teoria dos polinoˆmios que x2 − α x − β sera´ um divisor exato de P (x) se e somente se, b1 = b0 = 0. Quando b1 = b0 = 0, a expressa˜o (3.19) torna-se: P (x) = ( x2 − α x − β) Q(x) . Portanto as ra´ızes de x2−α x−β e as ra´ızes de Q(x), sera˜o, tambe´m, ra´ızes de P (x). Nosso objetivo e´ enta˜o obter coeficientes α e β, de tal forma que x2−αx−β seja um divisor exato de P (x), pois teremos duas ra´ızes a partir do fator quadra´tico e as demais poderemos obter atrave´s do polinoˆmio Q(x). Para CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 87 determinarmos os coeficientes bk, k = 0, 1, . . . , n em (3.19) para valores arbitra´rios de α e β, expandimos o lado direito da igualdade (3.19). Assim: P (x) = x2 ( bn x n−2 + bn−1 xn−3 + . . .+ b2 ) − αx (bn xn−2 + bn−1 xn−3 + . . .+ b2) − β (bn xn−2 + bn−1 xn−3 + . . .+ b2) + b1(x− α) + b0 = bn xn + (bn−1 − α bn)xn−1 + (bn−2 − α bn−1 − β bn)xn−2 + . . . + (b1 − α b2 − β b3)x + (b0 − α b1 − β b2) . Igualando esses coeficientes aos de P (x) em (3.15) e reagrupando os termos, obtemos as fo´rmulas de recorreˆncia: bn = an , bn−1 = an−1 + α bn , bn−2 = an−2 + α bn−1 + β bn , ... b1 = a1 + α b2 + β b3 , b0 = a0 + α b1 + β b2 . (3.21) Os nu´meros bn, bn−1, . . . , b2 sa˜o os coeficientes do polinoˆmio Q(x). Esquema Pra´tico para o ca´lculo de bk, k = 0, 1, . . . , n Seja P (x) = anxn + an−1xn−1 + . . .+ a1x+ a0. Enta˜o: an an−1 an−2 . . . a2 a1 a0 + + + + + α ↓ αbn αbn−1 . . . αb3 αb2 αb1 + + + + β ↓ ↓ βbn . . . βb4 βb3 βb2 bn bn−1 bn−2 . . . b2 b1 b0 Em (3.21) b1 e b0 sa˜o, logicamente, func¸o˜es de α e β. Em geral, para uma escolha arbitra´ria de α e β, eles na˜o se anulara˜o. Encontrar o fator quadra´tico que seja divisor exato de P (x) equivale a resolver o sistema de equac¸o˜es na˜o lineares: { b1 (α, β) = 0 b0 (α, β) = 0 (3.22) Se (α0, β0) forem aproximac¸o˜es das ra´ızes (α¯, β¯) de (3.22), podemos tentar resolver esse sistema pelo me´todo de Newton para func¸o˜es de duas varia´veis. A correc¸a˜o (δα0) de (α0, β0) onde: δα0 = α1 − α0 e δβ0 = β1 − β0 , pode ser encontrada solucionando-se o sistema: ∂b1 ∂α δα0 + ∂b1 ∂β δβ0 = −b1 (α0, β0) ∂b0 ∂α δα0 + ∂b0 ∂β δβ0 = −b0 (α0, β0) (3.23) onde as derivadas parciais devem ser calculadas em (α0, β0). Uma vez que na˜o podemos expressar b1 e b0, explicitamente, como func¸o˜es de α e β, na˜o podemos calcular explicitamente as derivadas. Bairstow propoˆs um me´todo simples para calcular numericamente estas derivadas parciais. CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 88 Para obter ∂b1 ∂α e ∂b0 ∂α derivamos (3.21) em relac¸a˜o a α, tendo em mente que os ak sa˜o constantes e que os bk sa˜o todos func¸o˜es de α, exceto bn. Portanto: ∂bn ∂α = 0 , ∂bn−1 ∂α = bn , ∂bn−2 ∂α = bn−1 + α ∂bn−1 ∂α , ∂bn−3 ∂α = bn−2 + α ∂bn−2 ∂α + β ∂bn−1 ∂α , . . . . . . ∂bn−1 ∂α = b2 + α ∂b2 ∂α + ∂b3 ∂α , ∂b0 ∂α = b1 + α ∂b1 ∂α + β ∂b2 ∂α . (3.24) Fazendo ck+1 = ∂bk ∂α , k = n−1, n−2, . . . , 1, 0, temos que (3.24) pode ser expresso da seguinte maneira: cn = bn , cn−1 = bn−1 + αcn , cn−2 = bn−2 + αcn−1 + βcn , cn−3 = bn−3 + αcn−2 + βcn−1 , ... c2 = b2 + αc3 + βc4 , c1 = b1 + αc2 + βc3 . (3.25) Comparando (3.25) com (3.21) vemos que os ck sa˜o obtidos a partir dos bk, da mesma forma como os bk foram obtidos a partir dos ak (exceto que na˜o existe o termo c0). Ale´m disso, as derivadas requeridas sa˜o: ∂b0 ∂α = c1 , ∂b1 ∂α = c2 . (3.26) Para obter ∂b1 ∂β , ∂b0 ∂β , derivamos (3.21) em relac¸a˜o a β, tendo em mente que os ak sa˜o constantes e CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 89 que os bk sa˜o todos func¸o˜es de β, exceto bn e bn−1. Portanto: ∂bn ∂β = ∂bn−1 ∂β = 0 , ∂bn−2 ∂β = bn , ∂bn−3 ∂β = bn−1 + α ∂bn−2 ∂β , ∂bn−4 ∂β = bn−2 + α ∂bn−3 ∂β + ∂bn−2 ∂β , . . . . . . ∂b1 ∂β = b3 + α ∂b2 ∂β + β ∂b3 ∂β , ∂b0 ∂β = b2 + α ∂b1 ∂β + β ∂b2 ∂β . (3.27) Fazendo di+2 = ∂bi ∂β , i = n− 2, n− 3, . . . , 1, 0, temos que (3.27) pode ser escrito como: dn = bn , dn−1 = bn−1 + αdn , dn−2 = bn−2 + αdn−1 + βdn , cn−3 = bn−3 + αdn−2 + βdn−1 , ... d3 = b3 + αd4 + βd5 , d3 = b3 + αd4 + βd5 . (3.28) Comparando (3.28) com (3.25) vemos que dk = ck, k = 2, 3, . . . , n. Portanto: ∂b0 ∂β = d2 = c2 , ∂b1 ∂β = d3 = c3 . (3.29) Assim, usando (3.26) e (3.30), as equac¸o˜es (3.23) empregadas para a determinac¸a˜o das correc¸o˜es δα0, δβ0, tornam-se: c2 δα0 + c3 δβ0 = − b1 (α0, β0) c1 δα0 + c2 δβ0 = − b0 (α0, β0) (3.30) Esse me´todo para a determinac¸a˜o de um fator quadra´tico de um polinoˆmio e as correspondentes ra´ızes e´ chamado Me´todo de Newton-Bairstow. O me´todo de Newton-Bairstow se constitui num poderoso e eficiente algoritmo para o ca´lculo das ra´ızes complexas de polinoˆmios. Poderoso porque converge quadraticamente e eficiente porque fornece um algoritmo simples para a obtenc¸a˜o das derivadas parciais requeridas. Sua maior deficieˆncia e´ que muitas vezes e´ dif´ıcil selecionar adequadamente as aproximac¸o˜es iniciais (α0, β0) a fim de garantir a convergeˆncia. Entretanto, podemos obter (α0, β0), usando o algoritmo Q-D, (ver pro´xima sec¸a˜o). Observe que o me´todo de Newton-Bairstow pode ser utilizado para obter as ra´ızes reais (desde que uma raiz real pode ser considerada uma raiz complexa cuja parte imagina´ria e´ zero) de polinoˆmios com a vantagem de se conseguir duas ra´ızes de cada vez. CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 90 Exemplo 3.15 - Calcular todas as ra´ızes da equac¸a˜o polinomial: P (x) = x4 − 2x3 + 4x2 − 4x+ 4 = 0 pelo me´todo de Newton-Bairstow, iniciando com (α0, β0) = (1,−1). Soluc¸a˜o: Primeiramente calculamos os bk e os ck. Assim: 1 -2 4 -4 4 1 1 -1 2 -1 -1 -1 1 -2 1 -1 2 -1 1 1 1 0 1 -1 -1 0 1 0 1 0 Resolvemos, enta˜o o sistema: { 1. δα0 + 0. δβ0 = 1 0. δα0 + 1.δβ0 = −1 cuja soluc¸a˜o e´: δα0 = 1 e δβ0 = −1. Assim: α1 = α0 + δα0 ⇒ α1 = 2 , β1 = β0 + δβ0 ⇒ β1 = −2 . Repetimos, enta˜o, o processo com (α1, β1) = (2,−2). Logo: 1 -2 4 -4 4 2 2 0 4 0 -2 -2 0 -4 1 0 2 0 0 Obtemos enta˜o b1 = b0 = 0. Logo, x2−α x−β = x2−2 x+ 2 e´ um divisor exato de P (x). Portanto as ra´ızes de x2 − 2x+ 2 sa˜o tambe´m ra´ızes de P (x). Mas, P (x) = ( x2 − 2x+ 2) Q(x) , onde: Q(x) = x2 + 2 . Assim, as ra´ızes de Q(x) sa˜o tambe´m ra´ızes de P (x). Logo as ra´ızes de P (x) sa˜o: 1 ± i ± √2 i. Exerc´ıcios 3.25 - Dividir o polinoˆmio x6 − 3x5 + 4x2 − 5 por x2 − 3x+ 1, e excreveˆ-lo na forma (3.19). 3.26 - Usar o me´todo de Newton-Bairstow para determinar as ra´ızes de P (x) = x3 − 6x2 + 9x − 4, partindo da divisa˜o de P (x) por x2 − x. CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 91 3.7.3 Algoritmo Quociente-Diferenc¸a Os me´todos de Newton e Newton-Bairstow para determinac¸a˜o de zeros de polinoˆmios sa˜o eficientes se conhecemos, respectivamente, uma aproximac¸a˜o inicial suficientemente pro´xima da raiz, ou uma apro- ximaca˜o inicial adequada para o fator quadra´tico. Nessa sec¸a˜o apresentaremos um me´todo nume´rico que determina os zeros de um polinoˆmio sem conhe- cer aproximac¸o˜es iniciais, mesmo que as ra´ızes sejam complexas. Tal me´todo, conhecido como Algoritmo Quociente-Diferenc¸a, ou simplesmente Algoritmo Q-D, e´ um esquema devido a Rutishauser, que for- nece simultaneamente aproximac¸o˜es para todos os zeros de um polinoˆmio, sejam eles reais ou complexos. Maiores detalhes sobre o algoritmo Q-D, podem ser encontrados em [Henrici, 1964] ou em [Albrecht, 1973]. Seja P (x) um polinoˆmio da forma (3.15), isto e´: P (x) = anxn + an−1xn−1 + . . .+ a0 . Vamos considerar que P (x) e´ um polinoˆmio de grau n ≥ 1, com ak 6= 0, k = 0, 1, . . . , n. A partir de P (x) constru´ımos linhas de termos q e e, comec¸ando a tabela calculando a primeira linha de q′s e a segunda linha de e′s, da seguinte maneira: q (1) 0 = − an−1 an ; q(k)0 = 0 , k = 2, . . . , n , e (k) 0 = an−(k+1) an−k , k = 1, 2, . . . , n− 1 ; e(1)0 = e(n)0 = 0 . Assim as duas primeiras linhas da tabela sa˜o: e(0) q(1) e(1) q(2) e(2) q(3) . . . e(n−1) q(n) e(n) − an−1an 0 0 . . . 0 0 an−2an−1 an−3 an−2 . . . a0 a1 0 As novas linhas de q′s sera˜o calculadas atrave´s da equac¸a˜o: novo q(k) = e(k) − e(k−1) + q(k) , k = 1, 2, . . . , n , (3.31) usando os termos das linhas e e q acima. Note que nessa equac¸a˜o o novo q e´ igual ao e a` direita menos e a` esquerda mais q acima. As novas linhas de e′s sa˜o calculadas pela equac¸a˜o: novo e(k) = q(k+1) q(k) e(k) , k = 1, 2, . . . , n , e(0) = e(n) = 0 , (3.32) onde o novo e e´ igual ao q a` direita sobre q a` esquerda vezes e acima. Utilizamos sucessivamente as fo´rmulas (3.31) e (3.32) ate´ que os e′s tendam a zero. Quando isso ocorrer, os valores de q aproximam os valores das ra´ızes, se estas forem reais. Se o polinoˆmio tiver um par de ra´ızes complexas conjugadas, um dos e′s na˜o tendera´ a zero mas flutuara´ em torno de um valor. Nesse caso devemos montar um fator quadra´tico da forma: x2 − rx − s, do seguinte modo: a soma dos dois valores de q, um de cada lado do valor de e em questa˜o, aproximara´ o valor de r e o produto do valor de q acima e a` esquerda vezes o valor de q abaixo e a` direita aproximara´ o valor de −s. Fazendo x2 − rx− s = 0, determinamos as ra´ızes complexas. Caso semelhante vale para ra´ızes de multiplicidade 2. Daremos a seguir exemplo. CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 92 Exemplo 3.16 - Usando o algoritmo Q-D obter todas as ra´ızes do polinoˆmio: P (x) = x4 − 6x3 + 12x2 − 19x+ 12 . Soluc¸a˜o: Aplicando o algoritmo Q-D, obtemos a tabela a seguir, onde apo´s calcularmos as duas primeiras linhas indicamos com setas como calcular os novos q′s e e′s: ×× // ++ -- ?? ** ffff ?? ** ffff 1.010−0.4661.4564.003 0−0.0047.8850.0030 1.0077.423−6.4264.000 0−0.030−6.826−0.0020 0.9770.6270.3983.998 0−0.019−4.333−0.0190 0.958−3.6874.7124.017 00.0745.538−0.016 1.0321.777−0.842 0 4.033 00.127−2.6240.0770 1.159−0.9741.8593.956 0−0.1075.0080.1640 1.0524.141−2.9853.792 0−0.420−3.610−0.2080 0.6320.9510.4174.000 0−0.632−1.583−2.0000 0006.000 e(4)q(4)e(3)q(3)e(2)q(2)e(1)q(1)e(0) Observe que na tabela acima q(1) esta´ convergindo para 4 e q(4) esta´ convergindo para 1. Assim 4.004 e 1.010 sa˜o aproximac¸o˜es para duas das ra´ızes de P (x). Agora, desde que e(2) na˜o esta´ convergindo para zero, q(2) e q(3), representam o fator quadra´tico: x2 − rx− s, onde: r = 1.456 + (−0.466) = 0.990 , s = (−6.426)× (−0.466) = −2.995 . Portanto igualando o fator quadra´tico a zero, isto e´, fazendo: x2 − rx− s = x2 − 0.990x+ 2.995 = 0, obtemos que: 0.495 ± 1.6568i sa˜o aproximac¸o˜es para as outras duas ra´ızes de P (x). Podemos enta˜o escrever que: P (x) ' (x− 4.004)(x− 1.010)(x− (0.495 + 1.6568i))(x− (0.495− 1.6568i)) . E´ claro, como ja´ dissemos, que os valores encontrados sa˜o aproximac¸o˜es para as ra´ızes de P (x). Se desejarmos o resultado com mais casas decimais corretas, podemos aplicar o Algoritmo Q-D versa˜o Newton: aplica-se o algoritmo Q-D para obter aproximac¸o˜es para as ra´ızes, e usando o me´todo de New- ton ou Newton-Bairstow refina-se a soluc¸a˜o ate´ obteˆ-la com a precisa˜o desejada. Esta versa˜o de Newton faz com que o algoritmo seja praticamente livre de erros de arredondamento. Observac¸o˜es: O algoritmo Q-D na˜o se aplica se: CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 93 a) durante o processo ocorrer algum q = 0, (divisa˜o por zero). b) o polinoˆmio dado tiver ra´ızes nulas, ( e´ exigido que todos os coeficientes sejam diferentes de zero). c) se existir algum coeficiente igual a zero. Para entender a observac¸a˜o do item a) resolva o primeiro exerc´ıcio proposto a seguir. Em relac¸a˜o ao item b) o processo pode ser aplicado desde que elimenemos do polinoˆmio as ra´ızes nulas antes de aplica´-lo. Em relac¸a˜o ao item c), isto e´, se existir algum coeficiente igual a zero basta fazer uma mudanc¸a de varia´vel: z = x− a, onde a e´ uma constante real arbitra´ria. Com a mudanc¸a de varia´vel obtemos um polinoˆmio que possui todos os coeficientes diferentes de zero. Aplicamos a esse polinoˆmio o algoritmo Q-D. Determinadas as ra´ızes usamos a mudanc¸a de varia´vel para obter os zeros do polinoˆmio dado, isto e´: x = z + a. Assim: Exemplo 3.17 - Dado P (x) = 81x4 − 108x3 + 24x+ 20, determinar um polinoˆmio que possua todos os coeficientes diferentes de zero. Soluc¸a˜o: Temos em P (x) que o coeficiente a2 = 0. Fazemos enta˜o a mudanc¸a de varia´vel: z = x− a. Com essa mudanc¸a de varia´vel obteremos um polinoˆmio P ∗(z). Observe que tal polinoˆmio e´ facilmente obtido se desenvolvermos P (x) em se´rie de Taylor em torno do ponto a. De fato, para o polinoˆmio dado, obtemos que: P (x) = P (a) + (x− a)P ′(a) + (x− a) 2 2! P ′′(a) + (x− a)3 3! P ′′′(a) + (x− a)4 4! P (iv)(a) . Fazendo x− a = z, obtemos: P ∗(z) = P (a) + zP ′(a) + z2 P ′′(a) 2! + z3 P ′′′(a) 3! + z4 P (iv)(a) 4! . Os coeficientes do polinoˆmio P ∗(z) sa˜o obtidos aplicando-se o algoritmo de Briot-Ruffini-Horner, (ver sec¸a˜o 3.7.1). Como o valor de a e´ arbitra´rio, em geral, consideramos a = 1 → z = x − 1. Portanto, para o polinoˆmio dado, devemos calcular o valor do polinoˆmio P (x) e de suas derivadas no ponto a = 1. Assim: 81 −108 0 24 20 1 81 −27 −27 −3 81 −27 −27 −3 17 1 81 54 27 81 54 27 24 1 81 135 81 135 162 1 81 81 216 1 81 Logo: P ∗(z) = 81z4 + 216z3 + 162z2 + 24z + 17 . Usamos a algoritmo Q-D para calcular as ra´ızes de P ∗(z) e a seguir fazendo x = z + 1, obtemos as ra´ızes de P (x). CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 94 Exerc´ıcios 3.27 - Verifique que na˜o e´ poss´ıvel determinar as ra´ızes de P (x) = x2 − 2x + 2, usando o algoritmo Q-D. 3.28 - Usando o algoritmo Q-D determinar todas as ra´ızes de: a) P (x) = 81x4 − 108x3 + 24x+ 20, b) P (x) = 128x4 − 256x3 + 160x2 − 32x+ 1. com duas casas decimais corretas. 3.8 Exerc´ıcios Complementares 3.29 - Mostre que as seguintes equac¸o˜es possuem exatamente uma raiz e que em cada caso a raiz esta´ no intervalo [0.5, 1]. a) x2 + ln x = 0, b) x ex − 1 = 0. Determine essas ra´ızes, com duas casas decimais corretas, usando o me´todo da bissecc¸a˜o. 3.30 -Aplique o me´todo da bissec¸a˜o e Regula Falsi para calcular a raiz positiva de x2 − 7 = 0 com � < 10−2, partindo do intervalo inicial [2.0, 3.0]. 3.31 -Aplique o me´todo da bissecc¸a˜o para resolver: a) ex − x− 3 x = 0, b) x3 + cos x = 0, obtendo em cada caso a e b (iniciais) graficamente. 3.32 - O problema: resolva f(x) = x+ ln x = 0 pode ser transformado num problema equivalente da forma x = ψ(x). Para o processo iterativo definido por xk+1 = ψ(x); analisar a convergeˆncia quando: a) ψ(x) = −ln x, b) ψ(x) = e−x, no intervalo [0.5, 0.6] . 3.33 - A equac¸a˜o x2 + 5x−1 = 0 tem uma raiz em (0, 0.5). Verifique quais dos processos abaixo podem ser usados, com sucesso, para obteˆ-la: a) xk+1 = 1− x2k 5 , b) xk+1 = 1− 5 xk xk , c) xk+1 = √ 1− 5 xk. CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 95 3.34 - A equac¸a˜o f(x) = ex − 3 x2 = 0 tem treˆs ra´ızes. Um me´todo iterativo pode ser definido usando a preparac¸a˜o o´bvia da equac¸a˜o: x = ± √ ex 3 . i) Verificar que comec¸ando com x0 = 0 havera´ convergeˆncia para a raiz pro´xima de −0.5, se o valor negativo for usado e que havera´ convergeˆncia para a raiz pro´xima de 1.0, se o valor positivo for usado. ii) Mostrar que a forma acima na˜o converge para a terceira raiz pro´xima de 4.0, qualquer que seja a aproximac¸a˜o inicial pro´xima da raiz. 3.35 - A fo´rmula xn+1 = 2 xn − a x2n e´ candidata para se determinar o inverso de um nu´mero a; 1a . Mostre que se a fo´rmula converge, enta˜o converge para 1a e determine os limites da estimativa inicial x0 para convergir. Teste suas concluso˜es nos casos: a) a = 9 e x0 = 0.1. b) a = 9 e x0 = 1.0. 3.36 - Mostre que x3− 2x− 17 = 0 tem apenas uma raiz real e determine seu valor correto ate´ 2 casas decimais usando o me´todo de Newton. 3.37 - A equac¸a˜o x3 − 2x− 1 = 0 possui apenas uma raiz positiva. a) De acordo com o princ´ıpio da bissecc¸a˜o, esta raiz positiva deve estar em qual dos intervalos: (0, 1), (1, 2), (2, 3)? Por que? b) Se deseja´ssemos tambe´m pesquisar as ra´ızes negativas usando intervalos de amplitude 12 , ate´ o ponto−2, em que intervalos seriam encontradas tais ra´ızes? c) Obtenha a menor raiz negativa (em mo´dulo), usando o me´todo das Secantes. Trabalhe com arredon- damento para 3 casas decimais. 3.38 - Usando o me´todo de Newton determine t (real), com erro relativo inferior a 10−2, tal que a matriz: A = 0.5 0.2 t0.4 t 0.5 t 0.5 0.2 , seja singular. 3.39 - Usando o me´todo de Newton determine, sem efetuar a divisa˜o, o valor nume´rico de x = 13 com 3 casas decimais corretas, iniciando com x0 = 0.3. 3.40 - A soluc¸a˜o da equac¸a˜o diferencial: an dnu(t) dtn + an−1 dn−1u(t) dtn−1 + . . . + a1 du(t) dt = 0 , e´: u(t) = m∑ k=1 qk(t)eλkt , CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 96 onde os λk sa˜o as ra´ızes distintas do polinoˆmio: P (λ) = an λn + an−1 λn−1 + . . . + a1 λ + a0 , chamado polinoˆmio caracter´ıstico da equac¸a˜o diferencial e os qk sa˜o polinoˆmios de grau uma unidade inferior a` multiplicidade de λk, mas a na˜o ser por isso, arbitra´rios. Deseja-se determinar a soluc¸a˜o geral da equac¸a˜o diferencial: d3u(t) dt3 − 6 d 2u(t) dt2 + 6 du(t) dt + 7 u(t) = 0 . Determine a u´nica raiz negativa do polinoˆmio caracter´ıstico pelo me´todo de Newton e o algoritmo de Briot-Ruffini-Horner, com erro inferior a 10−3, e as demais ra´ızes atrave´s da equac¸a˜o do 2o grau. 3.41 - Seja x¯ uma raiz da equac¸a˜o f(x) = 0. Supomos que f(x), f ′(x) e f”(x) sejam cont´ınuas e limitadas num intervalo fechado I contendo x = x¯ e que f ′(x¯) = 0 e f”(x¯) 6= 0. (Observe que nestas condic¸o˜es x¯ e´ um zero de multiplicidade 2 de f(x) = 0). a) Mostre que o me´todo iterativo definido por: xk+1 = xk − 2 f(xk) f ′(xk) , k = 0, 1, 2, . . . converge para a raiz x¯ se xk ∈ I. b) O me´todo definido em a) estende-se para uma raiz de multiplicidade m da seguinte maneira: xk+1 = xk − m f(xk) f ′(xk) , k = 0, 1, 2, . . . Calcular a raiz x¯ pro´xima de 1, da equac¸a˜o: f(x) = x4 − 3.1 x3 + 2.52 x2 + 0.432 x− 0.864 = 0 , com erro relativo inferior a 10−3, usando o me´todo descrito acima e sabendo que f(x¯) = f ′(x¯) = f”(x¯) = 0 e f ′′′(x¯) 6= 0. 3.42 -Dado o sistema na˜o linear: { x3 − 3 x y2 + 1 = 0 3 x2 y − y3 = 0 Determine uma soluc¸a˜o com 2 d´ıgitos significativos corretos, iniciando com (x0, y0) = (0.51, 0.85), e usando: a) me´todo iterativo linear b) me´todo de Newton. 3.43 - Mostre que o sistema na˜o linear:{ 3x2 + y2 + 9 x− y − 12 = 0 x2 + 36 y2 − 36 = 0 possui exatamente 4 ra´ızes. Determine essas ra´ızes usando o me´todo de Newton, com 2 d´ıgitos significa- tivos corretos, iniciando com (1, 1), (1,−1), (−4, 1) e (−4,−1). CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 97 3.44 - Sejam C = (1, 0) e D = (0, 1). Usando o me´todo de Newton para sistemas na˜o lineares determine o valor de um ponto P = (x, y), com precisa˜o de 10−3, que diste 2 unidades de C e de D, obtendo os valores iniciais necessa´rios atrave´s de gra´fico. 3.45 - Considere o seguinte problema: ”dado um polinoˆmio de grau n com coeficientes reais, P (z), onde z e´ uma varia´vel complexa, determinar uma raiz complexa de P (z), se existir, ou seja resolver a equac¸a˜o P (z) = 0”. Como z = x+ i y, o polinoˆmio P (z) pode ser escrito na forma: P (z) = u(x, y) + i v(x, y) Enta˜o resolver a equac¸a˜o P (z) = 0 e´ equivalente a resolver o seguinte sistemas de equac¸o˜es:{ u(x, y) = 0 v(x, y) = 0 Dada uma aproximac¸a˜o inicial (x0, y0) conveniente, podemos resolver este sistema pela extensa˜o do me´todo de Newton (para sistemas na˜o lineares). Aplique o processo descrito acima para determinar uma aproximac¸a˜o da raiz complexa de P (z) = z2 − 2 z + 3, tomando como valor inicial (x0, y0) = (1, 1). 3.46 - Dado que: x2 − 3.9 x + 4.8 e´ um fator aproximado de x4 − 4 x3 + 4 x2 + 4 x − 5 = 0, use o me´todo de Newton-Bairstow para melhorar a aproximac¸a˜o. 3.47 - Considere a matriz: A = 1 −2 0 0 t2 8 0 0 0 0 t 2 0 0 2 t . Sabendo que o determinante de A e´ o polinoˆmio P (t) = 2 t4−32, determine todos os valores de t, com erro inferior a 10−3, que tornem a matriz singular. Utilize o me´todo de Newton-Bairstow e use como fator quadra´tico inicial x2 − 0.0001 x− 3.999. Trabalhe com arredondamento para 4 casas decimais. 3.48 - Usando o algoritmo Q-D versa˜o Newton (para a raiz real) e Newton-Bairstow (para as ra´ızes complexas), determine todos os zeros de P (x) = x3 − x2 + 2x− 2, com 4 casas decimais corretas. 3.9 Problemas Aplicados e Projetos 3.1 - A equac¸a˜o de Kepler, usada para determinar o´rbitas de sate´lites e´ dada por: M = x − E sen x . Dado que E = 0.2 e M = 0.5, obtenha a raiz da equac¸a˜o de Kepler. 3.2 - Em problemas de fluxo em tubulac¸o˜es, e´ frequente precisar resolver a equac¸a˜o: c5 D5+c1 D+c0 = 0. Se c5 = 1000, c1 = −3 e c0 = 9.04, determine uma primeira raiz usando o me´todo de Newton e enta˜o aplique o me´todo de Newton-Bairstow para determinar as demais ra´ızes. 3.3 - Um amplificador eletroˆnico com acoplamento R - C com treˆs esta´gios em cascata tem uma resposta a um degrau unita´rio de tensa˜o dada pela expressa˜o: g(T ) = 1− (1 + T + T 2 2 )e−T , CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 98 onde T = tRC e´ uma unidade de tempo normalizada. O tempo de subida de um amplificador e´ definido como o tempo necessa´rio para sua resposta ir de 10% a 90% de seu valor final. No caso, como g(∞) = 1 e´ necessa´rio calcular os valores de T para os quais g = 0.1 e g = 0.9 ou seja resolver as equac¸o˜es: 0.1 = 1− (1 + T + T 2 2 )e−T . 0.9 = 1− (1 + T + T 2 2 )e−T . Chamando de T0.1 o valor obtido de T na 1a equac¸a˜o e T0.9 o valor obtido de T na 2a equac¸a˜o, calcular o tempo de subida. 3.4 - A Figura 3.17 represente o fluxo de a´gua em um canal aberto. θ θ y D CC A α ? �� @@ @@�� -ff ? ff ? - 6 Figura 3.17 Uma relac¸a˜o emp´ırica para o fluxo e´ a equac¸a˜o de Chez-Manning: Q = 1.49 E A R 2 3 S 1 2 , onde: • Q- fluxo em m3/seg. , • E - coeficiente de atrito determinado experimentalmente, valendo entre 0.025 e 0.035 para a maioria dos canais e rios , • A - a´rea da secc¸a˜o transversal do canal , • R - raio hidra´ulico que e´ definido como a raza˜o entre a a´rea A e o per´ımetro 2 C +D , • α - inclinac¸a`o do canal (S = sen α). a) Para um canal retangular (θ = 90o), sendo conhecidos Q,E, S,D, verificar que y e´ a soluc¸a˜o da equac¸a˜o: [( 1.49 E )3 D5 S 3 2 ] y5 − 4 Q3 y2 − 4 Q3 D y − Q3 D2 = 0 , a qual tem apenas uma raiz positiva. CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 99 b) Encontre as profundidades y do canal correspondente a duas estac¸o˜es A e B, cujos dados esta˜o tabelados a seguir: D S E Q Estac¸a˜o (A) 20.0 0.0001 0.030 133.0 (B) 21.5 0.0001 0.030 122.3 Em cada caso determinar incialmente intervalo contendo a raiz. 3.5 - A Figura 3.18 corresponde a um cabo uniforme, como por exemplo uma linha de transmissa˜o suspensa em dois apoios e sob a ac¸a˜o de seu pro´prio peso. L x f y - 6 6 ? Figura 3.18 A curva correspondente e´ uma catena´ria, cuja equac¸a˜o e´ dada por: y = T0 µ ( cosh µ x T0 − 1 ) , onde: • T0 - trac¸a˜o no cabo em x = 0 , • µ - peso por unidade de comprimento do cabo . Em x = L2 , y = f , logo: f = T0 µ ( cosh µ L 2 T0 − 1 ) . O comprimento S do cabo e´ dado por: f = 2 T0 µ ( senh µ L 2 T0 ) . Resolva enta˜o o seguinte problema: Um cabo de telefone pesando 1.5 Kgf/m esta´ simplesmente apoiado em dois pontos cuja distaˆncia e´ de 30 metros. Para um comprimento de cabo de 33 metros qual e´ o valor da flecha f? CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 100 3.6 - A equac¸a˜o: tg ( θ 2 ) = sen α cos α g R v2 − cos2 α , permite calcular o aˆngulo de inclinac¸a˜o, α, em que o lanc¸amento do mı´ssil deve ser feito para atingir um determinado alvo. Na equac¸a˜o acima, • α - aˆngulo de inclinac¸a˜o com a superf´ıcie da Terra com a qual e´ feita o lanc¸amento do mı´ssil , • g - acelerac¸a˜o da gravidade ' 9.81 m/s2 , • R - raio da Terra ' 6371000 m , • v - velocidade de lanc¸amento do mı´ssil, m/s , • θ - aˆngulo (medido do centro da Terra) entre o ponto de lanc¸amento e o ponto de impacto desejado , Resolva o problema considerando: θ = 80o e v tal que v 2 gR = 1.25, ou seja, aproximadamente 8.840 m/s. 3.7 - Quando um capacitor carregado e´ ligado com uma resisteˆncia R, um processo de descarga do capacitor ocorre. Durante este processo, uma varia´vel no tempo e´ estabelecida no circuito. Sua variac¸a˜o com o tempo se da´ de forma decrescente e exponencial, de acordo com a expressa˜o: F (t) = I = Q0 RC e− T RC , onde I e´ a corrente, Q0 e´ a carga inicial do capacitor, C sua capacitaˆncia, R a resisteˆncia e T o paraˆmetro tempo. Definindo G(t) = F (t) − I, o instante T em que G(t) = 0, corresponde a`quele em que a corrente I percorre o circuito. Determinar T nos seguintes casos: a) I = 0.83 Ampe´re, Q0 = 7 coulomb, R = 3 Ohms, C = 2 Farad; b) I = 0.198 Ampe´re, Q0 = 20 coulomb, R = 9 Ohms, C = 11 Farad. 3.8 - Uma loja de eletrodome´sticos oferece dois planos de financiamento para um produto cujo prec¸o a vista e´ R$ 162,00: • Plano A: entrada de R$ 22,00 + 9 prestac¸o˜es iguais de R$ 26,50, • Plano B: entrada de R$ 22,00 + 12 prestac¸o˜es de R$ 21,50. Qual dos dois planos apresenta a menor taxa de juros, sendo portanto melhor para o consumidor? Observac¸a˜o: Sabe-se que a equac¸a˜o que relaciona os juros (J) e o prazo (P) com o valor financiado (VF = prec¸o a` vista - entrada) e a prestac¸a˜o mensal PM e´ dada por: 1− (1 + J)−P J = V F PM . (3.33) a) Fazendo x = 1 + J e k = V FPM , verificar que a equac¸a˜o (3.33) se transforma em: f(x) = kxP+1 − (k + 1)xP + 1 = 0 . (3.34) CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 101 b) Escrever a equac¸a˜o (3.34) para o problema proposto e encontrar um intervalo contendo a raiz positiva 6= 1. 3.9 - Um dos elfos de Valfenda, o grande arqueiro Glorfindel, disparou uma flecha em direc¸a˜o a cidade de Bri para cair na cabec¸a de Cevado Carrapicho, dono da estalagem do Poˆnei Saltitante. O rei Elessar, de Gondor, viu o fato em sua pedra vidente. Junto pore´m aparecia o seguinte escrito: 37.104740 + 3.15122t− 2t 2 2 = 0 . Elessar desesperado, pois adorava a cerveja da estalagem, queria salvar Cevado Carrapicho (fabricante da cerveja) a qualquer custo; mas apesar de toda sua sabedoria, na˜o entendia o que significavam aqueles nu´meros. Como ele podia ver o futuro em sua pedra, correu ate´ uma gruta e escreveu numa parede o seguinte: “Por favor, quem souber o que significa: 37.104740 + 3.15122t− 2t 2 2 = 0 , me ajude!” Elessar esperou por um minuto e colocou sua pedra de forma a ver os escritos e verificou que logo abaixo da sua escrita aparecia: “t = −4.71623 ou t = 7.86745 , que deve ser o tempo de alguma coisa, em horas ou minutos.” Elessar levou algum tempo para traduzir a escrita, mas logo correu para ajudar Cevado, pois se ele estivesse no alvo depois de 7 horas e 52 minutos seria acertado. Elessar conseguiu chegar a tempo e salvou Cevado da morte certa, e comemorou com sua ta˜o amada cerveja. . . Dezenas de milhares de anos depois. . .. Eric estava vasculhando uma gruta quando encontrou escritos junto a rabiscos. Ele percebeu que os rabiscos eram runas e´lficas, e que aquilo era um pedido de ajuda. Grac¸as a Deus e aos Anjos, Eric estava com seu notebook na mochila, e tinha um programa chamado Ra´ızes que seu irma˜o havia instalado para resolver alguns problemas. Depois de alguns segundos tentando entender como eram entrados os dados, ele obteve: “t = −4.71623 ou t = 7.86745 ,′′ e pensou, isso deve ser alguma coisa, em horas ou minutos. . .. a) Resolva o problema proposto, e obtenha pelo me´todo de Newton a raiz positiva. b) Obter a ra´ız negativa, usando o polinoˆmio do primeiro grau obtido no esquema de Briot- Riffini-Horner. 3.10 - Na engenharia qu´ımica, reatores do tipo PFR sa˜o frequentemente usados para converter rea- gentes em produtos. Sabe-se que a eficieˆncia de conversa˜o a`s vezes pode ser melhorada reciclando uma frac¸a˜o do produto como mostrado na Figura 3.19 a seguir: Reciclo Produto Reator PFR Alimentac¸a˜o 6 -- Figura 3.19 CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 102 A taxa de reciclo e´ definida por: R = volume do fluido que retorna ao reator volume do fluido que sai do reator Supondo que estamos processando um reagente A a fim de gerar um reagente B, segundo a expressa˜o autocatal´ıtica: A+B → B +B , pode-se mostrar que a taxa o´tima de reciclo satisfaz a equac¸a˜o: ln [ 1 +R(1− xA) R(1− xA) ] = R+ 1 R[1 +R(1− xa)] , (3.35) onde xA e´ a frac¸a˜o de reagente A que e´ convertido no produto B. A taxa o´tima de reciclo corresponde ao reator de menor tamanho poss´ıvel necessa´rio para se atingir o n´ıvel de conversa˜o desejado. Determine as razo˜es de reciclo necessa´rias para se minimizar o tamanho do reator, resolvendo a equac¸a˜o (3.35) para as seguintes frac¸o˜es de conversa˜o (xA), do reagente A no produto B: i) xA = 0.99 , ii) xA = 0.995 , iii) xA = 0.999 , iv) xA = 0.9999 , v) xA = 0.99999 . 3.11 - Suponha que tenhamos um circuito temporizador 555 como mostra a Figura 3.20: 7 555 RB 5 3 84 6 2 1 .1µF Output C RA +Vα Figura 3.20 CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 103 cuja onda de sa´ıda e´ da forma: T2T1 -ff-ff Figura 3.21 com T1 + T2 = 1 f , onde f e´ a frequeˆncia, e o ciclo de trabalho CT , e´ dado por: CT = T1 T1 + T2 × 100%. Pode-se mostrar que: T1 = RACln(2) , T2 = −RA RB C RA +RB × ln (∣∣∣∣RA − 2 RB2 RA −RB ∣∣∣∣) . Dado que RA = 8.670, C = 0.1× 10−6, T2 = 1.4× 10−4, determine RB, T1, f , e o ciclo de trabalho CT . 3.12 - Um tanque de vaporizac¸a˜o flash e´ alimentado com Fmoles/h por uma corrente de ga´s natural de n componentes, como mostrado na Figura 3.22: F L V - - - Figura 3.22 As correntes de l´ıquido e vapor sa˜o designadas por L e V moles/h, respectivamente. As frac¸o˜es molares dos componentes na alimentac¸a˜o, nas correntes de vapor e de l´ıquido sa˜o designadas por zi,yi e xi, respectivamente. Assumindo equil´ıbrio l´ıquido-vapor em estado estaciona´rio, segue que: F = L+ V , (3.36) CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 104 ziF = xiL+ yiV , (3.37) Ki = yi xi , i = 1, 2, . . . , n . (3.38) onde: (3.36) e´ o balanc¸o global, (3.37) e´ o balanc¸o individual , (3.38) e´ a relac¸a˜o de equil´ıbrio, e, Ki a´ a constante de equil´ıbrio para o i-e´sima componente na pressa˜o e temperatura do tanque. Das equac¸o˜es acima e do fato de ∑n i=1 xi = ∑n i=1 yi = 1, mostra-se que: n∑ i=1 zi (ki − 1) V (Ki − 1) + F = 0 . (3.39) Supondo que F = 1000 moles/h, calcule o valor de V , com duas casas decimais corretas, resolvendo a equac¸a˜o (3.40), para a corrente de ga´s natural, a` temperatura de 120oF e pressa˜o de 1600 psia, para cada um dos componentes da tabela a seguir: Componentes i zi Ki Dio´xido de Carbono 1 0.0046 1.65 Metano 2 0.8345 3.09 Etano 3 0.0381 80.72 Propano 4 0.0163 0.39 Isobutano 5 0.0050 0.21 n-Butano 6 0.0074 0.175 Pentanos 7 0.0287 0.093 Hexanos 8 0.0220 0.065 Heptanos 9 0.0434 0.036 Para cada valor de V , calcule os valores de L, de xi e de yi. 3.13 - Lee and Duffy (A. I. Ch. E Journal, 1976) relacionaram o fator de atrito para escoamentos de part´ıculas fibrosas em suspensa˜o com o nu´mero de Reynolds, pela seguinte equac¸a˜o emp´ırica: 1√ f = ( 1 k ) ln(RE √ f) + ( 14− 5.6 k ) . Nesta relac¸a˜o f e´ o fator de atrito, RE e´ o nu´mero de Reynolds e k e´ uma constante determinada pela concentrac¸a˜o de part´ıculas em suspensa˜o. Para uma suspensa˜o de 0.08% de concentrac¸a˜o temos que k = 0.28. Determine o valor de f quando RE = 3750. 3.14 - Muitas equac¸o˜es de estado foram desenvolvidas para descrever as relac¸o˜es entre pressa˜o, P , volume molar, V , e temperatura, T , de gases. Uma das equac¸o˜es mais utilizadas e´ equac¸a˜o de Beattie- Bridgeman: P = RT V + β V 2 + γ V 3 + δ V 4 , (3.40) onde R e´ a constante universal dos gases e β, γ e δ sa˜o paraˆmetros caracter´ısticos do ga´s em estudo. O segundo, terceiro e quarto termos de (3.40), podem ser vistos como correc¸o˜es da lei dos gases ideais, PV = RT , para o comportamento na˜o ideal de um ga´s. Os paraˆmetros β, γ e δ sa˜o definidos por: β = RTB0 −A0 − Rc T 2 , CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 105 γ = −RTB0b+A0a− RcB0 T 2 , δ = RB0bc T 2 , onde: A0, B0, a, b e c sa˜o constantes determinadas experimentalmente e sa˜o diferentes para cada ga´s. Dados os valores de pressa˜o, P , temperatura , T , e das constantes R,A0, B0, a, b, c e´ poss´ıvel determinar o volume molar de qualquer ga´s resolvendo a equac¸a˜o (3.40), usando como estimativa inicial para o volume molar a lei dos gases ideais: V0 = RTP . Para o ga´s metano, tem-se que: A0 = 2.2769, B0 = 0.05587, a = 0.01855, b = −0.01587 e c = 12.83×104. Considere temperaturas de 0o e 200o e as seguintes presso˜es em atm: 1, 2, 5, 20, 40, 60, 80, 120, 140, 160, 180 e 200. Com esses dados, determine: a) o volume molar do ga´s metano, com precisa˜o de 10−6, b) o fator de compressibildade z, onde z = PVRT , b) compare os seus resultados com valores experimentais do fator de compressibilidade para o metano de 0o e 200o, apresentados na Figura 3.23: 0.70 0.80 0.90 1.00 1.01 1.02 1.03 z P - 200150100500 0oC 200oC 6 Figura 3.23 3.15 - Considere o sistema diferencial de segunda ordem: x ′′ + x+ 2 y′ + y = f(t) x′′ − x+ y = g(t) x(0) = x′(0) = y(0) = 0 Para resolveˆ-lo pelo me´todo da transformada de Laplace, torna-se necessa´rio fatorar a expressa˜o (de- terminar as ra´ızes): (S2 + 1)(S)− (2S + 1)(S2 − 1) , tal que as frac¸o˜es parciais possam ser usadas no ca´lculo da transformada inversa. Determine esses fatores (ra´ızes). CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 106 3.16 - Um me´todo muito eficiente para integrac¸a˜o nume´rica de uma func¸a˜o e´ o chamado me´todo de quadratura de Gauss. No desenvolvimento das fo´rmulas para este me´todo e´ necessa´rio calcular os zeros de uma famı´lia de polinoˆmios ortogonais. Uma famı´lia importante de polinoˆmios ortogonais e´ a de Legendre. Encontre os zeros do polinoˆmio de Legendre de grau 6(seis): P6(x) = 1 48 (693 x6 − 945 x4 + 315 x2 − 15) . Observac¸a˜o: Todos os zeros dos polinoˆmios de Legendre sa˜o menores do que 1(um) em mo´dulo e sa˜o sime´tricos em relac¸a˜o a origem. 3.17 - Considere um circuito de polarizac¸a˜o que consiste de uma bateria com uma tensa˜o VB = 2.0 V e um resistor R de 50 Ω em se´rie, conectado a um diodo semicondutor de estado so´lido como mostrado na Figura 3.24. − + νi − + VB R ? ? Figura 3.24 As caracter´ısticas operacionais na gama normal de operac¸a˜o de um diodo sa˜o determinadas pela equac¸a˜o relacionando suas varia´veis terminais de tensa˜o e corrente. Se tomarmos ν e i como sendo estas varia´veis e escolhermos as direc¸o˜es de refereˆncia relativas mostradas, a equac¸a˜o relacionando estas varia´veis e´ dada por: i = Is ( e qν k t − 1 ) , (3.41) onde: • Is e´ a intensidade de corrente de saturac¸a˜o reversa. Esta e´ a corrente ma´xima que flui quando o diodo e´ polarizado em reverso, ou seja, quando ν << 0. Ela e´ func¸a˜o do material usado na confecc¸a˜o do diodo, do grau de lubrificac¸a˜o e das te´cnicas de fabricac¸a˜o particulares. Um valor t´ıpico para um diodo de sil´ıcio em temperatura ambiente e´ 10−9 Ampe´re , • k e´ a constante de Boltzmann, que tem o valor: 1.38047× 10−23 joule/oK, • t e´ a temperatura absoluta em oK na qual o diodo e´ operado, • q e´ a carga do ele´tron que tem o valor: 1.6020310−19 coulomb. Em temperaturas ambientes normais, o valor do termo q kt e´ aproximadamente 40. Podemos agora proceder a` soluc¸a˜o do circuito de polarizac¸a˜o, ou seja, encontrar os valores de ν e i. Para isso, basta aplicar a lei das tenso˜es de Kirchoff ao circuito, obtendo assim: VB = i R+ ν . (3.42) Substituindo em (3.42) os valores de VB e R, e usando a relac¸a˜o dada por (3.41), obtem-se uma equac¸a˜o na˜o linear em ν. Resolvendo-se esta equac¸a˜o, o valor da corrente de polarizac¸a˜o i, e´ facilmente obtido. CAPI´TULO 3. EQUAC¸O˜ES NA˜O LINEARES 107 3.18 - Num escoamento turbulento em uma rede de tubulac¸a˜o interconectada, a raza˜o de escoamento V de um no´ para outro e´ proporcional a` raiz quadrada da diferenc¸a entre as presso˜es nos no´s. Para a rede da figura a seguir e´ solicitado determinar a pressa˜o em cada no´. 4 3 2 1 b = 0.1 b = 0.1 b = 0.2 b = 0.2 b = 0.1p = 0, b = 0.2 p = 500, b = 0.3 - @@�� Figura 3.25 Os valores de b representam fatores de condutaˆncia na relac¸a˜o: vij = bij √ (pi − pj) . As equac¸o˜es para as presso˜es em cada no´ sa˜o enta˜o dadas por: no´ 1 : 0.3 √ 500− p1 = 0.2 √ p1 − p2 + 0.2 √ p1 − p3 , no´ 2 : 0.2 √ p1 − p2 = 0.1 √ p2 − p4 + 0.2 √ p2 − p3 , no´ 3 : 0.1 √ p1 − p3 = 0.2 √ p3 − p2 + 0.1 √ p3 − p4 , no´ 4 : 0.1 √ p2 − p4 + 0.1 √ p3 − p4 = 0.2 √ p4 − 0 . onde estamos assumindo que p1 > p3; se isso na˜o for verdadeiro e´ necessa´rio modificar as equac¸o˜es. Resolva o sistema dado pelo me´todo de Newton. Cap´ıtulo 4 Soluc¸a˜o de Sistemas Lineares: Me´todos Exatos 4.1 Introduc¸a˜o Uma variedade de problemas de engenharia pode ser resolvido atrave´s da ana´lise linear; entre eles podemos citar: determinac¸a˜o do potencial em redes ele´tricas, ca´lculo da tensa˜o na estrutura meta´lica da construc¸a˜o civil, ca´lculo da raza˜o de escoamento num sistema hidra´ulico com derivac¸o˜es, previsa˜o da concentrac¸a˜o de reagentes sujeitos a` reac¸o˜es qu´ımicas simultaˆneas. O problema matema´tico em todos estes casos se reduz ao problema de resolver um sistema de equac¸o˜es simultaˆneas. Tambe´m as encontramos, quando estudamos me´todos nume´ricos para resolver problemas de equac¸o˜es diferenciais parciais, pois estes requerem a soluc¸a˜o de um conjunto de equac¸o˜es. A soluc¸a˜o de um conjunto de equac¸o˜es e´ muito mais dif´ıcil quando as equac¸o˜es sa˜o na˜o lineares. Entretanto a maioria das aplicac¸o˜es envolve somente equac¸o˜es lineares, muito embora quando o sistema e´ de grande porte devemos escolher o me´todo nume´rico adequadamente para preservar a ma´xima precisa˜o. Antes de desenvolvermos alguns me´todos espec´ıficos, discutiremos o que queremos dizer com uma soluc¸a˜o e as condic¸o˜es sob as quais a soluc¸a˜o existe, pois na˜o adianta tentar obter uma soluc¸a˜o se na˜o ha´ nenhuma. Uma equac¸a˜o e´ linear se cada termo conte´m na˜o mais do que uma varia´vel e cada varia´vel aparece na primeira poteˆncia. Por exemplo, 3x+ 4y − 10z = −3 e´ linear, mas xy − 3z = −3 na˜o e´, pois o primeiro termo conte´m duas variave´is. Tambe´m x3 + y − z = 0 na˜o e´ linear, pois o primeiro termo conte´m uma varia´vel elevada ao cubo. Vamos considerar n equac¸o˜es lineares com n varia´veis (inco´gnitas) e vamos nos referir a elas como um Sistema de n Equac¸o˜es Lineares ou um Sistema Linear de ordem n. Uma soluc¸a˜o para esse sistema de equac¸o˜es consiste de valores para as n varia´veis, tais que quando esses valores sa˜o substitu´ıdos nas equac¸o˜es, todas elas sa˜o satisfeitas simultaneamente. Por exemplo, o sistema de treˆs equac¸o˜es lineares: x + y + z = 1x − y − z = 12x + 3y − 4z = 9 tem a soluc¸a˜o x = 1, y = 1 e z = −1. O leitor pode verificar a validade das treˆs equac¸o˜es substituindo esses valores pelas varia´veis no sistema dado. 108 CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 109 Observe que o sistema acima pode ser escrito na forma matricial como: 1 1 11 −1 −1 2 3 −4 xy z = 11 9 . De um modo geral um sistema de n equac¸o˜es lineares e´ escrito como: a11 x1 + a12 x2 + a13 x3 . . . + a1n xn = b1 a21 x1 + a22 x2 + a23 x3 . . . + a2n xn = b2 a31 x1 + a32 x2 + a33 x3 . . . + a2n xn = b2 . . . . . . an1 x1 + an2 x2 + an3 x3 . . . + ann xn = bn (4.1) e e´ representado na forma matricial por: a11 a12 . . . a1n a21 a22 . . . a2n ... ... . . . ... an1 an2 . . . ann x1 x2 ... xn = b1 b2 ... bn , (4.2) ou simplesmente Ax = b , (4.3) onde A e´ chamada de matriz dos coeficientes, b e´ o vetor do termo independente e x e´ o vetor soluc¸a˜o. Dado um sistema de equac¸o˜es arbitra´rio, na˜o podemos afirmar sem investigar que ha´ uma soluc¸a˜o ou, se houver, que seja u´nica. Como pode ser observado a seguir, ha´ treˆs e apenas treˆs possibilidades de se classificar um sistema linear. Classificac¸a˜o de um Sistema Linear A classificac¸a˜o de um sistema linear e´ feita em func¸a˜o do nu´mero de soluc¸o˜es que ele admite, da seguinte maneira: a) Sistema Poss´ıvel ou Consistente: E´ todo sistema que possui pelo menos uma soluc¸a˜o. Um sistema linear poss´ıvel e´: (a.1) determinado se admite uma u´nica soluc¸a˜o, e, (a.2) indeterminado se admite mais de uma soluc¸a˜o. b) Sistema Imposs´ıvel ou Inconsistente: E´ todo sistema que na˜o admite soluc¸a˜o. O pro´ximo exemplo ilustra a classificac¸a˜o de um sistema linear. Exemplo 4.1 - Classificar os seguintes sistemas lineares: (I) { x + y = 6 x − y = 2 CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 110 (II) { x + y = 1 2 x + 2 y = 2 (III) { x + y = 1 x + y = 4 Soluc¸a˜o: Consideremos o sistema (I). A soluc¸a˜o e´ x = 4 e y = 2; nenhum outro par de valores de x e y satisfaz ambas as equac¸o˜es. Esse sistema e´ representado geometricamente pela Figura 4.1. Qualquer ponto da reta r1 tem coordenadas que satisfazem a primeira das equac¸o˜es em (I). Do mesmo modo, todos os pontos em r2 satisfazem a segunda equac¸a˜o de (I). Os pontos que satisfazem ambas as equac¸o˜es devem localizar-se em ambas as retas. Ha´ somente um ponto assim. As coordenadas desse ponto sa˜o a soluc¸a˜o que procuramos. Logo, o sistema (I) admite como u´nica soluc¸a˜o o par (4, 2)t. Portanto (I) e´ um sistema poss´ıvel e determinado. 6 4 2 x+ y = 6 r1 x− y = 2 r2 642 6 - Figura 4.1 Consideremos agora o sistema (II). A Figura 4.2 mostra o gra´fico dessas duas retas. 2x+ 2y = 2 x+ y = 1 2 1 21 6 - Figura 4.2 Observe que geometricamente as retas x + y = 1 e 2 x + 2 y = 2 sa˜o coincidentes. Assim, para o sistema (II), temos que os pares (0, 1)t; (1, 0)t; (0.5, 0.5)t, . . ., sa˜o soluc¸o˜es, isto e´, o sistema admite infinitas soluc¸o˜es. Logo (II) e´ um sistema poss´ıvel e indeterminado. Finalmente, consideremos o sistema (III). Novamente, colocando as duas retas no mesmo gra´fico, obtemos a Figura 4.3. x+ y = 4 x+ y = 1 4 2 42 6 - Figura 4.3 CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 111 Observe que geometricamente as duas retas sa˜o paralelas. Assim, para o sistema (III), as duas equac¸o˜es sa˜o contradito´rias, isto e´, na˜o e´ poss´ıvel que se tenha simultaneamente x + y = 1 e x + y = 4. Logo (III) e´ um sistema imposs´ıvel. Nosso objetivo aqui sera´ o de desenvolver me´todos nume´ricos para resolver sistemas lineares de ordem n, que tenham soluc¸a˜o u´nica. Observe que tais sistemas sa˜o aqueles onde a matriz dos coeficientes e´ na˜o singular, isto e´, det(A) 6= 0. Antes de descrevermos em detalhes os me´todos de soluc¸a˜o, vamos examinar quais os caminhos mais gerais para se chegar a elas. Me´todos nume´ricos para soluc¸a˜o de sistemas de equac¸o˜es lineares sa˜o divididos principalmente em dois grupos: - Me´todos Exatos: sa˜o aqueles que forneceriam a soluc¸a˜o exata, na˜o fossem os erros de arredondamento, com um nu´mero finito de operac¸o˜es. - Me´todos Iterativos: sa˜o aqueles que permitem obter a soluc¸a˜o de um sistema com uma dada precisa˜o atrave´s de um processo infinito convergente. Assim, os me´todos exatos em princ´ıpio, ou seja desprezando os erros de arredondamento, produzira˜o uma soluc¸a˜o, se houver, em um nu´mero finito de operac¸o˜es aritme´ticas. Um me´todo iterativo, por outro lado, iria requerer em princ´ıpio, um nu´mero infinito de operac¸o˜es aritme´ticas para produzir a soluc¸a˜o exata. Assim, um me´todo iterativo tem um erro de truncamento e o exato na˜o tem. Por outro lado, em sistemas de grande porte os erros de arredondamento de um me´todo exato podem tornar a soluc¸a˜o sem significado, enquanto que nos me´todos iterativos os erros de arredondamento na˜o se acumulam. Veremos entretanto, que ambos sa˜o u´teis, ambos teˆm vantagens e limitac¸o˜es. Neste cap´ıtulo estudaremos somente me´todos exatos e no Cap´ıtulo 5 os me´todos iterativos. Voltemos ao exemplo 4.1. Observando a Figura 4.1 veˆ-se facilmente que poder´ıamos trac¸ar infinitos conjuntos de duas retas concorrentes cuja intersecc¸a˜o fosse o par (4, 2)t. Cada um desses conjuntos formaria um sistema de duas equac¸o˜es lineares que teriam portanto a mesma soluc¸a˜o. Assim definimos: Definic¸a˜o 4.1 - Dois sistemas lineares sa˜o equivalentes quando admitem a mesma soluc¸a˜o. Com base na definic¸a˜o 4.1 na˜o fica dif´ıcil deduzir que uma maneira de obter a soluc¸a˜o de um sistema linear atrave´s de me´todos nume´ricos e´ transforma´-lo em outro equivalente cuja soluc¸a˜o seja facilmente obtida. Em geral, nos me´todos exatos, transformamos o sistema original num sistema equivalente, cuja soluc¸a˜o e´ obtida resolvendo-se sistemas triangulares. Soluc¸a˜o de Sistemas Triangulares Como ja´ dissemos, resolver sistemas triangulares e´ muito fa´cil; entretanto, apresentaremos aqui a soluc¸a˜o de tais sistemas com o objetivo de auxiliar a elaborac¸a˜o de projetos que envolvam a resoluc¸a˜o dos mesmos. i) Um sistema linear de ordem n e´ triangular inferior se tiver a forma: CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 112 a11 x1 = b1 a21 x1 + a22 x2 = b2 a31 x1 + a32 x2 + a33 x3 = b3 . . . . . . . . . . . . ... an1 x1 + an2 x2 + . . . + ann xn = bn onde aii 6= 0, i = 1, 2, . . . , n. Assim a soluc¸a˜o de um sistema triangular inferior e´ obtida por substituic¸a˜o direta, isto e´, determinamos o valor de x1 na primeira equac¸a˜o; substitu´ımos esse valor na segunda equac¸a˜o e determinamos o valor de x2 e assim por diante. Algebricamente podemos resolveˆ-lo pelas fo´rmulas: x1 = b1 a11 , xi = bi − ∑i−1 j=1 aij xj aii , i = 2, 3, . . . , n . (4.4) ii) Um sistema linear de ordem n e´ triangular superior se tiver forma: a11 x1 + a12 x2 + a13 x3 . . . + a1n xn = b1 a22 x2 + a23 x3 . . . + a2n xn = b2 a33 x3 . . . + a3n xn = bn . . . . . . ... ann xn = bn onde aii 6= 0; i = 1, 2, . . . , n. Assim a soluc¸a˜o de um sistema triangular superior e´ obtida por retro- substituic¸a˜o, isto e´, determinamos o valor de xn na u´ltima equac¸a˜o; substitu´ımos esse valor na penu´ltima equac¸a˜o e determinamos o valor de xn−1 e assim por diante. Algebricamente podemos resolveˆ-lo pelas fo´rmulas: xn = bn ann , xi = bi − ∑n j=i+1 aij xj aii , i = n− 1, . . . , 1 . (4.5) Portanto, para resolvermos nosso problema falta explicar como um dado sistema linear de ordem n pode ser transformado num outro equivalente cuja soluc¸a˜o seja obtida resolvendo-se sistemas trian- gulares. Como veremos, os me´todos nume´ricos apresentados nesse cap´ıtulo explicam como fazer isso. Antes, pore´m, daremos algumas definic¸o˜es que julgamos necessa´rias para um melhor entendimento de tais me´todos. Definic¸a˜o 4.2 - Uma matriz triangular inferior e´ uma matriz quadrada C = (cij) tal que cij = 0 para i < j. Do mesmo modo, se cij = 0 para i > j, C e´ uma matriz triangular superior. Definic¸a˜o 4.3 Seja A uma matriz n× n da forma: A = a11 a12 . . . a1n a21 a22 . . . a2n ... ... . . . ... an1 an2 . . . ann . (4.6) CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 113 Os menores principais de A de ordens 1, 2, . . . n sa˜o definidos pelas sub-matrizes de A: Ak = a11 a12 . . . a1k a21 a22 . . . a2k ... ... . . . ... ak1 ak2 . . . akk , k = 1, 2, . . . n . Definic¸a˜o 4.4 - Uma matriz real sime´trica A, n × n, e´ positiva definida se para todos os menores principais Ak, constitu´ıdo das k primeiras linhas e k primeiras colunas vale: det(Ak) > 0 , k = 1, 2, . . . , n. 4.2 Decomposic¸a˜o LU Inicialmente veremos em que condic¸o˜es podemos decompor uma matriz quadrada A = (aij) no produto de uma matriz triangular inferior por uma matriz triangular superior. Teorema 4.1 - Teorema LU - Seja A = (aij) uma matriz quadrada de ordem n, e Ak o menor principal, constitu´ıdo das k primeiras linhas e k primeiras colunas de A. Assumimos que det(Ak) 6= 0 para k = 1, 2, . . . , n − 1. Enta˜o existe uma u´nica matriz triangular inferior L = (`ij), com `11 = `22 = . . . = `nn = 1, e uma u´nica matriz triangular superior U = (uij) tal que LU = A. Ale´m disso, det(A) = u11u22 . . . unn. Prova: Para provar esse teorema usaremos induc¸a˜o sobre n. 1) Se n = 1, temos que: a11 = 1 · a11 = 1 · u11 unicamente, e assim A = LU onde L = 1 e U = u11. Ale´m disso, det(A) = u11. 2) Assumimos que o teorema e´ verdadeiro para n = k − 1, ou seja que toda matriz de ordem (k − 1) e´ decompon´ıvel no produto LU nas condic¸o˜es do teorema. 3) Devemos mostrar que a decomposic¸a˜o pode ser feita para uma matriz de ordem n = k. Seja enta˜o A uma matriz de ordem k. Partimos essa matriz em sub-matrizes da forma: A = Ak−1 r st akk , onde r e s sa˜o vetores coluna, ambos com k − 1 componentes. Note que a matriz Ak−1 e´ de ordem k − 1 e satisfaz as hipo´teses do teorema. Portanto pela hipo´tese de induc¸a˜o esta pode ser decomposta na forma Ak−1 = Lk−1Uk−1. Utilizando as matrizes Lk−1 e Uk−1 formamos as seguintes matrizes: L = Lk−1 0 mt 1 ; U = Uk−1 p 0 ukk , onde m e p sa˜o vetores coluna, ambos com k − 1 componentes. Note que m, p e ukk sa˜o desconhecidos. Assim, impondo que a matriz A seja decompon´ıvel em LU vamos tentar determina´-los. Efetuando o produto LU , segue que: LU = Lk−1Uk−1 Lk−1 p mt Uk−1 mt p+ ukk . CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 114 Estudemos agora a equac¸a˜o LU = A, isto e´: Lk−1Uk−1 Lk−1 p mt Uk−1 mt p+ ukk = Ak−1 r st akk . Da igualdade acima conclu´ımos que: Lk−1Uk−1 = Ak−1 , Lk−1 p = r , mt Uk−1 = st , mt p+ ukk = akk . Observe que a primeira equac¸a˜o e´ va´lida pela hipo´tese de induc¸a˜o, e portanto Lk−1 e Uk−1 sa˜o unicamente determinadas. Ale´m disso, nem Lk−1 e nem Uk−1 sa˜o singulares (ou Ak−1 tambe´m seria singular, contrariando a hipo´tese). Assim de: Lk−1 p = r ⇒ p = L−1k−1 r , mt Uk−1 = st ⇒ mt = st U−1k−1 , mt p+ ukk = akk ⇒ ukk = akk −mt p . Portanto p,m e ukk sa˜o determinados univocamente nesta ordem, e L e U sa˜o determinados unica- mente. Finalmente, det(A) = det(L) · det(U) = 1 · det (Uk−1) · ukk = u11u22 . . . . . . uk−1,k−1ukk , completando a prova. Cabe salientar que a decomposic¸a˜o LU fornece um dos algoritmos mais eficientes para o ca´lculo do determinante de uma matriz. Esquema Pra´tico para a Decomposic¸a˜o LU Observe que teoricamente, para obtermos as matrizes L e U , devemos calcular a inversa de Lk−1 e Uk−1. Entretanto na pra´tica podemos calcular L e U simplesmente aplicando a definic¸a˜o de produto e de igualdade de matrizes, isto e´, impondo que LU = A. Seja enta˜o: LU = 1 `21 1 © `31 `32 1 · · · · · · · · · . . . `n1 `n2 `n3 . . . 1 u11 u12 u13 . . . u1n u22 u23 . . . u2n u33 . . . u3n © . . . ... unn , e a matriz A como em (4.6). Para obtermos os elementos da matriz L e da matriz U devemos calcular os elementos das linhas de U e os elementos da colunas de L na seguinte ordem: CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 115 1a¯ linha de U : Fazendo o produto da 1a¯ linha de L por todas as colunas de U e igualando com os elementos da 1a¯ linha de A, obtemos , 1 · u11 = a11 ⇒ u11 = a11 , 1 · u12 = a12 ⇒ u12 = a12 , . . . 1 · u1n = a1n ⇒ u1n = a1n , ⇒ u1j = a1j , j = 1, 2, . . . , n . 1a¯ coluna de L: Fazendo o produto de todas as linhas de L, (da 2a¯ ate´ a na¯), pela 1a¯ coluna de U e igualando com os elementos da 1a¯ coluna de A, (abaixo da diagonal principal), obtemos , `21 u11 = a21 ⇒ `21 = a21 u11 , `31 u11 = a31 ⇒ `31 = a31 u11 , . . . `n1 u11 = an1 ⇒ `n1 = an1 u11 , ⇒ `i1 = ai1 u11 , i = 2, . . . , n . 2a¯ linha de U : Fazendo o produto da 2a¯ linha de L por todas as colunas de U , (da 2a¯ ate´ a na¯), e igualando com os elementos da 2a¯ linha de A, ( da diagonal principal em diante), obtemos , `21 u12 + u22 = a22 ⇒ u22 = a22 − `21u12 , `21 u13 + u23 = a23 ⇒ u23 = a23 − `21u13 , . . . `21 u1n + u2n = a2n ⇒ u2n = a2n − `21u1n , ⇒ u2j = a2j − `21u1j , j = 3, . . . , n . 2a¯ coluna de L: Fazendo o produto de todas as linhas de L ( da 3a¯ ate´ a na¯) pela 2a¯ coluna de U e igualando com os elementos da 2a¯ coluna de A, ( abaixo da diagonal principal), obtemos , `31 u12 + `32u22 = a32 ⇒ `32 = a32 − `31u12 u22 , `41 u12 + `42u22 = a42 ⇒ `42 = a42 − `41u12 u22 , . . . `n1 u12 + `n2u22 = an2 ⇒ `n2 = an2 − `n1u12 u22 , ⇒ `i2 = ai2 − `i2u12 u22 , i = 3, . . . , n . Se continuarmos calculando 3a¯ linha de U , 3a¯ coluna de L, 4a¯ linha de U , 4a¯ coluna de L, etc . . ., teremos as fo´rmulas gerais: uij = aij − ∑i−1 k=1 `ikukj , i ≤ j, `ij = ( aij − ∑j−1 k=1 `ikukj ) / ujj , i > j. (4.7) CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 116 Observe que a convenc¸a˜o usual de ∑k j=1 ≡ 0 se k < 1, deve ser utilizada aqui. Aplicac¸a˜o a` Soluc¸a˜o de Sistemas Lineares Vejamos agora como podemos aplicar a decomposic¸a˜o LU para obtermos a soluc¸a˜o de sistemas line- ares. Seja o sistema Ax = b de ordem n determinado, onde A satisfaz as condic¸o˜es da decomposic¸a˜o LU . Enta˜o o sistema Ax = b pode ser escrito como: LUx = b . Assim transformamos o sistema linear Ax = b no sistema equivalente LUx = b cuja soluc¸a˜o e´ facil- mente obtida. De fato: fazendo Ux = y, a equac¸a˜o acima reduz-se a Ly = b. Resolvendo o sistema triangular inferior Ly = b, obtemos o vetor y. Substituindo o valor de y no sistema Ux = y obtemos um sistema triangular superior cuja soluc¸a˜o e´ o vetor x que procuramos. Assim, a aplicac¸a˜o da decomposic¸a˜o LU na resoluc¸a˜o de sistemas lineares requer a soluc¸a˜o de dois sistemas triangulares. Exemplo 4.2 - Seja: A = 5 2 13 1 4 1 1 3 . a) Verificar se A satisfaz as condic¸o˜es da decomposic¸a˜o LU . b) Decompor A em LU . c) Atrave´s da decomposic¸a˜o LU , calcular o determinante de A. d) Resolver o sistema Ax = b, onde b = (0, −7, −5)t, usando a decomposic¸a˜o LU . Soluc¸a˜o: a) Para que A satisfac¸a as condic¸o˜es da decomposic¸a˜o LU devemos ter: det(A1) 6= 0 e det(A2) 6= 0. Temos que : det(A1) = 5 6= 0 e det(A2) = −1 6= 0. Logo A satisfaz as condic¸o˜es do teorema. b) Usando as fo´rmulas (4.7), obtemos: Para a 1a¯ linha de U : u1j = a1j , j = 1, 2, 3 ⇒ u11 = 5 , u12 = 2 , u13 = 1 . Para a 1a¯ coluna de L: `i1 = ai1 u11 , i = 2, 3 ⇒ `21 = 35 , `31 = 1 5 . Para a 2a¯ linha de U : u2j = a2j − `21 u1j , j = 2, 3 ⇒ u22 = 1− 35 × 2 = − 1 5 , u23 = 4− 35 × 1 = 17 5 . CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 117 Para a 2a¯ coluna de L: `i2 = ai2 − `i1 u12 u22 , i = 3 ⇒ `32 = 1− 15 × 2 −15 = −3 . E finalmente para 3a¯ linha de U , obtemos: u33 = a33 − `31 u13 − `32 u23 ⇒ u33 = 3− 15 × 1− (−3)× 17 5 = 13 . Enta˜o: L = 1 ©3/5 1 1/5 −3 1 ; U = 5 2 1−1/5 17/5 © 13 . c) det(A) = u11 u22 u33 ⇒ det(A) = 5× ( −15 ) × 13 ⇒ det(A) = −13. d) Para obter a soluc¸a˜o do sistema Ax = b, devemos resolver dois sistemas triangulares: Ly = b e Ux = y. d.1) Assim de Ly = b , isto e´, de: 1 ©3/5 1 1/5 −3 1 y1y2 y3 = 0−7 −5 , obtemos: y1 = 0 , 3 5 y1 + y2 = −7 ⇒ y2 = −7 , 1 5 y1 + (−3) y2 + y3 = −5 ⇒ y3 = −26 . Logo, a soluc¸a˜o do sistema Ly = b e´ y = (0, −7, −26)t. d.2) De Ux = y , isto e´, de: 5 2 1−1/5 17/5 © 13 x1x2 x3 = 0−7 −26 , segue que: 13 x3 = −26 ⇒ x3 = −2 , −15 x2 + 175 x3 = −7 ⇒ x2 = 1 , 5 x1 + 2 x2 + x3 = 0 ⇒ x1 = 0 . Logo, a soluc¸a˜o do sistema Ux = y e´ x = (0, 1, −2)t. Assim, a soluc¸a˜o de Ax = b, isto e´, de: 5 2 13 1 4 1 1 3 x1x2 x3 = 0−7 −5 e´ x = 01 −2 . CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 118 Exerc´ıcios 4.1 - Aplicando-se o me´todo da decomposic¸a˜o LU a` matriz: A = . . . . . . 3 . . . 4 −1 10 8 . . . −3 12 11 0 −2 5 10 , obteve-se as matrizes: L = . . . 0 . . . . . . 2 . . . . . . . . . 3 0 . . . 0 0 . . . 1 . . . , U = . . . −1 . . . 5 . . . 1 . . . −2 . . . 0 3 −4 0 . . . 0 10 . Preecher os espac¸os pontilhados com valores adequados. 4.2 - Considere o sistema: 5 x1 + 2 x2 + x3 = −12− x1 + 4 x2 + 2 x3 = 202 x1 − 3 x2 + 10 x3 = 3 a) Resolva-o usando decomposic¸a˜o LU . b) Calcule o determinante de A, usando a decomposic¸a˜o. 4.3 - Seja A, n× n, decompon´ıvel em LU . Sejam Ai, i = 1, 2, . . . , n, os menores principais de ordem i. Mostre que: uii = ∆i ∆i−1 , i = 1, 2, . . . , n, onde : ∆i = detAi, ∆n = detA, e ∆0 = 1. 4.4 - Considere a matriz A, n × n, com todas as sub-matrizes principais na˜o singulares. Exiba as fo´rmulas da decomposic¸a˜o LU , onde L e´ matriz triangular inferior e U e´ matriz triangular superior com 1 na diagonal. 4.5 - Resolver o sistema Ax = b, onde: A = 2 3 −11 0 2 0 3 −1 ; x = x1x2 x3 ; b = 43 2 , usando a decomposic¸a˜o LU do exerc´ıcio 4.4. 4.6 - Mostre que se A satisfaz as hipo´teses da decomposic¸a˜o LU enta˜o A se decompo˜e de maneira u´nica no produto LDU , onde L e U sa˜o matrizes triangulares inferior e superior, respectivamente, ambas com 1 na diagonal, e D e´ matriz diagonal. Ale´m disso, det(A) = d11d22 . . . dnn. 4.7 - Mostre que se A e´ uma matriz sime´trica e satisfaz as hipo´teses da decomposic¸a˜o LU enta˜o A = LDU implica U = Lt (transposta de L). 4.8 - Mostre que se A e´ uma matriz sime´trica, positiva definida e satisfaz as hipo´teses da decomposic¸a˜o LU enta˜o A = LDLt onde os elementos diagonais de D sa˜o todos positivos. CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 119 4.3 Me´todo de Eliminac¸a˜o de Gauss Seja o sistema linear Ax = b, onde A tem todas as submatrizes principais na˜o singulares. O me´todo de Eliminac¸a˜o de Gauss, tambe´m chamado de me´todo de Gauss Simples, consiste em transformar o sistema dado num sistema triangular equivalente atrave´s de uma sequeˆncia de operac¸o˜es elementares sobre as linhas do sistema original, isto e´, o sistema equivalente e´ obtido atrave´s da aplicac¸a˜o repetida da operac¸a˜o: “substituir uma equac¸a˜o pela diferenc¸a entre essa mesma equac¸a˜o e uma outra equac¸a˜o multiplicada por uma constante diferente de zero”. E´ claro que tal operac¸a˜o na˜o altera a soluc¸a˜o do sistema, isto e´, obtem-se com ela outro sistema equivalente ao original. O objetivo e´ organizar essa sequeˆncia de operac¸o˜es de tal forma que o sistema linear resultante seja triangular superior. Descric¸a˜o do algoritmo: Considere o sistema linear dado por (4.1). Em primeiro lugar montamos a matriz aumentada: a (1) 11 a (1) 12 a (1) 13 . . . a (1) 1n | b(1)1 | a (1) 21 a (1) 22 a (1) 23 . . . a (1) 2n | b(1)2 | a (1) 31 a (1) 32 a (1) 33 . . . a (1) 3n | b(1)3 | . . . . . . | | a (1) n1 a (1) n2 a (1) n3 . . . a (1) nn | b(1)n , onde para i, j = 1, 2, . . . , n, a(1)ij = aij e b (1) i = bi. Por hipo´tese temos que a(1)11 6= 0, pois det(A1) 6= 0. Primeiro Passo: Eliminar a inco´gnita x1 da 2a¯, 3a¯, . . ., na¯ equac¸o˜es (isto e´, zerar os elementos da primeira coluna abaixo da diagonal); para isso, substitu´ımos a 2a¯, 3a¯, . . ., na¯ equac¸o˜es, respectivamente, pela diferenc¸a entre a 2a¯ equac¸a˜o e a 1a¯ equac¸a˜o multiplicada por a (1) 21 a (1) 11 , pela diferenc¸a entre a 3a¯ equac¸a˜o e a 1a¯ equac¸a˜o multiplicada por a (1) 31 a (1) 11 , - - - - - - - - - - - pela diferenc¸a entre a na¯ equac¸a˜o e a 1a¯ equac¸a˜o multiplicada por a (1) n1 a (1) 11 . CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 120 Passamos enta˜o da matriz inicial a` matriz: a (1) 11 a (1) 12 a (1) 13 . . . a (1) 1n | b(1)1 | a (2) 22 a (2) 23 . . . a (2) 2n | b(2)2 | . . . | ... | a (2) n2 a (2) n3 . . . a (2) nn | b(2)n , onde: a (2) ij = a (1) ij − a(1)1j a (1) i1 a (1) 11 , i = 2, 3, . . . , n ; j = 1, 2, . . . , n . b (2) i = b (1) i − b(1)1 a (1) i1 a (1) 11 , Observe que da fo´rmula acima deduzimos que: a (2) 22 = a (1) 22 − a(1)12 a (1) 21 a (1) 11 = a (1) 22 a (1) 11 − a(1)12 a(1)21 a (1) 11 = det(A2) a (1) 11 6= 0 , pois por hipo´tese det(A2) 6= 0 e det(A1) = a(1)11 6= 0. Segundo Passo: Eliminar a inco´gnita x2 da 3a¯, 4a¯, . . ., na¯ equac¸o˜es (isto e´, zerar os elementos da segunda coluna abaixo da diagonal); para isso, substitu´ımos a 3a¯, 4a¯, . . ., na¯ equac¸o˜es, respectivamente, pela diferenc¸a entre a 3a¯ equac¸a˜o e a 2a¯ equac¸a˜o multiplicada por a (2) 32 a (2) 22 , pela diferenc¸a entre a 4a¯ equac¸a˜o e a 2a¯ equac¸a˜o multiplicada por a (2) 42 a (2) 22 , - - - - - - - - - - - pela diferenc¸a entre a na¯ equac¸a˜o e a 2a¯ equac¸a˜o multiplicada por a (2) n2 a (2) 22 . Obtemos enta˜o a matriz: a (1) 11 a (1) 12 a (1) 13 . . . a (1) 1n | b(1)1 | a (2) 22 a (2) 23 . . . a (2) 2n | b(2)2 | a (3) 33 . . . a (3) 3n | b(3)3 | . . . | ... | a (3) n3 . . . a (3) nn | b(3)n , CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 121 onde: a (3) ij = a (2) ij − a(2)2j a (2) i2 a (2) 22 , i = 3, 4, . . . , n ; j = 2, 3, . . . , n . b (3) i = b (2) i − b(2)2 a (2) i2 a (2) 22 , E assim sucessivamente, chegaremos ao (n-1)o¯ Passo. Temos que a (n−1) n−1,n−1 6= 0, pois por hipo´tese det(An−1) 6= 0. (n-1)o¯ Passo: Devemos eliminar a inco´gnita xn−1 da na¯ equac¸a˜o (isto e´, zerar o elemento da (n−1)a¯ coluna abaixo da diagonal); para isso, substitu´ımos a na¯ equac¸a˜o pela diferenc¸a entre a na¯ equac¸a˜o e a (n-1)a¯ equac¸a˜o multiplicada por a (n−1) n,n−1 a (n−1) n−1,n−1 , e assim, obtemos a matriz: a (1) 11 a (1) 12 a (1) 13 . . . a (1) 1,n−1 a (1) 1n | b(1)1 | a (2) 22 a (2) 23 . . . a (2) 2,n−1 a (2) 2n | b(2)2 | a (3) 33 . . . a (3) 3,n−1 a (3) 3n | b(3)3 | . . . . . . . . . | ... | a (n−1) n−1,n−1 a (n−1) n−1,n | b(n−1)n−1 | a (n) nn | b(n)n , onde: a (n) ij = a (n−1) ij − a(n−1)n−1,j a (n−1) i,n−1 a (n−1) n−1,n−1 , i = n ; j = n− 1, n . b (n) i = b (n−1) i − b(n−1)n−1 a (n−1) i,n−1 a (n−1) n−1,n−1 , Assim, de um modo geral, o (k)o¯ Passo do me´todo de Eliminac¸a˜o de Gauss, e´ obtido por: a(k+1)ij = a (k) ij − a(k)k,j a (k) i,k a (k) k,k , k = 1, 2, . . . , n− 1 , i = k + 1, . . . , n , j = k, k + 1, . . . , n . b(k+1)i = b (k) i − b(k)k a (k) i,k a (k) k,k , (4.8) CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 122 Portanto, o sistema triangular obtido, a (1) 11 x1 + a (1) 12 x2 + a (1) 13 x3 + . . . + a (1) 1,n−1xn−1 + a (1) 1n xn = b (1) 1 + a(2)22 x2 + a (2) 23 x3 + . . . + a (2) 2,n−1xn−1 + a (2) 2n xn = b (2) 2 a (3) 33 x3 + . . . + a (3) 3,n−1xn−1 + a (3) 3n xn = b (3) 3 . . . . . . a (n−1) n−1,n−1xn−1 + a (n−1) n−1,nxn = b (n−1) n−1 a (n) nn xn = b (n) n e´ equivalente ao original. Observac¸o˜es: 1) No 2o passo, repetimos o processo como se na˜o existisse a 1a linha e a 1a coluna da 2a matriz, isto e´, todas as operac¸o˜es sa˜o realizadas em func¸a˜o da 2a linha da matriz obtida no 1o passo. De um modo geral, no (k)o passo, repetimos o processo como se na˜o existissem as (k− 1) primeiras linhas e as (k − 1) primeiras colunas da ka matriz, isto e´, todas as operac¸o˜es sa˜o realizadas em func¸a˜o da linha (k) da matriz obtida no passo (k − 1). 2) A operac¸a˜o: substituir uma equac¸a˜o pela diferenc¸a entre essa mesma equac¸a˜o e uma outra equac¸a˜o multiplicada por uma constante diferente de zero, e´ equivalente a realizarmos o seguinte ca´lculo (descreveremos para o (ko) passo): 2.1) Determinar as constantes a(k)ik /a (k) kk , 2.2) Um elemento a(k+1)ij sera´ enta˜o obtido fazendo-se na matriz anterior a diferenc¸a entre o ele- mento que ocupa a mesma posic¸a˜o, isto e´, (a(k)ij ) e o produto da constante (a (k) ik /a (k) kk ) pelo elemento que se encontra na mesma coluna da linha k, ou seja, pelo elemento (a(k)kj ). 3) O elemento a(k)kk e´ o pivoˆ do ko¯ passo. Exemplo 4.3 - Resolver o sistema: 6 2 −12 4 1 3 2 8 x1x2 x3 = 77 13 , usando o me´todo de Eliminac¸a˜o de Gauss. Soluc¸a˜o: Montamos incialmente a matriz, 3× 4: 6 2 −1 | 72 4 1 | 7 3 2 8 | 13 . CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 123 1o¯ Passo: Temos que: a (1) 21 a (1) 11 = 2 6 = 1 3 , e a (1) 31 a (1) 11 = 3 6 = 1 2 . Assim: a (2) 21 = a (1) 21 − a(1)11 a (1) 21 a (1) 11 ⇒ a(2)21 = 2− 6× 1 3 ⇒ a(2)21 = 0 , a (2) 22 = a (1) 22 − a(1)12 a (1) 21 a (1) 11 ⇒ a(2)22 = 4− 2× 1 3 ⇒ a(2)22 = 10 3 , a (2) 23 = a (1) 23 − a(1)13 a (1) 21 a (1) 11 ⇒ a(2)23 = 1− (−1)× 1 3 ⇒ a(2)23 = 4 3 , b (2) 2 = b (1) 2 − b(1)1 a (1) 21 a (1) 11 ⇒ b(2)2 = 7− 7× 1 3 ⇒ b(2)2 = 14 3 , a (2) 31 = a (1) 31 − a(1)11 a (1) 31 a (1) 11 ⇒ a(2)31 = 3− 6× 1 2 ⇒ a(2)31 = 0 , a (2) 32 = a (1) 32 − a(1)12 a (1) 31 a (1) 11 ⇒ a(2)32 = 2− 2× 1 2 ⇒ a(2)32 = 1 , a (2) 33 = a (1) 33 − a(1)13 a (2) 31 a (1) 11 ⇒ a(2)33 = 8− (−1)× 1 2 ⇒ a(2)33 = 17 2 , b (2) 3 = b (1) 3 − b(1)1 a (1) 31 a (1) 11 ⇒ b(2)3 = 13− 7× 1 2 ⇒ b(2)3 = 19 2 . Assim ,obtemos a matriz: 6 2 −1 | 70 10/3 4/3 | 14/3 0 1 17/2 | 19/2 . 2o¯ Passo: Temos que: a (2) 32 a (2) 22 = 1 10/3 = 3 10 . Assim: a (3) 32 = a (2) 32 − a(2)22 a (2) 32 a (2) 22 ⇒ a(3)32 = 1− 10 3 × 3 10 ⇒ a(3)32 = 0 , a (3) 33 = a (2) 33 − a(2)23 a (2) 32 a (2) 22 ⇒ a(3)33 = 17 2 − 4 3 × 3 10 ⇒ a(3)33 = 81 10 , b (3) 3 = b (1) 3 − a(2)2 a (2) 32 a (2) 22 ⇒ b(3)3 = 19 2 − 14 3 × 3 10 ⇒ b(3)3 = 81 10 . CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 124 Portanto, obtemos: 6 2 −1 | 710/3 4/3 | 14/3 © 81/10 | 81/10 , ou seja: 6 2 −10 10/3 4/3 0 0 81/10 x1x2 x3 = 714/3 81/10 . Resolvendo enta˜o o sitema linear, obtemos: 81 10 x3 = 81 10 ⇒ x3 = 1 , 10 3 x2 + 4 3 x3 = 14 3 ⇒ x2 = 1 , 6 x1 + 2 x2 − x3 = 7 ⇒ x1 = 1 . Assim, a soluc¸a˜o de: 6 2 −13 4 1 3 2 8 x1x2 x3 = 77 13 e´ x = 11 1 . Observac¸a˜o: Se em algum passo k encontrarmos a(k)kk = 0, isso significa que det(Ak) = 0. Nesse caso, o sistema ainda pode ter soluc¸a˜o determinada (basta que det(A) 6= 0). O me´todo pode ser continuado simplesmente permutando a ka¯ equac¸a˜o com qualquer outra abaixo cujo coeficiente da ka¯ inco´gnita seja 6= 0. Exemplo 4.4 - Resolver, usando o me´todo de Eliminac¸a˜o de Gauss, o sistema: 3x1 + 3x2 + x3 = 72x1 + 2x2 − x3 = 3 x1 − x2 + 5x3 = 5 Soluc¸a˜o: Aplicando o me´todo de Eliminac¸a˜o de Gauss a` matriz: 3 3 1 | 72 2 −1 | 3 1 −1 5 | 5 , obtemos: 3 3 1 | 70 0 −5/3 | −5/3 0 −2 14/3 | 8/3 . Vemos aqui que o elemento a(2)22 = 0 e como ja´ dissemos anteriormente, isso significa que det(A2) = 0. De fato: det(A2) = ∣∣∣∣ 3 32 2 ∣∣∣∣ = 0. CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 125 Como o elemento a(2)32 6= 0, permutamos a 3a¯ equac¸a˜o com a 2a¯ e assim obtemos a matriz: 3 3 1 | 7−2 14/3 | 8/3 © −5/3 | −5/3 . a qual ja´ esta´ na forma triangular. Assim a soluc¸a˜o de: 3x1 + 3x2 + x3 = 72x1 + 2x2 − x3 = 3 x1 − x2 + 5x3 = 5 e´ x = 11 1 . Observac¸o˜es: 1) O me´todo de Eliminac¸a˜o de Gauss pode ser interpretado como um me´todo para obtenc¸a˜o das matrizes L e U da decomposic¸a˜o LU . De fato, chamando de (A|b)(1) a matriz aumentada, o ca´lculo feito para obtenc¸a˜o de (A|b)(2), e´ equivalente a multiplicar (A|b)(1) por uma matriz M1, onde: M1 = 1 −m21 1 ... . . . −mn1 1 , com mi1 = a (1) i1 a (1) 11 i = 2, 3 . . . , n . Assim, (A|b)(2) = M1(A|b)(1). De maneira semelhante: (A|b)(3) = M2(A|b)(1), onde: M2 = 1 1 −m32 1 ... . . . −mn2 1 , com mi2 = a (2) i2 a (2) 22 i = 3, . . . , n , e assim sucessivamente. Logo: (A|b)(n) = Mn−1(A|b)(n−1) = . . . = Mn−1 . . .M1︸ ︷︷ ︸ M (A|b)(1) . Assim, temos: A(n) = MA(1) = MA = U ( onde U e´ matriz triangular superior da Decom- posic¸a˜o LU). Como M e´ um produto de matrizes na˜o singulares enta˜o e´ invers´ıvel; logo existe M−1 = M−11 M −1 2 . . .M −1 n−1 e portanto A = M −1U . E´ fa´cil verificar que: M−1 = 1 m21 1 m31 m32 1 ... . . . mn1 mn2 1 = L , onde L e´ a matriz triangular inferior da decomposic¸a˜o LU . CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 126 Assim o me´todo de Eliminac¸a˜o de Gauss nada mais e´ do que o me´todo da Decomposic¸a˜o LU . Observe que devemos resolver apenas o sistema Ux = b(n), desde que o vetor final b(n) e´ obtido de b atrave´s da equac¸a˜o: b = Lb(n). Assim, se Ax = b , A = LU , b = Lb(n), obtemos: LUx = Lb(n) ⇒ Ux = b(n) , pois, como ja´ dissemos, L e´ na˜o singular. Portanto, o vetor soluc¸a˜o x e´ obtido resolvendo-se apenas um sistema triangular. 2) O exemplo 4.4 apresenta um sistema de equac¸o˜es para o qual as hipo´teses do Teorema 4.1 na˜o sa˜o satisfeitas. Entretanto, resolvemos o sistema utilizando a estrate´gia de troca de linhas. Para visualizar porque isso foi poss´ıvel, observe que podemos construir uma matriz P , chamada matriz de Permutac¸a˜o, a qual sera´ formada pela permutac¸a˜o das linhas da matriz identidade, de forma que em cada linha o u´nico elemento na˜o nulo e´ igual a 1. Se durante o processo na˜o permutamos as linhas do sistema enta˜o P e´ a matriz identidade. Agora se durante o processo permutamos a linha i com a linha j enta˜o na matriz P a linha i sera´ permutada com a linha j. No exemplo 4.4, permutamos durante o processo a linha 2 com a linha 3. Assim: L = 1 0 01/3 1 0 2/3 0 1 , U = 3 3 10 −2 14/3 0 0 −5/3 . e a matriz P nesse caso sera´: P = 1 0 00 0 1 0 1 0 . Pode ser visto facilmente que com a troca de linhas a decomposic¸a˜o obtida na˜o satisfaz a igualdade A = LU , mas satisfaz PA = LU , isto e´, o produto LU reproduz a matriz A com suas linhas permutadas. Assim foi poss´ıvel resolver o sistema do exemplo 4.4 pois a troca de linhas na decomposic¸a˜o funciona como se tive´ssemos efetuado troca de linhas no sistema antes de comec¸armos a decomposic¸a˜o. A estrate´gia de troca de linhas para resolver um sistema e´ extremamente u´til para os me´todos baseados na decomposic¸a˜o LU e e´ conhecida como pivotamento. Descreveremos mais adiante o me´todo de Eliminac¸a˜o de Gauss com pivotamento parcial. Exerc´ıcios 4.9 - Considere o sistema: 2 −3 14 −6 −1 1 2 1 x1x2 x3 = −5−7 4 a) Resolva-o pelo me´todo de Eliminac¸a˜o de Gauss, b) Calcule o determinante de A, usando a matriz triangular obtida no item a). 4.10 - Verificar, usando o me´todo de Eliminac¸a˜o de Gauss, que o sistema : x1 + 2x2 + x3 = 32x1 + 3x2 + x3 = 53x1 + 5x2 + 2x3 = 1 na˜o tem soluc¸a˜o. CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 127 4.11 - Usando o me´todo de Eliminac¸a˜o de Gauss, verificar que o sistema: x1 + 4 x2 + α x3 = 62 x1 − x2 + 2 αx3 = 3 α x1 + 3 x2 + x3 = 5 a) possui uma u´nica soluc¸a˜o quando α = 0; b) infinitas soluc¸o˜es quando α = 1 e c) na˜o tem soluc¸a˜o quando α = −1. 4.4 Me´todo de Gauss-Compacto Como vimos, o me´todo de Eliminac¸a˜o da Gauss nada mais e´ do que o me´todo da Decomposic¸a˜o LU : a matriz triangular superior obtida ao final da aplicac¸a˜o desse me´todo e´ a matriz U da decomposic¸a˜o LU e a matriz L e´ a matriz formada pelos multiplicadores ( as constantes a (k) ik akkk do ko¯ passo). Descreveremos agora uma maneira pra´tica de se obter as matrizes L e U , bem como armazena´-las de uma forma compacta. Tal me´todo recebe o nome de me´todo de Gauss-Compacto. A vantagem desse me´todo e´ a de economizar espac¸o na memo´ria, pois ambas as matrizes L e U sa˜o armazenadas sobre a matriz original A. O u´nico incoveniente e´ que a matriz A e´ destru´ıda. O termo independente b, e´ trans- formado juntamente com a matriz A, como no me´todo de Gauss simples. Esse procedimento e´ bastante usual e conveniente para simplificar a programac¸a˜o desses me´todos. Ao final teremos armazenados as matrizes L, U e o termo independente modificado. A soluc¸a˜o do sistema sera´ obtida resolvendo-se apenas um sistema triangular superior. Descric¸a˜o do algoritmo: Considere o sistema linear, de ordem n, dado por (4.1). Em primeiro lugar montamos a matriz, n× n+ 1: a11 a12 a13 . . . a1n | a1,n+1 a21 a22 a23 . . . a2n | a2,n+1 a31 a32 a33 . . . a3n | a3,n+1 . . . . . . | an1 an2 an3 . . . ann | an,n+1 , onde ai,n+1 = bi, i = 1, 2, . . . , n. A seguir constru´ımos a matriz, n× n+ 1, onde os termos independentes bi = ai,n+1, i = 1, . . . , n por serem obtidos da mesma maneira que os elementos uij sera˜o chamados ui,n+1, i = 1, . . . , n. Assim, sobre a matriz original armazenamos a matriz: u11 u12 u13 . . . u1n | u1,n+1 `21 u22 u23 . . . u2n | u2,n+1 `31 `32 u33 . . . u3n | u3,n+1 . . . . . . | `n1 `n2 `n3 . . . unn | un,n+1 , a qual e´ obtida atrave´s das fo´rmulas da decomposic¸a˜o LU, (fo´rmulas (4.7)), levando em considerac¸a˜o a lei de formac¸a˜o das mesmas, na seguinte ordem: CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 128 a) 1a¯ linha : u1j = a1j , j = 1, 2, . . . , n+ 1, (isto significa que 1a¯ linha e´ igual a 1a¯ linha da matriz original) . b) 1a¯ coluna: `i1 = ai1 u11 ; i = 2, . . . , n; (isto significa que a 1a¯ coluna e´ igual ao elemento que ocupa a mesma posic¸a˜o na matriz original dividido por a11 pois u11 = a11). c) 2a¯ linha : u2j = a2j − l21u1j , j = 2, . . . , n+ 1, (isto significa que a 2a¯ linha e´ igual a diferenc¸a entre o elemento que ocupa a mesma posic¸a˜o na matriz original e o produto da 2a¯ linha pela coluna j na segunda matriz , com j = 2, . . . , n+ 1) . d) 2a¯ coluna: `i2 = ai2 − li1u12 u22 ; i = 3, . . . , n; (isto significa, que a 2a¯ coluna e´ igual a diferenc¸a entre o elemento que ocupa a mesma posic¸a˜o na matriz original e o produto da linha i pela 2a¯ coluna, tudo dividido por u22, com i = 3, . . . , n). e) Segue-se calculando: 3a¯ linha, 3a¯ coluna,. . ., lembrando que as linhas sa˜o calculadas da diagonal (inclusive) em diante, e as colunas da diagonal (ex- clusive) para baixo. Assim, o elemento uij e´ a diferenc¸a entre o elemento que ocupa a mesma posic¸a˜o na matriz original e a soma do produto ordenado da linha i pela coluna j (2a¯ matriz), ate´ a linha i−1. Para o elemento `ij o procedimento e´ ana´logo (limitado pela coluna j − 1) e dividido pelo elemento diagonal na coluna. Observac¸o˜es: 1) Produto ordenado significando: 1o¯ elemento da linha i multiplicado pelo 1o¯ elemento da coluna j, 2o¯× 2o¯,. . .. 2) Calculadas todas as linhas e colunas resolve-se o sistema Ux = b′, onde U esta´ indicada na 2a¯ matriz e b′ e´ a u´ltima coluna da 2a¯ matriz. 3) Quem na˜o consegue visualizar a maneira pra´tica para montar a 2a matriz deve recorrer a`s formulas (4.7), para resolver o sistema pelo me´todo de Gauss-Compacto. 4) Dado va´rios sistemas associados a uma mesma matriz, podemos resolveˆ-los de uma so´ vez pelo me´todo da Gauss-Compacto. Tais sistemas sa˜o chamados de sistemas matriciais. Exemplo 4.5 - Usando o Me´todo de Gauss-Compacto resolver o sistema matricial: 5 2 −13 1 4 1 1 3 x1 | y1x2 | y2 x3 | y3 = 0 | 6−7 | 7 −5 | 4 . Soluc¸a˜o: Montamos a matriz, 3× 5: 5 2 1 | 0 | 63 1 4 | −7 | 7 1 1 3 | −5 | 4 ∼ 5 2 1 | 0 | 63/5 −1/5 17/5 | −7 | 17/5 1/5 −3 13 | −26 | 13 ; CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 129 onde, obtivemos os elementos da seguinte maneira: 1a¯ linha: (igual a 1a linha da matriz original). Assim: u11 = 5, u12 = 2, u13 = 1, u14 = 0, u15 = 6 . 1a¯ coluna: ( igual ao elemento que ocupa a mesma posic¸a˜o na matriz original dividido por a11 desde que u11 = a11). Assim: `21 = 3 5 , `31 = 1 5 . 2a¯ linha: (igual a diferenc¸a entre o elemento que ocupa a mesma posic¸a˜o na matriz original e o produto da linha 2 pela coluna j , limitado pela linha 1, na 2a matriz, Assim: u22 = 1− 35 × 2 ⇒ u22 = −15 , u23 = 4− 35 × 1 ⇒ u23 = 175 , u24 = −7− 35 × 0 ⇒ u24 = −7 , u25 = 7− 35 × 6 ⇒ u25 = 175 . 2a¯ coluna: (igual a diferenc¸a entre o elemento que ocupa a mesma posic¸a˜o na matriz original e o produto da linha 3 pela coluna 2, limitado pela coluna 1, dividido pelo elemento da diagonal principal na 2a matriz). Assim: `32 = 1− 15 × 2 −15 ⇒ `32 = −3 . 3a¯ linha: (igual a diferenc¸a entre o elemento que ocupa a mesma posic¸a˜o na matriz original e o produto da linha 3 pela coluna j, limitado pela linha 2, na 2a matriz). Assim: u33 = 3− 15 × 1− (−3)× 175 ⇒ u33 = 13 , u34 = −5− 15 × 0− (−3)× (−7) ⇒ u34 = −26 , u35 = 4− 15 × 6− (−3)× 175 ⇒ u35 = 13 . Assim, resolvendo os sistemas: a) 5 2 1−1/5 17/5 © 13 x1x2 x3 = 0−7 −26 ; obtemos x = 01 −2 , e b) 5 2 1−1/5 17/5 © 13 y1y2 y3 = 617/5 13 ; obtemos y = 10 1 . Portanto a soluc¸a˜o do sistema matricial: 5 2 13 1 4 1 1 3 x1 | y1x2 | y2 x3 | y3 = 0 | 6−7 | 7 −5 | 4 e´ (x|y) = 0 | 11 | 0 −2 | 1 . CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 130 Exerc´ıcios 4.12 - Aplicando-se o me´todo de Gauss-Compacto a um sistema Ax = b, foi obtido o esquema: . . . 2 1 . . . | 5 6 1 0 3 | 10 . . . −3 −5 7 | 2 9 0 −2 −1 | 6 ∼ 3 2 1 −1 | 5 2 . . . −2 5 | 0 1 5/3 −8/3 . . . | −3 . . . 2 . . . −63/8 | . . . . a) Preencha os espac¸os pontilhados com valores adequados. b) Se x = (x1, x2, x3, x4)t , calcule x3 e x4. 4.13 - Usando o me´todo de Gauss-Compacto resolver os seguintes sistemas: (I) 10 x1 + x2 − x3 = 10x1 + 10 x2 + x3 = 122 x1 − x2 + 10 x3 = 11 (II) 4 x1 − 6 x2 − x3 = −72 x1 − 3 x2 + x3 = −5 x1 + 2 x2 + x3 = 4 4.14 - Resolver o sistema matricial: 2 −1 34 1 2 1 0 10 x1 | y1 | z1x2 | y2 | z2 x3 | y3 | z3 = −4 | 2 | 4−7 | 6 | 6 −11 | 2 | 20 , usando o me´todo de Gauss-Compacto. 4.5 Me´todo de Cholesky No caso em que a matriz do sistema linear e´ sime´trica podemos simplificar os ca´lculos da decomposic¸a˜o LU significativamente, levando em conta a simetria. Esta e´ a estrate´gia do me´todo de Cholesky, o qual se baseia no seguinte corola´rio. Corola´rio 4.1 - Se A e´ sime´trica, positiva definida, enta˜o A pode ser decomposta unicamente no produto GGt, onde G e´ matriz triangular inferior com elementos diagonais positivos. Prova: A prova e´ imediata a partir do exerc´ıcio 4.8. Observe que essa decomposic¸a˜o e´ poss´ıvel se a matriz A ale´m de sime´trica for tambe´m positiva definida (veja definic¸a˜o 4.4). Esquema Pra´tico para a Decomposic¸a˜o GGt Do mesmo modo que na da decomposic¸a˜o LU para obtermos a matriz G, aplicamos a definic¸a˜o de produto e igualdade de matrizes. Seja enta˜o: GGt = g11 © g21 g22 g31 g32 g33 . . . . . . . . . . . . gn1 gn2 gn3 . . . gnn g11 g21 g31 . . . gn1 g22 g32 . . . gn2 g33 . . . gn3 . . . ... © gnn , e CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 131 A = a11 a12 a13 . . . a1n a21 a22 a23 . . . a2n a31 a32 a33 . . . a3n . . . . . . . . . an1 an2 an3 . . . ann . Desde que existe uma lei de formac¸a˜o para os elementos diagonais e outra para os na˜o diagonais de G, veremos em separado como obter tais fo´rmulas. a) Elementos diagonais de G . Os elementos diagonais aii de A sa˜o iguais ao produto da linha i de G pela coluna i de Gt. Veja que este produto e´ equivalente a multiplicarmos a linha i de G por ela mesma. Portanto: a11 = g211 , a22 = g221 + g 2 22 , . . . ann = g2n1g 2 n2 + . . . + g 2 nn . Logo, os elementos diagonais de G sa˜o dados por: g11 = √ a11 , gii = ( aii − ∑i−1 k=1 g 2 ik )1/2 , i = 2, 3, . . . , n. (4.9) b) Elementos na˜o diagonais de G. b.1) 1a¯ coluna : Os elementos da 1a¯ coluna de G, sa˜o obtidos igualando-se os elementos da 1a¯ coluna de A com o produto de cada linha de G pela 1a¯ coluna de Gt. Observe que este produto pode ser obtido multiplicando-se cada elemento da 1a¯ coluna de G (abaixo da diagonal) pela 1a¯ linha de G . Assim: a21 = g21 g11 , a31 = g31 g11 , . . . an1 = gn1 g11 . ⇒ gi1 = ai1 g11 , i = 2, 3, . . . , n. b.2) 2a¯ coluna: Os elementos da 2a¯ coluna de G, sa˜o obtidos igualando-se os elementos da 2a¯ coluna de A (abaixo da diagonal principal) com o produto de cada linha de G pela 2a¯ coluna de Gt. Observe que este produto pode ser obtido multiplicando-se cada linha de G (abaixo da diagonal) pela 2a¯ CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 132 linha de G. Assim: a32 = g31 g21 + g32 g22 , a42 = g41 g21 + g42 g22 , . . . an2 = gn1 g21 + gn2 g22 , ⇒ gi2 = ai2 − gi1g21 g22 , i = 3, 4, . . . , n. Se continuarmos calculando 3a¯, 4a¯ colunas de G, etc . . ., teremos a fo´rmula geral: gi1 = ai1 g11 , i = 2, 3, . . . , n, gij = ( aij − ∑j−1 k=1 gik gjk ) / gjj , 2 ≤ j < i. (4.10) Utilizadas numa ordem conveniente as fo´rmulas (4.9) e (4.10) determinam os elementos da matriz G. Uma ordem conveniente pode ser: g11, g21, g31, . . . , gn1; g22, g32, . . . , gn2; . . . , gnn. Isto corresponde a calcularmos os elementos da matriz G por coluna. Observac¸o˜es: i) Se A satisfaz as condic¸o˜es do me´todo de Cholesky, a aplicac¸a˜o do me´todo requer menos ca´lculos que a decomposic¸a˜o LU . ii) O fato de A ser positiva definida garante que na decomposic¸a˜o teremos somente ra´ızes quadradas de nu´meros positivos. iii) O me´todo de Cholesky pode tambe´m ser aplicado a matrizes sime´tricas que na˜o sejam positivas definidas desde que trabalhemos com aritme´tica complexa. Entretanto, so´ usaremos o me´todo de Cholesky se pudermos trabalhar com aritme´tica real. iv) Vimos no caso da decomposic¸a˜o LU, que det(A) = u11u22 . . . unn, uma vez que os elementos diagonais de L eram unita´rios. No caso do Me´todo de Cholesky temos que: A = GGt e portanto: det(A) = (det G)2 = (g11 g22 . . . gnn) 2 Aplicac¸a˜o a` Soluc¸a˜o de Sistemas Lineares Vejamos agora como podemos aplicar a decomposic¸a˜o GGt para obtermos a soluc¸a˜o de sistemas lineares. Seja o sistema Ax = b de ordem n determinado, onde A satisfaz as condic¸o˜es do processo de Cholesky. Uma vez calculado a matriz G a soluc¸a˜o de Ax = b fica reduzida, como no me´todo da Decomposic¸a˜o LU , a` soluc¸a˜o do par de sistemas triangulares: Gy = b , Gtx = y . CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 133 Exemplo 4.6 - Seja: A = 4 2 −42 10 4 −4 4 9 . a) Verificar se A satisfaz as condic¸o˜es do me´todo de Cholesky. b) Decompor A em GGt. c) Calcular o determinante de A, usando a decomposic¸a˜o obtida . d) Resolver o sistema Ax = b, onde b = (0, 6, 5)t. Soluc¸a˜o: a) A matriz A e´ sime´trica. Devemos verificar se e´ positiva definida. Temos: det(A1) = 4 > 0 , det(A2) = 36 > 0 , det(A3) = det(A) = 36 > 0 . Logo, A satifaz as condic¸o˜es da decomposic¸a˜o GGt. b) Usando as fo´rmulas (4.9) e (4.10), obtemos: g11 = √ a11 ⇒ g11 = √ 4 ⇒ g11 = 2 , g21 = a21 g11 ⇒ g21 = 22 ⇒ g21 = 1 , g31 = a31 g11 ⇒ g31 = −42 ⇒ g31 = −2 , g22 = ( a22 − g221 )1/2 ⇒ g22 = (10− 12)1/2 ⇒ g22 = 3 , g32 = a32 − g31g21 g22 ⇒ g32 = 4− (−2)(1)3 ⇒ g32 = 2, g33 = ( a33 − g231 − g232 )1/2 ⇒ g33 = (9− (−2)2 − 22)1/2 ⇒ g33 = 1. Obtemos enta˜o: 4 2 −42 10 4 −4 4 9 = 2 ©1 3 −2 2 1 2 1 −23 2 © 1 . c) det(A) = (g11 g22 g33) 2 = (2× 3× 1)2 = 36. d) Para obter a soluc¸a˜o do sistema Ax = b, devemos resolver dois sistemas triangulares: Gy = b e Gtx = y. CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 134 d.1) Assim de Gy = b , isto e´, de: 2 ©1 3 −2 2 1 y1y2 y3 = 06 5 , obtemos: 2 y1 = 0 ⇒ y1 = 0 , y1 + 3 y2 = 6 ⇒ y2 = 2 , −2 y1 + 2 y2 + y3 = 5 ⇒ y3 = 1 . Logo a soluc¸a˜o do sistema Gy = b e´ y = (0, 2, 1)t. d.2) De Gt x = y, isto e´, de: 2 1 −23 2 © 1 x1x2 x3 = 02 1 , segue que: x3 = 1, 3 x2 + 2 x3 = 2 ⇒ x2 = 0, 2 x1 + x2 − 2 x3 = 0 ⇒ x1 = 1. Logo a soluc¸a˜o do sistema Gtx = y e´ x(1, 0, 1)t. Assim, a soluc¸a˜o de Ax = b, isto e´, de: 4 2 −42 10 4 −4 4 9 x1x2 x3 = 06 5 e´ x = 10 1 . Exerc´ıcios 4.15 - Aplicando-se o processo de Cholesky a` matriz A, obteve-se: A = . . . 2 . . . . . . . . . 8 10 −8 3 10 14 −5 . . . −8 . . . 29 = GGt , onde: G = 1 © 2 . . . . . . 2 1 0 −4 . . . 2 . Preecher os espac¸os pontilhados com valores adequados. CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 135 4.16 - Considere as matrizes: A = 1 1 01 2 1 0 −1 3 ; B = 3 1 01 3 2 0 2 1 . Escolha adequadamente e resolva um dos sistemas Ax = b, Bx = b, pelo processo de Cholesky, onde b = (2, 1, 5)t. 4.17 - Mostre que: Se o sistema de equac¸o˜es alge´bricas Ax = b , onde A e´ matriz na˜o singular, e´ transformado no sistema equivalente Bx = c, com B = AtA; c = Atb, onde At e´ a transposta de A, enta˜o o u´ltimo sistema pode sempre ser resolvido pelo processo de Cholesky (isto e´, a matriz B satisfaz as condic¸o˜es para a aplicac¸a˜o do me´todo). Aplicar a te´cnica acima para determinar pelo processo de Cholesky, a soluc¸a˜o do sistema: 1 0 11 1 0 1 1 0 x1x2 x3 = 22 2 . 4.6 Me´todo de Eliminac¸a˜o de Gauss com Pivotamento Parcial Ale´m dos problemas ja´ citados nesse cap´ıtulo para os me´todos baseados na decomposic¸a˜o LU , existe um outro problema mais se´rio que esta´ relacionado com a propagac¸a˜o dos erros de truncamento do computador. Assim, para ilustrar tal situac¸a˜o, consideremos um exemplo hipote´tico, (sistema linear de ordem 2, com uma ma´quina que trabalha apenas com 3 d´ıgitos significativos). Tal exemplo servira´ para ilustrar o que acontece com um sistema de grande porte num computador qualquer, visto que os mesmos operam com um nu´mero fixo e finito de algarismos significativos. Exemplo 4.7 - Atrave´s do me´todo de Eliminac¸a˜o de Gauss, resolver o sistema linear:{ 0.0001 x1 + 1.00 x2 = 1.00 1.00 x1 + 1.00 x2 = 2.00 usando em todas as operac¸o˜es treˆs d´ıgitos significativos. Soluc¸a˜o: E´ fa´cil verificar que a soluc¸a˜o desse sistema e´: x = ( 1.00010 0.99990 ) . Agora, resolvendo o sistema dado, pelo me´todo de Eliminac¸a˜o de Gauss, com 3 d´ıgitos significativos em todas as operac¸o˜es, obtemos:( 0.000100 1.00 | 1.00 1.00 1.00 | 2.00 ) ' ( 0.000100 1.00 | 1.00 −10000 | −10000 ) , cuja soluc¸a˜o e´: x = ( 0 1 ) . Portanto, obtemos uma soluc¸a˜o muito diferente da soluc¸a˜o exata do sistema. A propagac¸a˜o de erros ocorre principalmente quando multiplicamos um nu´mero muito grande por outro que ja´ conte´m erro de arredondamento. Por exemplo, suponha que um dado nu´mero z tenha um CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 136 erro de arredondamento ε; este nu´mero pode enta˜o ser escrito na forma: z˜ = z+ε. Se agora multiplicamos esse nu´mero por p, enta˜o obtemos pz˜ = pz + pε e assim o erro no resultado sera´ pε. Assim, se p for um nu´mero grande esse erro podera´ ser muito maior que o original. Dizemos nesse caso que o erro em z foi amplificado. No me´todo de Eliminac¸a˜o de Gauss va´rios produtos com os multiplicadores sa˜o efetuados. Ana´lises de propagac¸a˜o de erros de arredondamento para o algoritmo de Gauss indicam a convenieˆncia de serem todos os multiplicadores (as constantes a(k)ik /a (k) kk do ko¯ passo) menores que 1 em mo´dulo; ou seja o pivoˆ deve ser o elemento de maior valor absoluto da coluna, da diagonal (inclusive) para baixo. Podemos enta˜o em cada passo, escolher na coluna correspondente o elemento de maior valor absoluto, da diagonal (inclusive) para baixo, e fazer uma permutac¸a˜o nas equac¸o˜es do sistema, de modo que esse elemento venha a ocupar a posic¸a˜o de pivoˆ. A este procedimento chamamos Me´todo de Eliminac¸a˜o de Gauss com Pivotamento Parcial. Exemplo 4.8 - Resolver o sistema do exemplo anterior pelo me´todo de Eliminac¸a˜o de Gauss com pivo- tamento parcial. Soluc¸a˜o: Devemos colocar na posic¸a˜o do pivoˆ o elemento de maior valor absoluto da primeira coluna. Fazendo isso e aplicando o me´todo de Eliminac¸a˜o de Gauss, obtemos:( 1.00 1.00 | 2.00 0.000100 1.00 | 1.00 ) ' ( 1.00 1.00 | 2.00 1.00 | 1.00 ) , cuja soluc¸a˜o e´: x = ( 1.00 1.00 ) . e portanto bem mais pro´xima da soluc¸a˜o exata. A matriz de Hilbert e´ famosa por produzir um exemplo de sistema linear que se na˜o utilizarmos pivotamento a soluc¸a˜o obtida pode estar completamente errada. Os elementos de tal matriz sa˜o dados por: hij = 1 i+ j − 1 , i = 1, 2, . . . , n ; j = 1, 2, . . . , n . (4.11) Assim a matriz de Hilbert de ordem 4 e´ dada por: 1 1/2 1/3 1/4 1/2 1/3 1/4 1/5 1/3 1/4 1/5 1/6 1/4 1/5 1/6 1/7 . Exerc´ıcio 4.18 - Considere um sistema linear de ordem 12 que tem a matriz de Hilbert como matriz dos coefici- entes e que a soluc¸a˜o exata seja o vetor que possui todas as componentes iguais a 1. Resolva o sistema usando: a) o me´todo de Eliminac¸a˜o de Gauss. b) o me´todo de Eliminac¸a˜o de Gauss com pivotamento parcial. CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 137 Quem resolveu o exerc´ıcio 4.18 (e quem na˜o resolveu deve fazeˆ-lo), pode observar que a soluc¸a˜o obtida em b) e´ melhor que em a). No entanto, se no exerc´ıcio 4.18 considerarmos um sistema de ordem 17, veremos que mesmo o me´todo com pivotamento na˜o produz uma soluc¸a˜o satisfato´ria. O problema e´ que a matriz de Hilbert e´ uma matriz muito mal condicionada. O problema de condicionamento de matrizes sera´ visto mais adiante. 4.7 Refinamento da Soluc¸a˜o Como ja´ dissemos anteriormente, os me´todos exatos deveriam fornecer, com um nu´mero finito de operac¸o˜es, a soluc¸a˜o exata do sistema linear. Entretanto, devido aos erros de arredondamento obtemos, em geral, soluc¸o˜es aproximadas. Veremos aqui como refinar uma soluc¸a˜o obtida por processo nume´rico. Consideremos o seguinte sistema linear de ordem n: n∑ j=1 aij xj = bi ; i = 1, 2, . . . , n. (4.12) Sejam x1, x2, . . . , xn, a soluc¸a˜o exata de (4.12) e sejam x¯1, x¯2, . . . , x¯n, uma aproximac¸a˜o da soluc¸a˜o, por exemplo, obtida pelo me´todo de Eliminac¸a˜o de Gauss. Observe que estamos considerando este me´todo para poder descrever o processo de refinamento, mas o mesmo e´ va´lido para os demais me´todos apresentados neste cap´ıtulo. Enta˜o, devemos ter: xj = x¯j + yj ; j = 1, 2, . . . , n, (4.13) onde yj , j = 1, 2, . . . , n, sa˜o as correc¸o˜es que devem ser adicionadas aos valores x¯j (obtidos pelo me´todo de Eliminac¸a˜o de Gauss), para fornecerem os valores corretos xj . Substituindo (4.13) em (4.12) obtemos: n∑ j=1 aij (x¯j + yj) = bi ; i = 1, 2, . . . , n, ⇒ n∑ j=1 aij yj = bi − n∑ j=1 aij x¯j ; i = 1, 2, . . . , n. Seja ri = bi − n∑ j=1 aij x¯j ; i = 1, 2, . . . , n, (4.14) os res´ıduos. Obtemos enta˜o que: n∑ j=1 aij yj = ri; i = 1, 2, . . . , n. (4.15) Observac¸o˜es: i) De (4.15), notamos que as correc¸o˜es sa˜o obtidas resolvendo-se um sistema linear ana´logo ao (4.12), com mesma matriz dos coeficientes e com o termo independente bi, i = 1, 2, . . . , n, substitu´ıdo pelos res´ıduos ri, i = 1, 2, . . . , n. Assim na soluc¸a˜o de (4.15), devemos refazer apenas os ca´lculos referentes ao novo termo independente. Portanto devemos, ao resolver (4.12), armazenar os multiplicadores (ou seja as constantes a(k)ik /a (k) kk ), nas posic¸o˜es supostamente zeradas. CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 138 ii) A soluc¸a˜o de (4.15) pode tambe´m estar afetada de erro, visto que as correc¸o˜es nada mais sa˜o do que a soluc¸a˜o de sistema linear. Assim, encontrado yj , substituimos seus valores em (4.13) e encontramos uma melhor soluc¸a˜o aproximada ¯¯x a` qual poderemos novamente aplicar o processo de refinamento. Obtemos com isso um processo iterativo, o qual deve ser aplicado ate´ que uma precisa˜o �, pre´-fixada, seja atingida. iii) Para sabermos se a precisa˜o foi atingida devemos calcular o vetor res´ıduo. Se o mesmo for o vetor nulo enta˜o teremos encontrado a soluc¸a˜o exata. Se o vetor res´ıduo for diferente do vetor nulo enta˜o paramos o processo quando: ‖ r(k+1) − r(k) ‖∞ ‖ r(k+1) ‖∞ < � (4.16) onde ‖ . ‖∞ esta´ definida no Cap´ıtulo 1. iv) No ca´lculo dos res´ıduos, ou seja, no ca´lculo de (4.14) havera´ perda de algarismos significativos, por serem os valores de bi e ∑n j=1 aij x¯j aproximadamente iguais. Assim devemos calcular os res´ıduos com precisa˜o maior do que a utilizada nos demais ca´lculos. Logo, se estivermos trabalhando em ponto flutuante devemos calcular os res´ıduos em precisa˜o dupla. v) O processo de refinamento e´ utilizado, em geral, em sistemas de grande porte, onde o acu´mulo de erros de arredondamento e´ maior. O exemplo a seguir, mostra o processo de refinamento num caso hipote´tico, (sistema linear de ordem 2, com uma ma´quina que trabalha apenas com dois d´ıgitos significativos). Novamente tal exemplo servira´ para ilustrar o que acontece com um sistema de grande porte num computador qualquer. Exemplo 4.9 - Considere o sistema linear:( 16. 5.0 3.0 2.5 ) ( x1 x2 ) = ( 21. 5.5 ) Trabalhando com arredondamento para dois d´ıgitos significativos em todas as operac¸o˜es; a) resolva o sistema pelo me´todo de Eliminac¸a˜o de Gauss, b) fac¸a uma iterac¸a˜o para refinar a soluc¸a˜o obtida em a). Soluc¸a˜o: Aplicando o me´todo de Eliminac¸a˜o de Gauss ao sistema dado, obtemos:( 16. 5.0 | 21. 3.0 2.5 | 5.5 ) ∼ ( 16. 5.0 | 21. 0.19 | 1.6 | 1.5 ) , Observe que na˜o calculamos o elemento a(2)21 , mas armazenamos nesta posic¸a˜o o multiplicador a (1) 21 a (1) 11 = 3.0 16. = 0.1875 = 0.19, o qual devera´ ser usado no ca´lculo do novo termo independente. Assim, resolvendo o sistema: ( 16. 5.0 0 1.6 ) ( x1 x2 ) = ( 21. 1.5 ) , obtemos: x2 = 1.5 1.6 = 0.9375 = 0.94 x1 = 21.− 5.0× 0.94 16. = 21.− 4.7 16. = 16.3 16. = 16. 16. = 1.0 CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 139 Portanto, a soluc¸a˜o aproximada e´: x¯ = (1.0, 0.94)t. Agora, desde que r = b−Ax¯, obtemos: r = ( 21. 5.5 ) − ( 16. 5.0 3.0 1.6 ) ( 1.0 0.94 ) . Fazendo os ca´lculos, (lembrando que devemos utilizar precisa˜o dupla), obtemos: r = ( 21.00− 16.00− 4.700 5.500− 3.000− 2.350 ) = ( 0.3000 0.1500 ) . Assim, consideramos : r = ( 0.30 0.15 ) Devemos apenas refazer os ca´lculos em relac¸a˜o ao novo termo independente, isto e´: r = ( 0.30 0.15 ) ∼ ( 0.30 0.15− 0.30× 0.19 ) ⇒ r = ( 0.30 0.15− 0.057 ) = ( 030 0.093 ) Assim, resolvendo o sistema: ( 16. 5.0 0 1.6 ) ( y1 y2 ) = ( 0.30 0.093 ) obtemos: y = (0.00063, 0.058)t. Fazendo, x = x¯+ y segue que: x = ( 1.0 0.94 ) + ( 0.00063 0.058 ) = ( 1.00063 0.998 ) = ( 1.0 1.0 ) . Calculando novamente o res´ıduo obtemos que o mesmo e´ o vetor nulo. Assim x = (1.0, 1.0)t e´ a soluc¸a˜o exata do sistema dado. Exerc´ıcio 4.19 -Considere o sistema linear: x1 + 3x2 + 4x3 = −53x1 + 2x2 + x3 = 82x1 + 4x2 + 3x3 = 4 a) Resolva-o pelo me´todo de Eliminac¸a˜o de Gauss, trabalhando com arredondamento para dois d´ıgitos significativos em todas as operac¸o˜es. b) Refine a soluc¸a˜o obtida em a). 4.20 - Considere o sistema linear: 2x1 + 3x2 + 4x3 = −23x1 + 2x2 − x3 = 45x1 − 4x2 + 3x3 = 8 a) Resolva-o pelo me´todo de Eliminac¸a˜o de Gauss com pivotamento parcial, trabalhando com arredondamento para dois d´ıgitos significativos em todas as operac¸o˜es. b) Refine a soluc¸a˜o obtida em a). CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 140 4.8 Mal Condicionamento Como vimos, para resolver sistemas lineares dois aspectos devem ser considerados: a) se a soluc¸a˜o existe ou na˜o. b) achar um modo eficiente para resolver as equac¸o˜es. Mas existe ainda um aspecto a ser considerado: c) se a soluc¸a˜o das equac¸o˜es e´ muito sens´ıvel a pequenas mudanc¸as nos coeficientes. Este fenoˆmeno e´ chamado Mal Condicionamento, e esta´ relacionado ao fato de que a matriz dos coeficientes nas equac¸o˜es lineares esta´ pro´xima de ser singular. Na sec¸a˜o anterior dissemos que se o vetor res´ıduo for pro´ximo do vetor nulo enta˜o a soluc¸a˜o obtida esta´ razoavelmente precisa, e isto e´ verdade para sistemas bem condicionados. Entretanto em alguns casos, como mostrado no exemplo a seguir, isto esta´ longe de ser verdadeiro. Exemplo 4.10 - Considere o sistema linear:( 1.2969 0.8648 0.2161 0.1441 ) ( x1 x2 ) = ( 0.8642 0.1440 ) , e suponha dada a soluc¸a˜o aproximada: x¯ = ( 0.9911 −0.4870 ) . Calcule o vetor res´ıduo. Soluc¸a˜o: Calculando o vetor res´ıduo correspondente a x¯, atrave´s de (4.14), obtemos: r = ( 10−8 −10−8 ) e portanto parece razoa´vel supor que o erro em x¯ e´ muito pequeno. Entretanto, pode ser verificado por substituic¸a˜o que a soluc¸a˜o exata e´ x = (2, 2)t. No caso deste exemplo e´ fa´cil reconhecer o extremo mal condicionamento do sistema. De fato, o elemento a (2) 22 = 0.1441− 0.8648× 0.2161 1.2969 = 0.1441− 0.1440999923 ' 10−8 . Assim uma pequena mudanc¸a no elemento 0.1441 resultara´ numa grande mudanc¸a em a(2)22 e portanto em x2, ou seja, mudando 0.1441 para 0.1442 teremos a (2) 22 = 0.0001000077 com soluc¸a˜o x¯ = ( −0.00015399 0.66646092 ) . Portanto, a menos que os coeficientes em A e b sejam dados com uma precisa˜o melhor do que 10−8 e´ perigoso falar sobre uma soluc¸a˜o do sistema dado. Observe que com este exemplo, na˜o queremos dizer que todas as soluc¸o˜es aproximadas de equac¸o˜es mal condicionadas fornecem res´ıduos pequenos, mas apenas que algumas soluc¸o˜es aproximadas de equac¸o˜es mal condicionadas fornecem res´ıduos bem pequenos. Para a ana´lise da pertubac¸a˜o, e´ conveniente sermos capazes de associar a qualquer vetor ou matriz um escalar na˜o negativo que em algum sentido mede suas grandezas. Tais medidas que satisfazem alguns axiomas sa˜o chamadas normas. ( Revise normas de vetores e normas de matrizes, Cap´ıtulo 1). CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 141 Ana´lise da Pertubac¸a˜o Vamos investigar, agora, a condic¸a˜o de um sistema linear na˜o singular Ax = b. Desde que A e´ na˜o singular, a soluc¸a˜o do sistema e´ dada por: x = A−1b.Vamos supor aqui que os dados esta˜o sujeitos a certas pertubac¸o˜es e vamos analisar o efeito dessas pertubac¸o˜es na soluc¸a˜o. Seja x a soluc¸a˜o exata do sistema Ax = b. 1o caso: Consideremos uma pertubac¸a˜o do vetor b da forma b+ δb, e seja A conhecida exatamente. Portanto a soluc¸a˜o x tambe´m sera´ pertubada, isto e´, teremos x+ δx, e assim de: A(x+ δx) = b+ δb . (4.17) obtemos: (x+ δx) = A−1(b+ δb) . (4.18) A questa˜o que queremos resolver e´ como relacionar δx com δb, ou seja, sabendo o tamanho da pertubac¸a˜o em δb como estimar a pertubac¸a˜o em δx? O procedimento a seguir responde essa pergunta. De (4.17), obtemos: Ax+Aδx = b+ δb ⇒ Aδx = δb , desde que Ax = b. Agora desde que A e´ na˜o singular, segue que: δx = A−1δb . Aplicando norma, em ambos os membros, e usando normas consistentes, obtemos: ‖ δx ‖ ≤ ‖ A−1 ‖‖ δb ‖ . (4.19) Do mesmo modo, de Ax = b, obtemos: ‖ b ‖ ≤ ‖ A ‖‖ x ‖ . (4.20) Multiplicando, membro a membro, (4.19) por (4.20), obtemos: ‖ δx ‖ ‖ b ‖ ≤ ‖ A ‖‖ A−1 ‖‖ δb ‖‖ x ‖ , (4.21) ou ‖ δx ‖ ‖ x ‖ ≤ ‖ A ‖‖ A −1 ‖ ‖ δb ‖‖ b ‖ . Assim a pertubac¸a˜o relativa em x esta´ relacionada com a pertubac¸a˜o relativa em b pela constante multiplicativa ‖ A ‖‖ A−1 ‖. Definindo, o nu´mero de condic¸a˜o de A, como: cond(A) = ‖ A ‖‖ A−1 ‖ , obtemos: ‖ δx ‖ ‖ x ‖ ≤ cond(A) ‖ δb ‖ ‖ b ‖ . Observac¸o˜es: a) Temos que cond(A) ≥ 1. De fato: cond(A) = ‖ A ‖‖ A−1 ‖ ≥ ‖ A A−1 ‖ = ‖ I ‖ = 1 . CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 142 b) ‖ δb ‖‖ b ‖ pode ser interpretada como uma medida do erro relativo em b. O erro em ‖ δx ‖ ‖ x ‖ dependera´ do valor do nu´mero de condic¸a˜o que e´ maior ou igual a 1. c) Se cond(A) e´ grande, enta˜o pequenas pertubac¸o˜es relativas em b produzira˜o grandes pertubac¸o˜es relativas em x, e o problema de resolver Ax = b e´ mal condicionado. d) cond(A) sera´ considerado grande quando valer por volta de 104 ou mais. 2o caso: Consideremos agora uma pertubac¸a˜o da matriz A da forma A + δA e seja b conhecido exatamente. Portanto a soluc¸a˜o x tambe´m sera´ tambe´m pertubada, isto e´, teremos x+ δx, e assim de: (A+ δA)(x+ δx) = b , (4.22) obtemos: (x+ δx) = (A+ δA)−1b . (4.23) Mas, x = A−1b. Portanto: δx = −A−1b+ (A+ δA)−1b ⇒ δx = [(A+ δA)−1 −A−1]b . Seja B = A+ δA. Temos que: B−1 −A−1 = A−1AB−1 −A−1BB−1 = A−1(A−B)B−1 . Logo: δx = [A−1(A−B)B−1]b = [A−1(A− (A+ δA))(A+ δA)−1]b ⇒ δx = −A−1δA(A+ δA)−1b . De ( 4.23), segue que: δx = −A−1δA(x+ δx) . Aplicando norma, em ambos os membros, e usando normas consistentes, obtemos: ‖ δx ‖ ≤ ‖ A−1 ‖‖ δA ‖‖ x+ δx ‖ ⇒ ‖ δx ‖‖ x+ δx ‖ ≤ ‖ A −1 ‖‖ A ‖ ‖ δA ‖‖ A ‖ ⇒ ‖ δx ‖‖ x+ δx ‖ ≤ cond(A) ‖ δA ‖ ‖ A ‖ . Novamente, se cond(A) e´ grande, enta˜o pequenas pertubac¸o˜es em A, produzira˜o grandes pertubac¸o˜es relativas em x e o problema de resolver Ax = b e´ mal condicionado. Exemplo 4.11 - Analisar o sistema linear:( 1.2969 0.8648 0.2161 0.1441 ) ( x1 x2 ) = ( 0.8642 0.1440 ) . CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 143 Soluc¸a˜o: Temos que : A−1 = 108 ( 0.1441 −0.8648 −0.2161 1.2969 ) . (O ca´lculo da matriz inversa se encontra na pro´xima sec¸a˜o). Usando norma linha, obtemos: ‖ A ‖∞ = 2.1617 , ‖ A−1 ‖∞ = 1.5130× 108 , e portanto cond(A) = ‖ A ‖∞‖ A−1 ‖∞ = 327065210 ' 3.3× 108 , mostrando que o sistema e´ extremamente mal condicionado. Se for de interesse estudar me´todos que sejam particularmente u´teis no caso da matriz A ser mal con- dicionada, citamos aqui o me´todo de Kaczmarz, que pode ser encontrado por exemplo em [ Carnahan, 1969]. Exerc´ıcios 4.21 - Prove que se uma norma de matrizes e´ subordinada a uma norma do IRn elas sa˜o consistentes. 4.22 - Sejam A e B matrizes de ordem n. Prove que: ‖ B−1 −A−1 ‖ ‖ B−1 ‖ ≤ cond(A) ‖ A−B ‖ ‖ B ‖ . 4.23 - Analisar o sistema linear Ax = b, onde: A = ( 100 99 99 98 ) . 4.24 - Analisar o sistema linear Ax = b, de ordem 17, onde os elementos de A sa˜o dados por (4.11), isto e´, A e´ a matriz de Hilbert. 4.9 Ca´lculo da Matriz Inversa Sejam A uma matriz na˜o singular ( det(A) 6= 0), A−1 = [b1 ... b2 ... . . . ... bn] a matriz inversa de A, onde bj e´ a coluna j da matriz A−1 e ej a coluna j da matriz identidade. De AA−1 = I ; isto e´, de : A [ b1 ... b2 ... . . . ... bn ] = [ e1 ... e2 ... . . . ... en ] , resulta: Abj = ej ; j = 1, 2, . . . , n. Assim podemos calcular as colunas j, j = 1, 2, . . . , n, da matriz A−1, resolvendo os sistemas lineares acima. Portanto, podemos inverter uma matriz utilizando qualquer um dos me´todos dados nesse Cap´ıtulo. Observac¸o˜es: CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 144 1) Usando decomposic¸a˜o LU obtemos as colunas de A−1, fazendo: LUbi = ei , i = 1, 2, . . . , n , isto e´, resolvendo os sistemas: L yi = ei i = 1, 2, . . . , n . U bi = yi 2) Usando o me´todo de Cholesky (somente para matrizes sime´tricas e positivas definidas), obtemos as colunas de A−1, fazendo: GGtbi = ei , i = 1, 2, . . . , n , isto e´, resolvendo os sistemas: G yi = ei i = 1, 2, . . . , n . Gt bi = yi 3) Usando o me´todo de Eliminac¸a˜o de Gauss, obtemos as colunas de A−1, resolvendo os sistemas: Abi = ei , i = 1, 2, . . . , n. Observe que podemos colocar todas as colunas da identidade ao lado da matriz A e fazer a decom- posic¸a˜o de uma so´ vez. 4) Podemos calcular a inversa de uma matriz, pelo me´todo de Gauss-Compacto usando o mesmo esquema da resoluc¸a˜o de sistemas matriciais, isto e´, fazendo: a11 a12 . . . a1n a21 a22 . . . a2n . . . an1 an2 . . . ann x11 x12 . . . x1n x21 x22 . . . x2n . . . xn1 xn2 . . . xnn = 1 0 . . . 0 0 1 . . . 0 . . . 0 0 . . . 1 . Portanto, as colunas da matriz X sa˜o as colunas da matriz inversa de A, desde que AA−1 = I. Exemplo 4.12 - Considere a matriz: A = 3 0 32 −2 1 1 2 0 . Calcule A−1 utilizando o Me´todo de Gauss-Compacto. Soluc¸a˜o: Devemos resolver o sistema matricial: 3 0 32 −2 1 1 2 0 x11 x12 x13x21 x22 x23 x31 x32 x33 = 1 0 00 1 0 0 0 1 . Temos: 3 0 3 | 1 0 02 −2 1 | 0 1 0 1 2 0 | 0 0 1 ∼ 3 0 3 | 1 0 02/3 −2 −1 | −2/3 1 0 1/3 −1 −2 | −1 1 1 . CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 145 Resolvendo o sistema: 3 0 3−2 −1 © −2 x11x21 x31 = 1−2/3 −1 , obtemos: x11 = −16 , x21 = 112 , x31 = 12 , (que e´ a 1a¯ coluna de A−1). Do mesmo modo: 3 0 3−2 −1 © −2 x12x22 x32 = 01 1 , fornece x12 = 12 , x22 = −14 , x32 = −12 , (que e´ a 2a¯ coluna de A−1), e de: 3 0 3−2 −1 © −2 x13x23 x33 = 00 1 , segue que: x13 = 12 , x23 = 1 4 , x33 = −12 , (que e´ a 3a¯ coluna de A−1). Assim: A−1 = −1/6 1/2 1/21/12 −1/4 1/4 1/2 −1/2 −1/2 . Exerc´ıcios 4.25 - Usando decomposic¸a˜o LU , inverter a matriz: A = 2 1 01 1 1 1 0 1 . 4.26 - Dada a matriz: A = 2 1 −11 10 2 −1 2 4 , calcular A−1, utilizando o processo de Cholesky. 4.27 - Seja A = 2 4 61 −3 −1 2 1 1 . Usando o me´todo de Eliminac¸a˜o de Gauss, calcule A−1. 4.28 - Usando o me´todo de Gauss-Compacto, calcule A−1, onde: A = 2 1 −11 0 2 4 −1 3 . CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 146 4.10 Exerc´ıcios Complementares 4.29 - Quais das matrizes: A = 2 2 13 3 2 3 2 1 ; B = 3 2 12 2 1 3 3 2 ; C = 2 1 34 3 8 6 7 17 , podem ser decompostas na forma LU ? Decompor as que forem poss´ıveis. 4.30 - Mostre que se A e´ uma matriz real, sime´trica, positiva definida, enta˜o necessariamente temos: a) aii > 0, i = 1, 2, . . . , n . b) a2ik < aii akk, para todo i 6= k . c) o maior elemento de A em mo´dulo esta´ sob a diagonal. 4.31 - Considere o sistema Ax = b; onde A = 1 α 3α 1 4 5 2 1 ; x = x1x2 x3 ; b = −2−3 4 . Para que valores de α: i) A matriz A e´ decompon´ıvel no produto LU ? Justifique. ii) O sistema pode ser resolvido por Cholesky . Justifique. iii) Considere α = 1, e resolva o sistema pelo me´todo de Eliminac¸a˜o de Gauss . 4.32 - Resolva o sistema abaixo pelo me´todo de Cholesky, completando adequadamente os espac¸os pontilhados. 2 x1 + . . . x2 − x3 = 3x1 + 10 x2 + . . . x3 = 6 . . . x1 + 2 x2 + 4 x3 = −6 4.33 - Para que valores de α e β a matriz: 4 α 1β 4 1 1 1 1 , se decompo˜e no produto GGt. 4.34 - Considere os sistemas: (I) x1 + 2 x2 − x3 = 42 x1 + 13 x2 + x3 = 35− x1 + x2 + 4 x3 = 5 (II) x1 + 2 x2 + x3 = 62 x1 + 4 x2 + x3 = 142 x1 + 2 x2 + x3 = 6 Fac¸a uma escolha adequada para resolver um deles pelo me´todo de Gauss-Compacto e o outro pelo me´todo de Cholesky. Justifique sua resposta. CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 147 4.35 - Resolva o seguinte sistema, por Eliminac¸a˜o de Gauss, usando aritme´tica complexa.{ (2 + 3i) x + (2− i) y = 2 + i (4 + 6i) x + (3− 6i) y = −2− 5i 4.36 - No exerc´ıcio anterior escreva x = xr + ixi; y = yr + iyi. Multiplique as partes real e imagina´ria de cada equac¸a˜o separadamente. Mostre que o resultado e´ um sistema de 4 equac¸o˜es a 4 inco´gnitas, cuja soluc¸a˜o sa˜o as partes real e imagina´ria do exerc´ıcio anterior. 4.37 - Se a decomposic¸a˜o LU de uma matriz sime´trica A e´ dada por: L = 1 2 1 © 3 2 1 4 3 2 1 , U = 1 2 3 4 4 8 12 © 9 18 16 , verifique que a matriz G da decomposic¸a˜o Cholesky e´ dada por: G = 1 2 2 © 3 4 3 4 6 6 4 . 4.38 - Resolver o sistema matricial: 1 0 11 1 0 1 1 0 x1 | y1x2 | y2 x3 | y3 = 4 | 22 | −2 9 | 7 . pelo me´todo de Gauss-Compacto. 4.39 - Calcular u2, u3, u4, u5 resolvendo a equac¸a˜o de diferenc¸as: un+2 + 4un+1 + un = n , (∗) com as condic¸o˜es de contorno u1 = 0 e u6 = 1, usando um me´todo a sua escolha.(Escreva (∗) para n = 1, 2, 3, 4). 4.40 - Aplicando-se o me´todo de Cholesky a uma matriz foi obtido: A = 1 2 −1. . . 13 . . . . . . 1 4 = GGt onde G = . . . 0 . . .2 . . . . . . −1 . . . √2 . a) Preencha os espac¸os pontilhados com valores adequados. b) Usando a decomposic¸a˜o GGt, calcule a inversa de A. 4.41 - Seja o sistema Ax = b, dado por: 10 7 87 5 6 8 6 10 x1x2 x3 = −3−1 7 . a) Determine a inversa da matriz dos coeficientes pelo me´todo de Eliminac¸a˜o de Gauss. CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 148 b) Resolva o sistema dado, utilizando a matriz inversa obtida em a). c) Determine a soluc¸a˜o do sistema usando o me´todo de Gauss-Compacto. 4.42 Relacione os sistemas lineares: (I) 3 x2 + 2 x3 = 5x1 + 4 x2 + x3 = 62 x2 + 5 x3 = 7 (II) −2 x1 + 2 x2 = −1x1 + 3 x2 − x3 = 3− x2 + 2 x3 = 1 (III) x1 + 2 x2 + x3 = 42 x1 + 6 x2 = 8 x1 + 4 x3 = 5 com os me´todos: A) Eliminac¸a˜o de Gauss, B) Cholesky, C) Gauss-Compacto, para a sua resoluc¸a˜o. 4.43 - Considere o seguinte conjunto esparso de equac¸o˜es: 2 −1 −1 2 −1 © −1 2 −1 −1 2 −1 © −1 2 −1 −1 2 x1 x2 x3 x4 x5 x6 = 2 −1 7 5 4 3 Mostre que usando o me´todo de Eliminac¸a˜o de Gauss o sistema triangular resultante permanece esparso. Um sistema como este e´ chamado TRIDIAGONAL. Tais sistemas aparecem frequentemente na soluc¸a˜o de equac¸o˜es diferenciais parciais. 4.44 - Considere o sistema: 2 5 35 2 1 1 3 6 x1x2 x3 = 87 13 . Trabalhando com arredondamento para dois d´ıgitos significativos em todas as operac¸o˜es: a) Resolva o sistema acima pelo me´todo de Eliminac¸a˜o de Gauss com pivotamento parcial. b) Fac¸a uma iterac¸a˜o para refinar a soluc¸a˜o obtida em a) e enta˜o calcule o vetor res´ıduo. O que voceˆ pode concluir? CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 149 4.45 - Dado o sistema Ax = b, considere uma pertubac¸a˜o da matriz A da forma A + δA e seja b conhecido exatamente. Prove que: se ‖ A−1 ‖≤ 1 1− δ ‖ B −1 ‖ , com B = A+ δA, enta˜o: ‖ δx ‖≤ δ 1− δ ‖ x+ δx ‖ , δ =‖ δA ‖‖ B −1 ‖< 1 . 4.46 - Considere um sistema linear cuja matriz dos coeficientes e´ dada por: A = � −1 1−1 1 1 1 1 1 , onde � << 1. a) Calcule o nu´mero de condic¸a˜o de A. b) Com base no resultado do item a) a aplicac¸a˜o do me´todo de Eliminac¸a˜o de Gauss daria bom resultado ou seria necessa´rio usar Eliminac¸a˜o de Gauss com pivotamento parcial? c) Considere � = 10−4, e resolva o sistema linear Ax = b, onde b = (2, 0, 1)t, pelo me´todo escolhido no item b). 4.47 - No Cap´ıtulo 3, vimos que o processo iterativo: xk+1 = xk (2− a xk) , a 6= 0 , pode ser usado para obter 1a . A fo´rmula acima vale tambe´m para refinar a inversa A−1 de uma matriz A na˜o singular, isto e´: dada uma aproximac¸a˜o inicial X0 de A−1, podemos refinar esta aproximac¸a˜o usando: Xk+1 = Xk (2 I −A xk) , k = 0, 1, . . . (∗∗) Considere a matriz: ( 3.00 1.00 2.00 2.00 ) . Trabalhando com arredondamento para treˆs d´ıgitos significativos em todas as operac¸o˜es; a) obtenha uma aproximac¸a˜o para A−1, usando o me´todo de Eliminac¸a˜o de Gauss, b) refine a inversa obtida em a) usando (**), ate´ obter o res´ıduo Rk = I − A Xk com norma < 0.1, c) usando a inversa obtida em b) calcule a soluc¸a˜o aproximada do sistema Ax = b, onde b = (−14.0, 12.0)t. 4.48 - Seja A uma matriz na˜o singular de ordem n, e sejam u e v vetores n-dimensionais. a) Mostre que, se (A− uvt)−1 existe, enta˜o: (A− uvt)−1 = A−1 + αA−1uvtA−1 comα = 1 1− vtA−1u . CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 150 b) Deˆ condic¸o˜es para a existeˆncia da inversa (A− uvt)−1 . c) Se A−1 e´ conhecida, e B e´ uma matriz que coincide com A, exceto em uma linha, podemos escolher u e v para obter B−1 (se existir), aplicando a fo´rmula dada no item a). Sabendo que: A = 12 −4 7−4 1 −2 7 −2 4 , A−1 = 0 −2 −1−2 1 4 −1 4 4 , e que B coincide com A exceto que em vez de 12 temos 5, calcule B−1. 4.11 Problemas Aplicados e Projetos 4.1 - Considere o circuito a seguir com resisteˆncias e baterias tal como indicado; escolhemos arbitrari- amente as correntes e os valores da malha: i3 i2i1 2Ω 4Ω 2Ω 10V 6Ω 4V 2Ω 2Ω2Ω ff ffff Figura 4.4 Aplicando a Lei de Kirchoff que diz que a soma alge´brica da diferenc¸as de potencial em qualquer circuito fechado e´ zero, obtemos para as correntes i1, i2, i3, o seguinte sistema linear: 2 i1 + 4 (i1 − i2) + 2 (i1 − i3) − 10 = 02 i2 − 2 i2 + 2 (i2 − i3) + 4 (i2 − i1) = 06 i3 + 2 (i3 − i1) + 2 (i3 − i2) − 4 = 0 Deseja-se determinar o valor de i = (i1, i2, i3)t que satisfac¸a o sistema acima. a) E´ poss´ıvel resolver o sistema pelo me´todo da decomposic¸a˜o LU? Justifique. b) E´ poss´ıvel resolver o sistema pelo me´todo de Cholesky? Justifique. c) Resolva o sistema pelo me´todo de Eliminac¸a˜o de Gauss. 4.2 - Representemos por x1, x2, x3 e x4 o nu´mero de quatro produtos que podem ser produzidos no decorrer de uma semana. Para a produc¸a˜o de cada unidade precisa-se de treˆs tipos diferentes de mate´ria prima A, B e C conforme indicado na Tabela 4.1. Tabela 4.1 CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 151 mate´ria prima A B C Produto (1) 1 2 4 (2) 2 0 1 (3) 4 2 3 (4) 3 1 2 Por exemplo: para produzir uma unidade de (1) precisa-se de 1 unidade de A, 2 de B e 4 de C. Se existem dispon´ıveis 30,20 e 40 unidades respectivamente de A, B e C, quantas unidades de cada produto podemos produzir? Obs: Escreva x1, x2 e x3 em func¸a˜o de x4 e lembre-se que as soluc¸o˜es devem ser inteiras e na˜o negativas. 4.3 - Um cachorro esta´ perdido em um labirinto quadrado de corredores (Figura 4.5). Em cada in- tersec¸a˜o escolhe uma direc¸a˜o ao acaso e segue ate´ a intersec¸a˜o seguinte onde escolhe novamente ao acaso nova direc¸a˜o e assim por diante. Qual a probabilidade do cachorro, estando na intersec¸a˜o i, sair eventualmente pelo lado sul? 987 654 321 Figura 4.5 Esclarecimentos: Suponhamos que ha´ exatamente as 9 intersec¸o˜es mostradas na figura. Seja P1 a probabilidade do cachorro, que esta´ na intersec¸a˜o 1, sair pelo lado sul. Seja P2, P3, . . . , P9 definidas de modo similar. Supondo que em cada intersec¸a˜o a que chegue o cachorro, ha´ tanta possibilidade que escolha uma direc¸a˜o como outra, e que, tendo chegado a uma sa´ıda, tenha terminado sua caminhada, a teoria das probabilidades oferece as seguintes equac¸o˜es para Pi: P1 = (0 + 0 + P2 + P4)/4 P2 = (0 + P1 + P3 + P5)/4 P3 = (0 + P2 + 0 + P6)/4 P4 = (P1 + 0 + P5 + P7)/4 P5 = (P2 + P4 + P6 + P8)/4 P6 = (P3 + P5 + 0 + P9)/4 P7 = (P4 + 0 + P8 + 1)/4 P8 = (P5 + P7 + P9 + 1)/4 P9 = (P6 + P8 + 0 + 1)/4 Para saber a resposta resolva o sistema linear obtido. 4.4 - O problema de se determinar um polinoˆmio: Pn(x) = a0 + a1x+ a2x2 + · · ·+ anxn , CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 152 de grau no ma´ximo n, tal que : ∫ b a xiPn(x)dx = ki, i = 0, 1, . . . , n , onde ki sa˜o constantes, pode ser resolvido atrave´s da obtenc¸a˜o da soluc¸a˜o de um sistema linear. Determine um polinoˆmio de grau 3, que satisfac¸a a condic¸a˜o acima, considerando a = −1, b = 1 e: a) k0 = 23 , k1 = 4 3 , k2 = 6 5 , k3 = 4 5 , b) k0 = 2, k1 = 2, k2 = 23 , k3 = 58 35 , resolvendo o sistema linear resultante por me´todo nume´rico a` sua escolha. 4.5 - Cargas horizontal e vertical X e Y e um momento M sa˜o aplicados a` uma estrutura em balanc¸o de comprimento L, como mostrado na Figura 4.6. φ δy δx L Y X- M ? ? ff- -ff 6 ? Figura 4.6 Na extremidade livre, o alongamento δx, a deflexa˜o δy e o giro φ (igual ao aˆngulo com a horizontal) sa˜o relacionados com as cargas, da seguinte maneira: L E A 0 0 0 L 3 3 E I L2 2 E I 0 L 2 2 E I L E I X Y M = δx δy φ , onde: • E e´ o mo´dulo de Young • A e´ a a`rea de secc¸a˜o transversal • I e´ o momento de ine´rcia A matriz do sistema acima e´ positiva definida e e´ chamada matriz de flexibilidade da estrutura. a) Obter a inversa da matriz de flexibilidade correspondente aos seguintes dados: CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 153 • E = 200 tcm2 • A = 400 cm2 • L = 3.0 m • I = 50000 cm4 b) Usando o resultado obtido em a) calcular as cargas X e Y e o momento M correspondentes a: • δx = 0.0035 cm • δy = 3.0 cm • φ = 0.018 4.6 - Considere o circuito em escada, mostrado na Figura 4.7, composto de resistores concentrados e fontes de tensa˜o ideais, uma independente e outra controlada. -+ 2Ix 5Ix I21010I1 433 - + 100V Figura 4.7 O sistema de equac¸o˜es que se obte´m ao solucionar o circuito pelo me´todo dos lac¸os e´ o seguinte: 4 (I1 + I2 + Ix) + 10 I1 = 1004 (I1 + I2 + Ix) + 3 (I2 + Ix) + 10 Ix = 100− 2 Ix4 (I1 + I2 + Ix) + 3 (I2 + Ix) + 9 Ix = 100− 2 Ix a) Escreva o sistema acima na forma Ax = b. b) Determine A−1. c) Usando o resultado obtido em b) determine o valor de Ix. 4.7 - Suponha que tenhamos o circuito dado na Figura 4.8. A B 4 3 21 5 Ω 2 Ω 2 Ω 1 Ω 1 Ω2 Ω 0 V 100 V a a a a Figura 4.8 CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 154 A corrente que flui do no´ p para o no´ q de uma rede ele´trica e´ dada por: Ipq = Vp − Vq Rpq onde I em Ampe´res, R em Ohms e Vp e Vq sa˜o voltagens nos no´s p e q, respectivamente, e Rpq e´ a resisteˆncia no arco pq (Lei de Ohm). A soma das correntes que chegam a cada no´ e´ nula (Lei de Kirchoff); assim, as equac¸o˜es que relaci- onam as voltagens podem ser obtidas. Por exemplo: no no´ 1, tem-se a equac¸a˜o : IA1 + I21 + I41 = 0, ou seja, 100− V1 2 + V2 − V1 1 + V4 − V1 2 = 0 ou ainda −4V1 + 2V2 + V4 = −100. Obtenha as demais equac¸o˜es do sistema linear e resolva-o. 4.8 - Uma transportadora possui 5 tipos de caminho˜es que representaremos por (1), (2), (3), (4), (5), os quais sa˜o equipados para transportar 5 tipos diferentes de ma´quinas A, B, C, D, E segundo a Tabela 4.2, onde supomos que A, B, C, D, E e´ a quantidade de ma´quinas que cada caminha˜o pode transportar levando carga plena. Tabela 4.2 Ma´quinas A B C D E Caminho˜es (1) 1 1 1 0 2 (2) 0 1 2 1 1 (3) 2 1 1 2 0 (4) 3 2 1 2 1 (5) 2 1 2 3 1 Assim, o caminha˜o (1) pode transportar 1 ma´quina A, 1 ma´quina B, 1 ma´quina C, nenhuma ma´quina D, 2 ma´quina E, etc. Quantos caminho˜es de cada tipo devemos enviar para transportar exatamente: • 27 ma´quinas do tipo A • 23 ma´quinas do tipo B • 31 ma´quinas do tipo C • 31 ma´quinas do tipo D • 22 ma´quinas do tipo E Supondo que cada caminha˜o vai com carga plena, resolva o sistema linear obtido. Sugesta˜o: Represente por x1, x2, x3, x4 e x5 o nu´mero de caminho˜es respectivamente dos tipos (1), (2), (3), (4) e (5). CAPI´TULO 4. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS EXATOS 155 4.9 - Elabore um algoritmo que tendo como dados n, a matriz A(n×n) onde A = (aij) e´ tal que aij = 0 para |i − j| > 1, e b e´ um vetor (n × 1), determina a soluc¸a˜o do sistema linear Ax = b pelo me´todo de Eliminac¸a˜o de Gauss adaptado para sistemas tridiagonais. a) Teste seu algoritmo para resolver o sistema dado por: −yk−1 + 2yk − yk+1 = 8(n+ 1)2 , k = 1, 2, ..., n, para va´rios valores de n, e compare sua soluc¸a˜o com a soluc¸a˜o matema´tica: yk = 4 [ k n+ 1 − ( k n+ 1 )2] . Considere n = 10 e n = 20 e tome em ambos os casos y0 = yn+1 = 0. b) Teste seu algoritmo para resolver o sistema Ax = b, onde: A = 4 −2 −1 2 −1 © −1 2 −1 −1 2 −1 −1 2 −1 −1 2 −1 −1 2 −1 −1 2 −1 © −1 2 −1 −2 4 , e , b = (2, −1, 7, 5, 4, 3, 2, −4, 7, 8)t. 4.10 - Representemos por xi, i = 1, 2, . . . , n o nu´mero das unidades de n produtos que podem ser produzidos no decorrer de uma semana. Para produc¸a˜o de cada unidade precisa-se de m tipos diferentes de mate´ria prima M1,M2, . . . ,Mm. Tais relac¸o˜es sa˜o dadas atrave´s de uma matriz A onde aij indica quantas unidades da mate´ria prima Mj sa˜o necessa´rias para produzir uma unidade do produto xi. Suponha que existam D1, D2, . . . , Dm unidades respectivamente de mate´rias primas M1,M2, . . . ,Mm. Nosso problema e´ determinar quantas unidades de cada produto podemos produzir. Lembre-se que tais quantidades devem ser inteiras e na˜o negativas. Considere os dados da Tabela 4.3. Tabela 4.1 M1 M2 M3 M4 M5 M6 x1 1 2 4 2 4 5 x2 2 0 1 2 2 2 x3 4 2 3 1 5 3 x4 3 1 2 3 2 2 x5 1 2 0 3 1 2 x6 1 0 1 0 4 3 x7 5 3 2 2 3 2 D 60 40 40 50 70 60 Cap´ıtulo 5 Soluc¸a˜o de Sistemas Lineares: Me´todos Iterativos 5.1 Introduc¸a˜o Ao lado dos me´todos exatos para resolver sistemas lineares, existem os me´todos iterativos os quais passamos a discutir agora. Em certos casos, tais me´todos sa˜o melhores do que os exatos, por exemplo, quando a matriz dos coeficientes e´ uma matriz esparsa (muitos elementos iguais a zero). Eles ainda sa˜o mais econoˆmicos no sentido que utilizam menos memo´ria do computador. Ale´m disso, possuem a vantagem de se auto corrigir se um erro e´ cometido, e eles podem ser usados para reduzir os erros de arredondamento na soluc¸a˜o obtida por me´todos exatos, como discutido no Cap´ıtulo 4. Podem tambe´m sob certas condic¸o˜es ser aplicado para resolver um conjunto de equac¸o˜es na˜o lineares. 5.2 Processos Estaciona´rios. Um me´todo e´ iterativo quando fornece uma sequeˆncia de aproximantes da soluc¸a˜o, cada uma das quais obtida das anteriores pela repetic¸a˜o do mesmo tipo de processo. Um me´todo iterativo e´ estaciona´rio se cada aproximante e´ obtido do anterior sempre pelo mesmo processo. Quando os processos variam de passo para passo mas se repetem ciclicamente de s em s passos dizemos que o processo e´ s-c´ıclico. Agrupando-se os s passos de cada ciclo num u´nico passo composto, obtemos um me´todo estaciona´rio. No caso de me´todos iterativos precisamos sempre saber se a sequeˆncia que estamos obtendo esta´ convergindo ou na˜o para a soluc¸a˜o desejada. Ale´m disso, precisamos sempre ter em mente o significado de convergeˆncia. ( Revise: norma de vetor e norma de matriz , Cap´ıtulo 1). Definic¸a˜o 5.1 - Dados uma sequeˆncia de vetores x(k) ∈ E e uma norma sobre E, onde E e´ um espac¸o vetorial, dizemos que a sequeˆncia {x(k)} converge para x ∈ E se ‖ x(k) − x ‖ → 0, quando k →∞. Consideremos enta˜o um sistema linear Ax = b determinado, (det(A) 6= 0), onde A e´ uma matriz quadrada de ordem n, x e b sa˜o vetores n× 1. Como no caso de equac¸o˜es na˜o lineares (Cap´ıtulo 3), para determinar a soluc¸a˜o de um sistema linear por me´todos iterativos, precisamos transformar o sistema dado em um outro sistema onde possa ser definido um processo iterativo; e mais, que a soluc¸a˜o obtida para o sistema transformado seja tambe´m soluc¸a˜o do sistema original, isto e´, os sistemas lineares devem ser equivalentes. 156 CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 157 Suponha enta˜o, que o sistema Ax = b tenha sido transformado num sistema equivalente da forma: x = B x + g . (5.1) ( por exemplo: B = I − A e g = b), de maneira que a soluc¸a˜o x¯ de (5.1) seja, tambe´m, soluc¸a˜o de Ax = b. Seja x(0) uma aproximac¸a˜o inicial para a soluc¸a˜o x¯ de (5.1). Obtemos as aproximac¸o˜es sucessivas x(k) para a soluc¸a˜o desejada x¯, usando o processo iterativo estaciona´rio definido por: x(k) = B x(k−1) + g . (5.2) Se a sequeˆncia {x(k)} converge para x¯ enta˜o x¯ coincide com a soluc¸a˜o x de Ax = b. De fato, passando-se ao limite ambos os membros de (5.2), obteˆm-se: x¯ = B x¯ + g . Pela hipo´tese de equivaleˆncia x¯ e´ tambe´m soluc¸a˜o de Ax = b. O pro´ximo teorema fornece a condic¸a˜o necessa´ria e suficiente para a convergeˆncia da sequeˆncia x(k). Teorema 5.1 - A condic¸a˜o necessa´ria e suficiente para a convergeˆncia do processo iterativo definido por (5.2) e´ que max|λi| < 1, onde λi sa˜o os auto-valores da matriz B. Prova: A prova deste teorema pode ser encontrada em ..... Em geral e´ dif´ıcil verificar as condic¸o˜es do teorema 5.1. Entretanto, podemos obter uma condic¸a˜o suficiente que a matriz B deve satisfazer para assegurar a convergeˆncia do processo iterativo definido por (5.2). Enunciamos formalmente tal condic¸a˜o no pro´ximo corola´rio. Corola´rio 5.1 - (Crite´rio Geral de convergeˆncia)- O processo iterativo definido por (5.2) e´ conver- gente se para qualquer norma de matrizes, ‖ B ‖< 1. Prova: A convergeˆncia da sequeˆncia x(k) para a soluc¸a˜o x de Ax = b e´ estudada introduzindo-se o vetor erro: e(k) = x− x(k) . Subtraindo-se (5.2) membro a membro de (5.1), obtemos: x − x(k) = B ( x− x(k−1) ) , e portanto: e(k) = B e(k−1) . (5.3) De (5.3) podemos escrever: e(k−1) = B e(k−2) ⇒ e(k) = B2 e(k−2) , e assim por aplicac¸o˜es sucessivas, segue que: e(k) = Bk e(0), onde e(0) e´ o erro inicial. Tomando normas consistentes, (definic¸a˜o 1.13 ), na expressa˜o acima, segue que: ‖ Bk e(0) ‖ ≤ ‖ B ‖k ‖ e(0) ‖ . CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 158 Portanto: ‖ ek ‖ ≤ ‖ B ‖k ‖ e(0) ‖ . Desta desigualdade vemos que se ‖ B ‖< 1 teremos: ‖ e(k) ‖ = ‖ x− x(k) ‖ → 0 , isto e´, se ‖ B ‖< 1 para alguma norma, enta˜o temos garantida a convergeˆncia do processo iterativo definido por (5.2). A matriz B de (5.2) e´ chamada matriz de iterac¸a˜o do processo iterativo. Exemplo 5.1 - Seja B = 0.5 −0.2 0.50.1 0.6 0.4 −0.3 0.1 0.0 . Verificar se um sistema Ax = b que tenha a matriz B acima, como matriz de iterac¸a˜o, convergira´ para a soluc¸a˜o. Soluc¸a˜o: Calculando ‖ B ‖∞ obtemos ‖ B ‖∞= 1.2 e nada podemos concluir. Calculando ‖ B ‖1 obte- mos ‖ B ‖1= 0.9 < 1 e podemos agora afirmar que o processo iterativo com essa matriz e´ convergente. Processo de Parada Para aplicar qualquer me´todo iterativo escolhemos x(0) como uma aproximac¸a˜o inicial para a soluc¸a˜o de Ax = b. Com essa aproximac¸a˜o inicial e um me´todo nume´rico, do tipo (5.2), refinamos a soluc¸a˜o ate´ obteˆ-la com uma determinada precisa˜o (nu´mero de casas decimais corretas) . Para obtermos a soluc¸a˜o com uma determinada precisa˜o � devemos, durante o processo iterativo, efetuar o seguinte teste: Se ‖ x(k+1) − x(k) ‖∞ ‖ x(k+1 ‖∞ < � (errorelativo) , onde � e´ uma precisa˜o pre´-fixada; xk e xk+1 sa˜o duas aproximac¸o˜es consecutivas para x¯, enta˜o xk+1 e´ a soluc¸a˜o procurada, isto e´, tomamos x = xk+1. Veremos agora alguns me´todos particulares. 5.2.1 Me´todo de Jacobi-Richardson Considere o sistema linear Ax = b de ordem n, determinado, isto e´: a11x1 + a12x2 + . . . + a1nxn = b1 a21x1 + a22x2 + . . . + a2nxn = b2 . . . . . . an1x1 + an2x2 + . . . + annxn = bn (5.4) A matriz A do sistema (5.4) pode ser decomposta na forma: A = L+D +R , onde L e´ uma matriz triangular inferior formada pela parte inferior da matriz A, D e´ a diagonal de A e R e´ uma matriz triangular superior formada pela parte superior da matriz A, isto e´: `ij = { aij , i > j 0 , i ≤ j ; dij = { aij , i = j 0 , i 6= j ; rij = { aij i < j 0 i ≥ j . CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 159 Supondo det(D) 6= 0, podemos transformar o sistema original em: (L + D + R) x = b ⇒ Dx = − (L+R) x+ b ⇒ x = −D−1 (L+R) x+D−1 b . que esta´ na forma (5.1) com B = −D−1(L+R) e g = D−1b. O processo iterativo definido por: x(k+1) = −D−1(L+R) x(k) +D−1 b, (5.5) e´ chamado de Me´todo de Jacobi-Richardson. Comparando (5.5) com (5.2) vemos que a matriz de iterac¸a˜o do me´todo de Jacobi-Richardson e´ : −D−1(L+R). Por hipo´tese aii 6= 0, pois estamos supondo det(D) 6= 0. Podemos enta˜o, antes de decompor a matriz A em L + D + R, dividir cada equac¸a˜o pelo correspondente elemento da diagonal principal, resultando assim: A∗ = L∗ + I +R∗ , onde A∗ e´ a matriz obtida de A apo´s a divisa˜o, I e´ a matriz identidade. Assim, o processo iterativo pode ser escrito como: x(k+1) = − (L∗ +R∗) x(k) + b∗, (5.6) onde os elementos de L∗, R∗ e b∗ sa˜o, respectivamente, dados por: `∗ij = { a∗ij = aij aii , i > j 0 , i ≤ j ; r ∗ ij = { a∗ij = aij aii , i < j 0 , i ≥ j ; b∗i = bi aii , i = 1, 2, . . . , n . Vemos por (5.6) que as componentes de xk+1 podem ser calculadas sucessivamente sem necessidade de se calcular D−1, e a matriz de iterac¸a˜o do me´todo de Jacobi-Richardson e´ dada por: − (L∗ +R∗). Dado o sistema (5.4), o me´todo de Jacobi-Richardson consiste na determinac¸a˜o de uma sequeˆncia de aproximantes da iterac¸a˜o k: x (k) 1 , x (k) 2 , . . . , x (k) n , k = 1, 2, 3, . . . , a partir de valores iniciais: x (0) 1 , x (0) 2 , . . . , x (0) n , atrave´s do processo iterativo definido por (5.6), isto e´: x (k+1) 1 = − a∗12x(k)2 − a∗13x(k)3 − . . . − a∗1nx(k)n + b∗1 x (k+1) 2 = − a∗21x(k)1 − a∗23x(k)3 − . . . − a∗2nx(k)n + b∗2 x (k+1) 3 = − a∗31x(k)1 − a∗32x(k)2 − . . . − a∗3nx(k)n + b∗3 . . . . . . x (k+1) n = − a∗n1x(k)1 − a∗n2x(k)2 − . . . − a∗n,n−1x(k)n−1 + b∗n Observe que o me´todo de iterac¸a˜o linear para uma u´nica equac¸a˜o, que foi discutido no Cap´ıtulo 3, e o me´todo de Jacobi-Richardson sa˜o exatamente o mesmo, com a diferenc¸a que este u´ltimo e´ aplicado CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 160 a um sistema de equac¸o˜es. E´ fa´cil ver que no me´todo de Jacobi-Richardson as equac¸o˜es sa˜o mudadas simultaneamente usando-se o valor mais recente do vetor x, e por causa disso esse me´todo e´ tambe´m conhecido por Me´todo dos Deslocamentos Simultaˆneos. Crite´rios de Convergeˆncia Fazendo B = −(L∗+R∗) no crite´rio geral de convergeˆncia, (Lema 5.1) e escolhendo sucessivamente as normas ‖ · ‖∞ e ‖ · ‖1 obtemos crite´rios suficientes de convergeˆncia para o me´todo de Jacobi-Richardson. Assim o me´todo de Jacobi-Richardson converge se: a) o crite´rio das linhas for satisfeito, isto e´, se: max 1≤i≤n n∑ j=1 j 6=i |a∗ij | < 1 , (5.7) b) o crite´rio das colunas for satisfeito, isto e´, se: max 1≤j≤n n∑ i=1 i 6=j |a∗ij | < 1 , (5.8) Observe que basta apenas um dos crite´rios ser satisfeito para garantirmos a convergeˆncia. Definic¸a˜o 5.2 - Uma matriz A e´ estritamente diagonalmente dominante se: n∑ j=1 j 6=i |aij | < |aii| , i = 1, 2, . . . , n . (5.9) Observac¸a˜o: Com a definic¸a˜o 5.2 fica fa´cil ver que se a matriz dos coeficientes for estritamente diagonalmente dominante enta˜o o crite´rio das linhas e´ satisfeito. De fato, se (5.9) e´ satisfeita para todo i, enta˜o se dividimos cada equac¸a˜o pelo correspondente elemento da diagonal principal segue que: n∑ j=1 j 6=i ∣∣∣∣aijaii ∣∣∣∣ < 1, i = 1, . . . , n⇒ n∑ j=1 j 6=i |a∗ij | < 1, i = 1, . . . , n⇒ max 1≤i≤n n∑ j=1 j 6=i |a∗ij | < 1 . Portanto obtemos mais um crite´rio de convergeˆncia, isto e´, podemos verificar se o me´todo de jacobi- Richardson converge testando se a matriz dos coeficientes e´ estritamente diagonalmente dominante. Exemplo 5.2 - Resolver o sistema: 10x1 + 2x2 + x3 = 7x1 + 5x2 + x3 = −82x1 + 3x2 + 10x3 = 6 . pelo me´todo de Jacobi-Richardson com x(0) = (0.7,−1.6, 0.6)t e � < 10−2. CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 161 Soluc¸a˜o: Em primeiro lugar devemos testar se temos garantia de convergeˆncia. Temos que a matriz dos coeficientes e´ estritamente diagonalmente dominante, pois satisfaz (5.9). De fato: |a12|+ |a13| = |2|+ |1| < |10| = |a11| , |a21|+ |a23| = |1|+ |1| < |5| = |a22| , |a31|+ |a32| = |2|+ |3| < |10| = |a33| . Portanto podemos garantir que o processo de Jacobi-Richardson aplicado ao sistema dado sera´ con- vergente. Dividindo enta˜o cada equac¸a˜o pelo correspondente elemento da diagonal principal obtemos: x1 + 0.2x2 + 0.1x3 = 0.70.2x1 + x2 + 0.2x3 = −1.60.2x1 + 0.3x2 + x3 = 0.6 Apesar de na˜o ser necessa´rio, pois ja´ sabemos que o processo de Jacobi-Richardson sera´ convergente, por se tratar de exemplo, verificaremos tambe´m o crite´rio das linhas e o crite´rio das colunas. Assim, para verificar o crite´rio das linhas, calculamos: |a∗12|+ |a∗13| = |0.2|+ |0.1| = 0.3 , |a∗21|+ |a∗23| = |0.1|+ |0.1| = 0.2 , |a∗31|+ |a∗32| = |0.2|+ |0.3| = 0.5 , ⇒ max 1≤i≤n 3∑ j=1 j 6=i |a∗ij | = 0.5 < 1 , e portanto o crite´rio das linhas e´ va´lido, o que ja´ era de se esperar, (ver observac¸a˜o apo´s definic¸a˜o 5.2). Para verificar o crite´rio das colunas, calculamos: |a∗21|+ |a∗31| = |0.2|+ |0.2| = 0.4 , |a∗12|+ |a∗32| = |0.2|+ |0.3| = 0.5 , |a∗13|+ |a∗23| = |0.1|+ |0.2| = 0.3 , ⇒ max 1≤j≤n 3∑ i=1 i 6=j |a∗ij | = 0.5 < 1 , portanto o crite´rio das colunas tambe´m e´ va´lido. Portanto qualquer um dos crite´rios de convergeˆncia assegura a convergeˆncia do me´todo de Jacobi- Richardson. Temos que as iterac¸o˜es sa˜o definidas por: x (k+1) 1 = −0.2x(k)2 − 0.1x(k)3 + 0.7 x (k+1) 2 = −0.2x(k)1 − 0.2x(k)3 − 1.6 x (k+1) 3 = −0.2x(k)1 − 0.3x(k)2 + 0.6 . e a partir de x(0) = (0.7,−1.6, 0.6)t, obtemos para x(1) os seguintes valores: x (1) 1 = −0.2x(0)2 − 0.1x(0)3 + 0.7 = −0.2(−1.6)− 0.1(0.6) + 0.7 = 0.96 x (1) 2 = −0.2x(0)1 − 0.2x(0)3 − 1.6 = −0.2(0.7)− 0.2(0.6)− 1.6 = −1.86 x (1) 3 = −0.2x(0)1 − 0.3x(0)2 + 0.6 = −0.2(0.6)− 0.3(−1.6) + 0.6 = 0.94 . Continuando as iterac¸o˜es obtemos a tabela: CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 162 k 0 1 2 3 4 x1 0.7 0.96 0.978 0.9994 0.9979 x2 -1.6 -1.86 -1.98 -1.9888 -1.9996 x3 0.6 0.94 0.966 0.9984 0.9968 Agora, desde que: x(4) − x(3) = −0.00150.0108 0.0016 , e portanto ‖ x(4) − x(3) ‖∞ ‖ x(4) ‖∞ = 0.0108 1.9996 ' 0.0054 < 10−2 , segue que a soluc¸a˜o do sistema, com � < 10−2, e´: x = 0.9979−1.9996 0.9978 . Exerc´ıcios 5.1 - Usando o me´todo de Jacobi-Richardson, obter a soluc¸a˜o do sistema: 10x1 + x2 − x3 = 10x1 + 10x2 + x3 = 122x1 − x2 + 10x3 = 11 . com 3 casas decimais corretas. 5.2 - Dado o sistema: 10x1 + x2 − x3 = 102x1 + 10x2 + 8x3 = 207x1 + x2 + 10x3 = 30 . a) Verificar a possiblidade de aplicac¸a˜o do me´todo de Jacobi-Richardson. b) Se poss´ıvel resolveˆ-lo pelo me´todo do item a), obtendo o resultado com � < 10−2. 5.2.2 Me´todo de Gauss-Seidel. Suponhamos, como foi feito para o me´todo de Jacobi-Richardson, que o sistema linear Ax = b seja escrito na forma: (L∗ + I +R∗)x = b∗ . Transformamos enta˜o esse sistema como se segue: (L∗ + I)x = −R∗x+ b∗ x = −(L∗ + I)−1R∗x+ (L∗ + I)−1b∗ . que esta´ na forma (5.1) com B = −(L∗ + I)−1R∗ e g = (L∗ + I)−1b∗. CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 163 O processo iterativo definido por: x(k+1) = −(L∗ + I)−1R∗x(k) + (L∗ + I)−1b∗ , (5.10) e´ chamado de Me´todo de Gauss-Seidel. Comparando (5.10) com (5.2) vemos que a matriz de iterac¸a˜o do me´todo de Gauss-Seidel e´: −(L∗ + I)−1R∗. Observe que pre´-multiplicando (5.10) por (L∗ + I) , segue que: (L∗ + I)x(k+1) = −R∗x(k) + b∗ ou x(k+1) = −L∗x(k+1) −R∗x(k) + b∗ . (5.11) Por (5.11) vemos que as componentes de x(k+1) podem ser calculadas sucessivamente sem necessidade de se calcular (L∗ + I)−1. Dado o sistema (5.4), o me´todo de Gauss-Seidel consiste na determinac¸a˜o de uma sequeˆncia de aproximantes da iterac¸a˜o k: x (k) 1 , x (k) 2 , . . . , x (k) n k = 1, 2, 3, . . . , a partir de valores iniciais: x (0) 1 , x (0) 2 , . . . , x (0) n , atrave´s do processo iterativo definido por (5.11), isto e´: x (k+1) 1 = − a∗12x(k)2 − a∗13x(k)3 − . . . − a∗1nx(k)n + b∗1 x (k+1) 2 = − a∗21x(k+1)1 − a∗23x(k)3 − . . . − a∗2nx(k)n + b∗2 x (k+1) 3 = − a∗31x(k+1)1 − a∗32x(k+1)2 − . . . − a∗3nx(k)n + b∗3 . . . . . . x (k+1) n = − a∗n1x(k+1)1 − a∗n2x(k+1)2 − . . . − a∗n,n−1x(k+1)n−1 + b∗n Esse me´todo difere do processo de Jacobi-Richardson por utilizar para o ca´lculo de uma componente de x(k+1) o valor mais recente das demais componentes. Por esse motivo o me´todo da Gauss-Seidel tambe´m e´ conhecido por Me´todo dos Deslocamentos Sucessivos. Crite´rios de Convergeˆncia Fazendo B = −(L∗+I)−1R∗ no crite´rio geral de convergeˆncia, (Lema 5.1), vamos agora obter crite´rios de convergeˆncia para o me´todo de Gauss-Seidel. Inicialmente lembremos, (veja definic¸a˜o 1.13), que se k satisfizer a desiguladade ‖ Bx ‖≤ k ‖ x ‖ teremos ‖ B ‖≤ k. Impondo k < 1 teremos uma condic¸a˜o suficiente para garantir a convergeˆncia do me´todo de Gauss-Seidel. Vejamos enta˜o como obter tal condic¸a˜o. Para tanto, seja y = Bx, isto e´: y = − (L∗ + I)−1 R∗x ⇒ (L∗ + I) y = − R∗x ⇒ y = −L∗y − R∗x . Assim o vetor y e´ obtido do vetor x a partir das equac¸o˜es: y1 = − a∗12 x2 − a∗13 x3 − . . . − a∗1n xn y2 = − a∗21 y1 − a∗23 x3 − . . . − a∗2n xn y3 = − a∗31 y1 − a∗32 y2 − . . . − a∗3n xn ... yn = − a∗n1 y1 − a∗n2 y2 − . . . − a∗n,n−1 yn−1 (5.12) CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 164 e queremos calcular ‖ Bx ‖∞. Mas, ‖ Bx ‖∞ = ‖ y ‖∞ , com ‖ y ‖∞ = max 1≤i≤n |yi| . Agora, a partir de (5.12), podemos escrever: |y1| = | n∑ j=2 a∗1j xj | ≤ n∑ j=2 |a∗1j | |xj | ≤ n∑ j=2 |a∗1j | max j |xj | = n∑ j=2 |a∗1j | ‖ x ‖∞ = β1 ‖ x ‖∞ onde β1 = n∑ j=2 |a∗1j | . Portanto: |y1| ≤ β1 ‖ x ‖∞ . |y2| = |a∗21 y1 + n∑ j=3 a∗2j xj | ≤ |a∗21||y1| + n∑ j=3 |a∗2j | |xj | ≤ |a∗21|β1 ‖ x ‖∞ + n∑ j=3 |a∗2j | max j |xj | ≤ |a∗21| β1 ‖ x ‖∞ + n∑ j=3 |a∗2j | ‖ x ‖∞ = |a∗21|β1 + n∑ j=3 |a∗2j | ||x||∞ = β2 ||x||∞ onde β2 = |a∗21|β1 + n∑ j=3 |a∗2j | Portanto: |y2| ≤ β2 ||x||∞ . Assim, para yi, podemos escrever: |yi| = | i−1∑ j=1 a∗ij yj + n∑ j=i+1 a∗ij xj | ≤ i−1∑ j=1 |a∗ij | |yj | + n∑ j=i+1 |a∗ij | |xj | ≤ i−1∑ j=1 |a∗ij | βj ‖ x ‖∞ + n∑ j=i+1 |a∗ij |max j |xj | ≤ i−1∑ j=1 |a∗ij | βj + n∑ j=j+1 |a∗ij | ‖ x ‖∞ = βi ‖ x ‖∞ onde βi = i−1∑ j=1 |a∗ij | βj + n∑ j=i+1 |a∗ij | CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 165 Portanto: |yi| ≤ βi ||x||∞ . Temos enta˜o: ‖ Bx ‖∞ = ‖ y ‖∞ = max 1≤i≤n |yi| ≤ max 1≤i≤n βi ‖ x ‖∞ ⇒ ‖ B ‖∞ ≤ max 1≤i≤n βi . Assim se βi ≤ 1 teremos ‖ B ‖∞≤ 1 e portanto estara´ satisfeita uma condic¸a˜o suficiente de con- vergeˆncia. Portanto o me´todo de Gauss-Seidel converge se: a) o crite´rio de Sassenfeld for satisfeito, isto e´, se: max 1≤i≤n βi < 1 onde os βi sa˜o calculados por recorreˆncia atrave´s de: βi = i−1∑ j=1 |a∗ij | βj + n∑ j=i+1 |a∗ij | . (5.13) b) o crite´rio das linhas for satisfeito, isto e´, se (5.7) for verificado. Para provar que o crite´rio das linhas e´ va´lido tambe´m para o me´todo de Gauss-Seidel, basta verificar que a condic¸a˜o (5.7) implica βi < 1 , i = 1, 2, . . . , n. De fato, (provando por induc¸a˜o), para i = 1, temos: β1 = n∑ j=2 |a∗1j | ≤ max 1≤i≤n n∑ j=1 j 6=i |a∗ij | < 1. Suponhamos βj < 1 para j = 1, 2, . . . , i− 1. Segue enta˜o: βi = i−1∑ j=1 |a∗ij | βj + n∑ j=i+1 |a∗ij | ≤ n∑ j=1 j 6=i |a∗ij | ≤ max 1≤i≤n n∑ j=1 j 6=i |a∗ij | < 1. Portanto maxβi < 1 e o crite´rio de Sassenfeld e´ verificado. c) a matriz dos coeficientes for estritamente diagonalmente dominante, isto e´, se (5.9) for va´lido. A prova aqui e´ ideˆntica a` realizada no me´todo de Jacobi-Richardson. Observac¸o˜es: 1. Dado um sistema linear Ax = b pode acontecer que o me´todo de Jacobi-Richardson aplicado a ele resulte convergente enquanto que o de Gauss-Seidel resulte divergente e vice-versa. 2. Se ‖ B ‖ na˜o for apreciavelmente menor que 1 a convergeˆncia pode ser bastante lenta. CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 166 3. Uma permutac¸a˜o conveniente das linhas ou colunas de A antes de dividir cada equac¸a˜o pelo coefi- ciente da diagonal principal pode reduzir o valor de ‖ B ‖. 4. A convergeˆncia para os me´todos: Jacobi-Richardson e Gauss-Seidel na˜o depende do vetor inicial x(0). Evidentemente quanto melhor a aproximac¸a˜o inicial menor sera´ o nu´mero de iterac¸o˜es necessa´rias para atingir uma determinada precisa˜o. Como na˜o conhecemos a priori a soluc¸a˜o, normalmente, tomamos o vetor nulo como sendo o vetor inicial. Observe que para o me´todo de Jacobi-Richardson, se tomarmos o vetor nulo teremos x(1) = b∗. Tomamos enta˜o x(0) = θ (vetor nulo), para o me´todo de Gauss-Seidel e x(0) = b∗, para o me´todo de Jacobi-Richardson. Exemplo 5.3 - Resolver o sistema: 5x1 + x2 + x3 = 53x1 + 4x2 + x3 = 63x1 + 3x2 + 6x3 = 0 . pelo me´todo de Gauss-Seidel com � < 10−2. Soluc¸a˜o: A matriz dos coeficientes na˜o e´ estritamente diagonalmente dominante. Assim, por esse crite´rio, nada podemos afirmar sobre a convergeˆncia do processo de Gauss-Seidel. Dividindo cada equac¸a˜o pelo correspondente elemento da diagonal principal obtemos: x1 + 0.2x2 + 0.2x3 = 10.75x1 + x2 + 0.25x3 = 1.50.5x1 + 0.5x2 + x3 = 0 Vimos anteriormente que se matriz dos coeficientes na˜o for estritamente diagonalmente dominante enta˜o o crite´rio das linhas tambe´m na˜o sera´ satisfeito. Mas, por se tratar de exemplo, calculemos (5.7). Assim: |a∗12|+ |a∗13| = |0.2|+ |0.2| = 0.4 , |a∗21|+ |a∗23| = |0.75|+ |0.25| = 1 , |a∗31|+ |a∗32| = |0.5|+ |0.5| = 1 , ⇒ max 1≤i≤n 3∑ j=1 j 6=i |aij | = 1 e portanto por esse crite´rio na˜o podemos garantir convergeˆncia. Aplicando o crite´rio de Sassenfeld, temos: β1 = |0.2| + |0.2| = 0.4 , β2 = |0.75|(0.4) + |0.25| = 0.3 + 0.25 = 0.55 , β3 = |0.5|(0.4) + |0.5|(0.55) = 0.2 + 0.275 = 0.475 , ⇒ max 1≤i≤n βi = 0.55 < 1 , logo temos o crite´rio de Sassenfeld satisfeito e portanto podemos garantir que o processo de Gauss-Seidel converge . CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 167 Temos que as iterac¸o˜es sa˜o definidas por: x (k+1) 1 = −0.2 x(k)2 − 0.2x(k)3 + 1 x (k+1) 2 = −0.75 x(k+1)1 − 0.25x(k)3 + 1.5 x (k+1) 3 = −0.5 x(k+1)1 − 0.5x(k+1)2 e a partir de x(0) = (0, 0, 0)t, obtemos para x(1) os seguintes valores: x (1) 1 = −0.2x(0)2 − 0.2x(0)3 + 1 = −0.2(0)− 0.2(0) + 1 = 1 x (1) 2 = −0.75x(1)1 − 0.25x(0)3 + 1.5 = −0.75(1)− 0.25(0) + 1.5 = 0.75 x (1) 3 = −0.5x(1)1 − 0.5x(1)2 = −0.5(1)− 0.5(0.75) = −0.875 Continuando as iterac¸o˜es obtemos a tabela: k 0 1 2 3 4 x1 0 1 1.025 1.0075 1.0016 x2 0 0.75 0.95 0.9913 0.9987 x3 0 - 0.875 - 0.9875 - 0.9994 - 1.0002 Agora, desde que: x(4) − x(3) = −0.00570.0074 0.00075 , e portanto ‖ x(4) − x(3)| ‖∞ ‖ x(4) ‖∞ = 0.0074 1.0016 ' 0.0074 < 10−2 , segue que a soluc¸a˜o do sistema, com � < 10−2, e´: x = 1.00160.9987 −1.0002 . Exerc´ıcios 5.3 - Dado o sistema: 4x1 + 2x2 + 6x3 = 14x1 − x2 + 3x3 = 2−x1 + 5x2 + 3x3 = 3 Mostrar que reoordenando as equac¸o˜es e inco´gnitas podemos fazer com que o crite´rio de Sassenfeld seja satisfeito, mas na˜o o das linhas. 5.4 - Considere o sistema: 5x1 + 2x2 + x3 = 7−x1 + 4x2 + 2x3 = 32x1 − 3x2 + 10x3 = −1 a) Verificar a possiblidade de aplicac¸a˜o do me´todo de Gauss-Seidel, usando o crite´rio de Sassen- feld. b) Se poss´ıvel, resolveˆ-lo pelo me´todo do item a), obtendo o resultado com � < 10−2. CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 168 5.3 Processos de Relaxac¸a˜o Veremos nessa sec¸a˜o alguns me´todos iterativos para resolver sistemas lineares conhecidos como pro- cessos de relaxac¸a˜o. Para desenvolver tais me´todos precisamos de alguns conceitos, os quais passamos a considerar agora. 1) Para uma func¸a˜o y = f(x), o ponto x0 tal que f ′(x0) = 0 e´ denominado ponto estaciona´rio de f . Para saber o tipo de ponto calculamos a derivada segunda de f . Assim se: a) f ′′(x0 > 0 enta˜o x0 e´ ponto de mı´nimo, b) f ′′(x0) < 0 enta˜o x0 e´ ponto de ma´ximo, c) f ′′(x0) = 0 enta˜o x0 e´ ponto de inflexa˜o. 2) Para uma func¸a˜o de n varia´veis y = f(x1, x2, . . . , xn), denominamos gradiente de f , em s´ımbolo, grad f , : grad f = (fx1 , fx2 , . . . , fxn) , onde fxi sa˜o as derivadas parciais de f em relac¸a˜o a xi. Assim o ponto P = (x1, . . . , xn) t tal que grad f(P ) = 0 e´ denominado ponto estaciona´rio de f . Portanto ponto estaciona´rio e´ o ponto onde todas as derivadas parciais se anulam. Para saber o tipo de ponto, devemos calcular as derivadas parciais de 2a¯ ordem. Seja A uma matriz cujos elementos (aij) = δ2f δxiδxj . Portanto: A(P ) = ∂2f ∂x21 ∂2f ∂x1∂x2 . . . ∂2f ∂x1∂xn ∂2f ∂x2∂x1 ∂2f ∂x22 . . . ∂2f ∂x2∂xn . . . ∂2f ∂xn∂x1 ∂2f ∂xn∂x2 . . . ∂2f ∂x2n . Assim, se: a) A(P ) : positiva definida enta˜o P e´ ponto de mı´nimo, b) A(P ) : negativa definida enta˜o P e´ ponto de ma´ximo, c) A(P ) : indefinida enta˜o P e´ ponto de cela. A definic¸a˜o de matriz positiva definida encontra-se no Cap´ıtulo 4 (Definic¸a˜o 4.4). Estamos agora em condic¸o˜es de descrever o processo de relaxac¸a˜o. Seja o sistema linear : Ax+ b = 0 , (5.14) onde A, n × n, e´ positiva definida; x e b sa˜o vetores n × 1. Portanto, o sistema (5.14) tem uma u´nica soluc¸a˜o. Se v e´ uma aproximac¸a˜o da soluc¸a˜o enta˜o: r = Av + b , CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 169 e´ o res´ıduo. O objetivo do processo de relaxac¸a˜o e´ fazer com que o res´ıduo se anule. Para ver como e´ poss´ıvel conseguir isso, consideremos, junto com o sistema de equac¸o˜es (5.14), a func¸a˜o quadra´tica: F (v) = 1 2 (Av, v) + (b, v) , (5.15) onde A = (aij); v = (v1, v2, . . . , vn)t; b = (b1, b2, . . . , bn)t, sendo que (Av, v) ≥ 0, com igualdade va´lida se e somente se v = θ (vetor nulo). Portanto, calculando os produtos escalares da expressa˜o (5.15), obtemos: F (v) = 1 2 n∑ i,j=1 aijvivj + n∑ i=1 bivi , Observe agora que: n∑ i,j=1 aijvivj = n∑ i=1 n∑ j=1 aijvivj = a11v21 + a12v1v2 + . . .+ a1nv1vn + a21v2v1 + a22v22 + . . .+ a2nv2vn . . . + an1vnv1 + an2vnv2 + . . .+ annv2n , n∑ i=1 bivi = b1v1 + . . .+ bnvn . Portanto: ∂ ∑n i,j=1 aijvivj ∂vi = 2 n∑ j=1 aijvi , desde que A e´ sime´trica, e ∂ ∑n i=1 bivi ∂vi = bi . Logo, podemos escrever que: ∂F (v) ∂vi = 1 2 · 2 n∑ j=1 aijvj + bi = n∑ j=1 aijvj + bi, i = 1, . . . , n . Agora: grad F (v) = ( ∂F (v) ∂v1 , ∂F (v) 2v2 , . . . ∂F (v) ∂vn ) . Portanto: grad F (v) = 0 ⇔ ( ∂F (v) ∂vi ) = 0 , i = 1, 2, . . . , n CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 170 ⇔ n∑ j=1 aijvj + bi = 0 , i = 1, . . . , n . Assim, temos que: Av + b = 0 = grad F (v). Mas, desde que Av + b = r, podemos concluir que grad F (v) = r. Assim, nosso objetivo e´ obter grad F (v) = 0, pois assim teremos r = 0. Teorema 5.2 - O problema de determinar a soluc¸a˜o do sistema (5.14), onde A e´ positiva definida, e´ equivalente ao problema de determinar o ponto de mı´nimo de (5.15) . Prova: Evidentemente P = (x1, x2, . . . , xn)t e´ ponto estaciona´rio da F se e somente se (x1, x2, . . . , xn)t e´ soluc¸a˜o de (5.14), pois se P e´ ponto estaciona´rio da F enta˜o grad F = 0 ⇒ r = 0 ⇒ P e´ soluc¸a˜o de Ax+ b = 0. Resta provar que F tem um so´ ponto estaciona´rio e que este ponto e´ de mı´nimo. Temos que v e´ ponto estaciona´rio da F se e somente se grad F (v) = 0, isto e´, se e somente se: n∑ j=1 aijvj + bi = 0, i = 1, 2, . . . , n . Ale´m disso, o ponto estaciona´rio e´ u´nico, pois, o sistema admite uma u´nica soluc¸a˜o. Como: ∂2F (v) ∂v21 = a11 , ∂2F (v) ∂v1v2 = a12 , . . . , ∂2F (v) ∂vivj = aij , temos que: A = (aij) = ∂2F (v) ∂vivj . Agora, por hipo´tese, A e´ positiva definida. Assim v e´ ponto de mı´nimo. O exemplo a seguir ilustra o teorema anterior. Exemplo 5.4 - Seja o sistema linear Ax+ b = 0, dado por: 100 x1 + x2 − 1 = 0 x1 + 100x2 − 100 = 0 Calcule a func¸a˜o quadra´tica dada por (5.15) e mostre que o ponto de mı´nimo desta func¸a˜o e´ soluc¸a˜o do sistema dado. Soluc¸a˜o: E´ fa´cil verificar que a soluc¸a˜o do sistema dado e´: x = ( 0 1 ) . Formemos a func¸a˜o quadra´tica, F (v). Temos que: Av = ( 100 1 1 100 ) ( v1 v2 ) ( 100v1 + v2 v1 + 100v2 ) . Assim: (Av, v) = 100v21 + 2v1v2 + 100v 2 2 , CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 171 e (b, v) = −v1 − 100v2 . Logo: F (v) = 1 2 (100v21 + 2v1v2 + 100v 2 2)− v1 − 100v2 . Ale´m disso: ∂2F ∂v21 ∂2F ∂v1∂v2 ∂2F ∂v2∂v1 ∂2F ∂v22 = 100 1 1 100 = A , que e´ uma matriz positiva definida. Portanto F (v) tem ponto de mı´nimo em (0, 1), que e´ a soluc¸a˜o do sistema. O valor do mı´nimo e´ Fmin = −50. Assim, apesar da forma quadra´tica ser positiva definida, o mı´nimo pode ser negativo. Observe que os me´todos de relaxac¸a˜o sa˜o usados apenas para sistemas cuja matriz dos coeficientes sa˜o positivas definidas. Se A e´ na˜o singular, mas na˜o e´ positiva definida na˜o podemos aplicar o racioc´ınio apresentado. Os me´todos de relaxac¸a˜o nestes casos na˜o convergem. 5.3.1 Pr´ıncipios Ba´sicos do Processo de Relaxac¸a˜o Sejam v a soluc¸a˜o inicial e r = Av + b o res´ıduo. Escolhemos uma direc¸a˜o p e variamos v nessa direc¸a˜o, com o objetivo de diminuir F (v), para ir atingindo seu ponto do mı´nimo que e´ a soluc¸a˜o do sistema; ou seja, tentamos anular o res´ıduo na direc¸a˜o p. Assim, variando v na direc¸a˜o p, isto e´, tomando: v′ = v + tp , procuramos determinar o paraˆmetro t de modo que a func¸a˜o F diminua. Logo devemos procurar o mı´nimo de F na direc¸a˜o p. Temos enta˜o que: F (v′) = 1 2 (Av′, v′) + (b, v′) = 1 2 (A(v + tp), v + tp) + (b, v + tp) = 1 2 [ (Av, v) + 2t(Av, p) + t2(Ap, p) + 2(b, v) + 2t(b, p)] = F (v) + t2 2 (Ap, p) + t(Av + b, p) . desde que 12 [(Av, v) + 2t(b, v)] = F (v). Portanto: F (v′) = F (v) + t2 2 (Ap, p) + t(r, p) , CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 172 que e´ func¸a˜o do paraˆmetro t. O paraˆmetro t e´ selecionado de tal forma que F e´ mı´nimo dentro do conjunto acima examinado.A condic¸a˜o necessa´ria para que isso ocorra e´: ∂F (v′) ∂t = t(Ap, p) + (r, p) = 0 ⇒ t = − (r, p) (Ap, p) , que e´ um ponto estaciona´rio da F . Ale´m disso ∂ 2F (v′) ∂t2 = (Ap, p) > 0 pois A e´ positiva definida e assim t e´ mı´nimo na direc¸a˜o p. Portanto: tmin = − (r, p)(Ap, p) . (5.16) Observac¸o˜es: 1) Diferentes escolhas da direc¸a˜o p nos da˜o diferentes me´todos de relaxac¸a˜o. 2) O ponto v′, que e´ tomado na direc¸a˜o p de relaxac¸a˜o com t = tmin, e´ chamado ponto do mı´nimo. 3) Analisando a equac¸a˜o ( 5.16) com r = Av + b, notamos que a direc¸a˜o p de relaxac¸a˜o na˜o deve ser escolhida ortogonal ao vetor res´ıduo r. Se assim fosse, o ponto v′ teria sempre tmin = 0 e na˜o haveria melhoria na aproximac¸a˜o da soluc¸a˜o. Teorema 5.3 - Para o ponto de mı´nimo v′ com t = tmin o novo res´ıduo r′ = Av′ + b e´ ortogonal a` direc¸a˜o p da relaxac¸a˜o. Prova: Temos que: r′ = Av′ + b = A(v + tp) + b = Av + b+ tAp ⇒ r′ = r + tAp . Portanto: (r′, p) = (r + tAp, p) = (r, p) + t(Ap, p) . Para t = tmin, segue que: (r′, p) = (r, p)− (r, p) (Ap, p) (Ap, p) = 0 . Logo r′ e p sa˜o ortogonais, demonstrando o teorema. Observe que o novo res´ıduo na˜o tem compo- nentes na direc¸a˜o p, ou seja, o novo res´ıduo, r′, se anula na direc¸a˜o p. CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 173 5.3.2 Me´todo dos Gradientes Dado o sistema (5.14), com A positiva definida, constru´ımos a func¸a˜o quadra´tica F (v). Vimos que a soluc¸a˜o do sistema dado coincide com o ponto de mı´mimo de F (v) e que gradF (v) = Av + b = r. Aqui, definiremos a direc¸a˜o p de relaxac¸a˜o por: pk = −r(k−1) para k = 1, 2, . . . (5.17) Esta direc¸a˜o e´ dirigida para o ponto do mı´nimo. Todo processo iterativo onde a direc¸a˜o p de relaxac¸a˜o e´ a do res´ıduo em sentido oposto e´ chamado Me´todo dos Gradientes. Temos que: tmin = − (r, p)(Ap, p) = − (rk−1), p(k)) (Ap(k), p(k)) = (r (k−1), r(k−1)) (Ar(k−1), r(k−1)) , usando (5.17). Vimos que ao usar tmin, o novo res´ıduo e´ ortogonal a` direc¸a˜o de relaxac¸a˜o. Portanto neste processo res´ıduos consecutivos sa˜o ortogonais, isto e´: (r(k), rk−1)) = 0 , k = 1, 2, . . . Assim, no me´todo dos gradientes, temos que: v(k) = v(k−1) + t p(k) ⇒ v(k) = v(k−1) − tmin r(k−1) , (5.18) e , r(k) = Av(k) + b = A(v(k−1) − tmin r(k−1)) + b = Av(k−1) + b− tmin Ar(k−1) ⇒ r(k) = r(k−1) − tmin Ar(k−1) . (5.19) Resumindo: dados v(0) e �, onde � e´ uma precisa˜o pre´-fixada, para aplicar o me´todo dos gradientes, devemos calcular: a) r(0) = Av(0) + b CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 174 b) para k = 1, 2, . . . b.1) tmin = (r(k−1), r(k−1)) (Ar(k−1), r(k−1)) b.2) v(k) = v(k−1) − tminr(k−1) b.3) r(k) = r(k−1) − tminAp(k−1) b.4) Se ‖ r(k) ‖< �, ouse ‖ v (k+1) − v(k) ‖ ‖ v(k+1) ‖ < �, Fim, caso contrario b) . Exemplo 5.5 - Usando o me´todo dos gradientes obter a soluc¸a˜o do sistema: 10 1 01 10 1 0 1 10 x1x2 x3 − 1111 1 = 00 0 , com precisa˜o de 10−1. Soluc¸a˜o: Seja v(0) = (0, 0, 0)t, enta˜o: r(0) = Av(0) + b = −11−11 −1 , Para k = 1, obtemos: (r(0), r(0)) = 121 + 121 + 1 = 243 , Ar(0) = 10 1 01 10 1 0 1 10 −11−11 −1 = −121−122 −21 , (Ar(0), r(0)) = 1331 + 1342 + 21 = 2694 . Assim: tmin = 243 2694 = 0.0902 . Agora, v(1) = v(0) − tmin r(0) = 00 0 − 0.0902 −11−11 −1 = 0.99220.9922 0.0902 , r(1) = r(0) − tmin Ar(0) = −11−11 −1 − 0.0902 −121−122 −21 = −0.08580.0044 0.8942 . CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 175 De maneira ana´loga, para k = 2, obtemos: (r(1), r(1)) = 0.8070 , Ar(1) = −0.53600.8524 8.9284 , (Ar(1), r(1)) = 8.0336 . Assim: tmin = 0.1005 . Portanto, v(2) = 1.00080.9918 0.0003 , Agora, desde que: ‖ v(k+1) − v(k) ‖∞ ‖ v(k+1) ‖∞ = 0.0899 1.0008 ' 0.09 < 10−1 , temos que v(2) e´ soluc¸a˜o do sistema dado, com � < 10−1. Exerc´ıcios 5.5 - Deseja-se resolver um sistema Ax+ b = 0, onde a e´ real e : A = 1 a aa 1 a a a a . pelo me´todo dos gradientes. a) Quais os valores poss´ıveis para a? b) Sendo b = (1, 2, 3)t e considerando a = 0.4, obtenha a soluc¸a˜o do sistema com duas casas decimais corretas usando o me´todo dos gradientes. 5.6 - Usando o me´todo dos gradientes, obtenha a soluc¸a˜o do sistema:( 4 1 1 3 ) ( x1 x2 )( 5 4 ) = ( 0 0 ) , com erro relativo inferior a 10−3. CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 176 5.3.3 Me´todo dos Gradientes Conjugados Um outro me´todo de relaxac¸a˜o e´ o chamado Me´todo dos Gradientes Conjugados. Definic¸a˜o 5.3 - Dada a aplicac¸a˜o linear A; positiva definida, x e y sa˜o direc¸o˜es conjugadas se (Ax, y) = (x,Ay) = 0 . O primeiro passo no me´todo dos gradientes conjugados e´ igual ao primeiro passo do me´todo dos gradientes; isto e´, dado v(0), calculamos r(0) = Av(0) + b e fazemos: p(1) = −r(0) , v(1) = v(0) − tr(0) , onde t = q1 = − (r (0), p(1)) (Ap(1), p(1)) = (r(0), r(0)) (Ar(0), r(0)) . Portanto: v(1) = v(0) − (r (0), r(0)) (Ar(0), r(0)) r(0) . (5.20) Consideremos a passagem do passo k− 1 para o passo k, (k ≥ 1) . Tomamos a direc¸a˜o de liberac¸a˜o p(k) de tal modo que p(k) e p(k−1) sejam direc¸o˜es conjugadas, isto e´, p(k) deve ser tal que: (Ap(k), p(k−1)) = (p(k), Ap(k−1)) = 0 . Ale´m disso, p(k) e´ tomado como combinac¸a˜o linear de r(k−1) e p(k−1), e desde que o coeficiente de r(k−1) e´ na˜o nulo podemos toma´-lo igual −1. Portanto: p(k) = −r(k−1) + αk−1p(k−1), k = 2, 3, . . . (5.21) onde αk−1 e´ um coeficiente a ser determinado. Temos que, para k = 2, 3, . . .: (p(k), Ap(k−1)) = 0 ⇒ (−r(k−1) + αk−1p(k−1), Ap(k−1)) = 0 ⇒ (−r(k−1), Ap(k−1)) + αk−1(p(k−1), Ap(k−1)) = 0 . Da expressa˜o acima podemos determinar αk−1, isto e´: αk−1 = (r(k−1), Ap(k−1)) (p(k−1), Ap(k−1)) , k = 2, 3, . . . . (5.22) Uma vez, identificada a direc¸a˜o p(k), procuramos o ponto de mı´nimo. Assim, de v(k) = v(k−1) + tp(k), obtemos que: vk = v(k−1) + qkp(k) , (5.23) CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 177 onde qk = − (r (k−1), p(k)) (Ap(k), p(k)) . e de r(k) = Av(k) + b, segue que: r(k) = A(v(k−1) + qkp(k)) + b = Av(k−1) + b+ qkAp(k) . Portanto: r(k) = r(k−1) + qkAp(k) . (5.24) Observac¸o˜es: i) O me´todo dos gradientes conjugados e´ essencialmente definido pelas fo´rmulas (5.20), (5.21), (5.22), (5.23), (5.24), desde que um vetor aproximac¸a˜o v(0) tenha sido escolhido. ii) Os denominadores que aparecem nas fo´rmulas de αk−1 e qk sa˜o sempre maiores que zero, para direc¸o˜es na˜o nulas p(k), pelo fato de A ser positiva definida. iii) O res´ıduo em cada passo, do me´todo dos gradientes conjugados, possui as seguintes propriedades: 1) e´ ortogonal ao res´ıduo do passo anterior, isto e´: (r(k), r(k−1)) = 0 , 2) e´ ortogonal a` direc¸a˜o de relaxac¸a˜o do passo, isto e´: (r(k), p(k)) = 0 , 3) e´ ortogonal a` direc¸a˜o de relaxac¸a˜o do passo anterior, isto e´: (r(k), p(k−1)) = 0 . Com estas propriedades, podemos obter simplificac¸o˜es para as fo´rmulas de qk e de αk−1. De fato, da fo´rmula de qk, obtemos que: qk = (r(k−1), r(k−1)) (Ap(k), p(k)) , desde que: −(r(k−1), p(k)) = −(r(k−1),−r(k−1) + αk−1p(k−1)) = (r(k−1), r(k−1))− αk−1(r(k−1), p(k−1)) = (r(k−1), r(k−1)) , (usando a propriedade 2) , e da fo´rmula de αk−1, segue que: αk−1 = (r(k−1), r(k−1)) (r(k−2), r(k−2)) , CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 178 desde que, de (5.24), temos: Ap(k−1) = 1 qk−1 (r(k−1) − r(k−2)) . Assim: (r(k−1), Ap(k−1)) = (r(k−1), 1 qk−1 (r(k−1) − r(k−2))) = 1 qk−1 (r(k−1), r(k−1))− 1 qk−1 (r(k−1) − r(k−2)) = 1 qk−1 (r(k−1), r(k−1)) , (usando a propriedade 1) , e (p(k−1), Ap(k−1)) = 1 qk−1 (p(k−1), r(k−1))− 1 qk−1 (p(k−1), r(k−2)) = − 1 qk−1 (p(k−1), r(k−2)) , (usando a propriedade 2) = − 1 qk−1 (−r(k−2) + αk−2p(k−2), r(k−2)) = αk−2 qk−1 (r(k−2), p(k−2)) + 1 qk−1 (r(k−2), r(k−2)) = 1 qk−1 (r(k−2), r(k−2)) ,usandoapropriedade2 . Resumindo, para aplicarmos o me´todo dos gradientes conjugados devemos efetuar os seguintes passos: Dado v(0) e �, calcular: a) r(0) = Av(0) + b p(1) = − r(0) q1 = (r(0), r(0)) (Ar(0), r(0)) v(1) = v(0) + q1p(1) r(1) = r(0) + q1Ap(1) CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 179 b) para k ≥ 2 b.1) αk−1 = (r(k−1), r(k−1)) (r(k−2), r(k−2)) b.2) p(k) = − r(k−1) + αk−1p(k−1) b.3) qk = (r(k−1), r(k−1)) (Ap(k),p(k)) b.4) v(k) = v(k−1) + qkp(k) b.5) r(k) = r(k−1) + qkAp(k) c) Se ‖ v (k+1) − v(k) ‖ ‖ v(k+1) ‖ < �, Fim caso contra´rio b) . Teorema 5.4 - No me´todo dos gradientes conjugados, as direc¸o˜es de relaxac¸a˜o formam um sistema de direc¸o˜es conjugadas e os res´ıduos formam um sistema ortogonal, isto e´, para i 6= j, i, j = 1, 2, . . ., vale que: (Ap(i), p(j)) = 0 , (r(i), r(j)) = 0 , Prova: A prova deste teorema pode ser encontrada em Rutishauser, Stiefel, Schwarz. Do fato de (r(i), r(j)) = 0, conclu´ımos que o me´todo dos gradientes conjugados converge, teoricamente, em n passos, onde n e´ a ordem do sistema; isto porque os vetores r(i) pertencem a um espac¸o vetorial n- dimensional, e assim o sistema ortogonal pode conter no ma´ximo n vetores na˜o nulos. Com isso podemos enunciar o seguinte: Teorema 5.5 - O me´todo dos gradientes conjugados fornece a soluc¸a˜o do sistema em no ma´ximo n passos, onde n e´ a ordem do sistema. Observe que em geral, na pra´tica, devido aos erros de arredondamento, na˜o obteremos a soluc¸a˜o do sistema em n passos. Exemplo 5.6 - Usando o me´todo dos gradientes conjugados, obter a soluc¸a˜o do sistema do exemplo anterior, com duas casas decimais corretas . Soluc¸a˜o: Como o 1o¯ passo do me´todo dos gradientes conjugados e´ igual ao 1o¯ passo do me´todo dos gradientes, do exemplo anterior, temos: v(0) = (0, 0, 0)k r(0) = −11−11 −1 , CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 180 p(1) = −r(0) , q1 = tmin = 0.09024 , v(1) = 0.99220.9922 0.0902 , r(1) = −0.08580.0044 0.8942 . Para k = 2, temos: α1 = (r(1), r(1)) (r(0), r(0)) = 0.8070 243 = 0.0033 , p(2) = −r(1) + α1p(1) = 0.0858−0.0044 −0.8942 + 0.0033 1111 1 ⇒ p2 = 0.12210.0319 −0.8909 , Ap(2) = 10 1 01 10 1 0 1 10 0.12210.0319 −0.8909 = 1.2529−0.4498 −8.8771 , (Ap(2), p(2)) = 0.1530− 0.0143 + 7.9086 = 8.0473 , q2 = (r(1), r(1) (Ap(2), p(2)) = 0.8070 8.0473 = 0.1003 , v(2) = v(1) + q2p(2) = 0.99220.9922 0.0902 + 0.1003 0.12210.0319 −0.8909 = 1.00440.9954 0.0008 . Para k = 3, segue que: r(2) = r(1) + q2Ap(2) = 0.0399−0.0407 0.0038 , α2 = (r(2), r(2)) (r(1), r(1)) = 0.0033 0.8070 = 0.0041 , p(3) = −r(2) + α2p(2) = −0.03940.0408 −0.0001 , CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 181 Ap(3) = −0.35320.3685 0.0398 , (Ap(3), p(3)) = 0.0139 + 0.0150 − 0.0000 = 0.0289 , q3 = (r(2), r(2) (Ap(3), p(3)) = 0.0033 0.0289 = 0.1142 , v(3) = v(2) + q3p(3) = 0.99991.0001 0.0008 . Agora, desde que: ‖ v(k+1) − v(k) ‖∞ ‖ v(k+1) ‖∞ = 0.0047 1.0001 ' 0.0047 < 10−2 , temos que v3 e´ soluc¸a˜o do sistema dado, com � < 10−2. Exerc´ıcios 5.7 - Mostre que no me´todo dos gradientes conjugados o res´ıduo em cada passo e´ ortogonal ao res´ıduo anterior, a` direc¸a˜o de relaxac¸a˜o do passo e a` direc¸a˜o de relaxac¸a˜o do passo anterior. 5.8 - Usando o me´todo dos gradientes conjugados resolver os sistemas dados nos exerc´ıcios 5.5 e 5.6. 5.4 Exerc´ıcios Complementares 5.9 - Supomos que o sistema: x1 − αx2 = c1−αx1 + x2 − αx3 = c2− αx2 + x3 = c3 seja resolvido iterativamente pelas fo´rmulas: x (k+1) 1 = αx (k) 2 + c1 x (k+1) 2 = α(x (k) 1 + x (k) 3 ) + c2 x (k+1) 3 = αx (k) 2 + c3 Para que valores de α a convergeˆncia do me´todo definido acima e´ garantida? Justifique. CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 182 5.10 - Considere o sistema Ax = b; onde: A = 10 −1 41 10 9 2 −3 −10 ; x = x1x2 x3 ; b = 52 9 . Entre os me´todos iterativos que voceˆ conhece qual voceˆ aplicaria? Por que? Resolva - o pelo me´todo escolhido. 5.11 - Considere o sistema Ax = b; onde: A = 50 −1 41 50 9 2 −3 −50 ; x = x1x2 x3 ; b = 4542 49 . Aplique a este sistema o mesmo me´todo aplicado no exerc´ıcio anterior. Como se comparam as taxas de convergeˆncia? Por que? 5.12 - Considere os sistemas: (I) 5x1 + 2x2 + x3 = 02x1 + 4x2 + x3 = 22x1 + 2x2 + 4x3 = 1 ; (II) 5x1 + 4x2 + x3 = 23x1 + 4x2 + x3 = 23x1 + 3x2 + 6x3 = −9 Aplicando os crite´rios que voceˆ conhece qual dos me´todos iterativos sera´ seguramente convergente? Justifique. 5.13 - Considere o sistema: −x1 + 2x2 − x3 = 1 2x1 − x2 = 1 − x2 + 2x3 − x4 = 1 − x3 + x4 = 1 Reordene as equac¸o˜es convenientemente e aplique o me´todo de Gauss - Seidel com garantia de con- vergeˆncia. 5.14 - Certos sistemas de equac¸o˜es lineares podem ser convenientemente tratados pelo me´todo iterativo de Gauss - Seidel. Depois de uma simples generalizac¸a˜o, o me´todo pode ser tambe´m usado para alguns sistemas na˜o lineares. Determinar desse modo uma soluc¸a˜o do sistema: x − 0.1y 2 + 0.05x2 = 0.7 y + 0.3x2 − 0.1xz = 0.5 z + 0.4y2 + 0.1xz = 1.2 com erro relativo inferior a 10−2. 5.15 - O sistema : { ax+ by + c = 0 dx+ ey + f = 0 pode ser resolvido minimizando a func¸a˜o: F = (ax+ by + c)2 + (dx+ ey + f)2 . CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 183 Comec¸amos com uma soluc¸a˜o aproximada (xk, yk) e constru´ımos a seguinte, primeiro mantendo y = yk e variando x. O ponto de mı´nimo e´ chamado xk+1. A seguir, mantendo x = xk+1 e variando y. O ponto de mı´nimo e´ chamado yk+1. O processo e´ repetido iterativamente. Aplicar o me´todo descrito acima ao sistema:{ 5x + 2y − 11 = 0 x − 3y − 9 = 0 5.16 - Um processo iterativo para resolver sistemas de equac¸o˜es do tipo Ax− b = 0 e´ assim definido: • somar Ix a ambos os membros, obtendo (I +A)x− b = x , • realizar iterac¸o˜es a partir de x(0) fazendo: x(k+1) = (I +A)x(k) − b . a) Deˆ uma condic¸a˜o suficiente que assegure a convergeˆncia deste processo iterativo. b) Aplique este processo para determinar a soluc¸a˜o do seguinte sistema:{ −1.1x1 + 0.1x2 = 1 0.3x1 − 0.3x2 = 0 5.17 - Considere cada um dos seguintes sistemas de 3 equac¸o˜es: (I) 3x1 − 3x2 + 7x3 = 18x1 + 6x2 − x3 = 1010x1 − 2x2 + 7x3 = 27 ; (II) x1 + 2x2 + 5x3 = 20x1 + 3x2 + x3 = 104x1 + x2 + 2x3 = 12 a) Sem rearranjar as equac¸o˜es, tente achar as soluc¸o˜es iterativamente, usando os me´todos de Jacobi e de Gauss - Seidel, comec¸ando com x(0) = (1.01, 2.01, 3.01)t. b) Rearranje as equac¸o˜es de tal modo que satisfac¸am os crite´rios de convergeˆncia e repita o que foi feito no item a). c) Verifique suas soluc¸o˜es nas equac¸o˜es originais. 5.18 - Considere o sistema: −1 2 −1 0 2 −1 0 0 0 −1 2 −1 0 0 −1 2 x1 x2 x3 x4 = 1 2 9 11 . a) E´ poss´ıvel aplicar a este sistema os me´todos iterativos que voceˆ conhece com garantia de convergeˆncia? b) Reordene as equac¸o˜es convenientemente de tal forma que seja poss´ıvel aplicar o me´todo de Gauss-Seidel com garantia de convergeˆncia. 5.19 - Dado o sistema linear: α 2 −21 α 1 2 2 α x1x2 x3 = 12 3 . para que valores de α havera´ convergeˆncia se desejarmos utilizar o me´todo de Jacobi? CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 184 5.20 - Considere o sistema linear do exerc´ıcio anterior com α = 1 e x(0) = (1, 2, 3)t. A aplicac¸a˜o do me´todo de Jacobi fornece a tabela: k 0 1 2 3 x1 1 3 −1 −1 x2 2 −2 2 2 x3 3 −3 1 1 Existe alguma contradic¸a˜o com o exerc´ıcio anterior? Voceˆ saberia explicar porque o me´todo de Jacobi convergiu. 5.21 - Considere o sistema linear Ax = b, onde: A = 20 3 1a 20 1 1 a 6 . Para que valores de a o crite´rio das linhas e´ verificado? 5.22 - Supondo que o sistema linear Ax = b, onde A e´ a matriz do exerc´ıcio anterior, esteja sendo resolvido pelo me´todo de Jacobi-Richardson, para quais valores de a, pode-se afirmar que: ‖ x(k) − x¯ ‖∞≤ 12 ‖ x (k−1) − x¯ ‖∞ , onde x(k) e x(k−1) sa˜o aproximac¸o˜es para a soluc¸a˜o e x¯ e´ a soluc¸a˜o exata. 5.23 - O sistema linear Ax = b: (I) ( 1 −a −a 1 ) ( x1 x2 ) = ( b1 b2 ) , a ∈ IR, pode, sob certas condic¸o˜es, ser resolvido pelo seguinte me´todo iterativo: (II) ( 1 0 −wa 1 ) ( x (k+1) 1 x (k+1) 2 ) = ( 1− w wa 0 1− w ) ( x (k) 1 x (k) 2 ) + ( wb1 wb2 ) . a) Mostre que se w = 1 o me´todo iterativo (II) e´ o me´todo de Gauss-Seidel. b) Considere em (I), a = b1 = b2 = 0.5. Usando o processo iterativo (II), com w = 1, determine a soluc¸a˜o deste sistema com precisa˜o de < 10−2. Tome como vetor inicial x(0) = (0.9, 0.9)t. 5.24 - Dado os sistemas: (I) { 9x1 − x2 = 7 −x1 + 9x2 = 17 ; (II) { 31x1 + 29x2 = 33 29x1 + 31x2 = 27 a) Construa as func¸o˜es quadra´ticas cujos mı´nimos sa˜o as soluc¸o˜es dos sistemas. b) Determine o nu´mero de condic¸a˜o para cada sistema. c) Com base no nu´mero de condic¸a˜o de cada sistema o que voceˆ pode concluir? d) Resolva o sistema (II) pelo me´todo dos gradientes conjugados. Qual e´ a aproximac¸a˜o ao fim de dois esta´gios? CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 185 5.25 - Dado o sistema de equac¸o˜es: 2 −1 0 0 −1 4 −1 0 0 −1 4 −1 0 0 −1 2 x1 x2 x3 x4 = 3 5 −15 7 . cuja soluc¸a˜o e´ x = (2, 1, −3, 2)t, a) resolva-o pelo me´todo dos gradientes conjugados, efetuando os ca´lculos com 4 algarismos sig- nificativos; b) mostre a ortogonalidade dos vetores res´ıduos (como verificac¸a˜o dos ca´lculos efetuados). 5.5 Problemas Aplicados e Projetos 5.1 - Uma maneira de se obter a soluc¸a˜o da equac¸a˜o de Laplace: ∂2u ∂x2 + ∂2u ∂y2 = 0 , em uma regia˜o retangular consiste em se fazer uma discretizac¸a˜o que transforma a equac¸a˜o em um problema aproximado consistindo em uma equac¸a˜o de diferenc¸as cuja soluc¸a˜o, em um caso particular, exige a soluc¸a˜o do seguinte sistema linear: 4 −1 0 −1 0 0 −1 4 −1 0 −1 0 0 −1 4 0 0 −1 −1 0 0 4 −1 0 0 −1 0 −1 4 −1 0 0 −1 0 −1 4 x1 x2 x3 x4 x5 x6 = 100 0 0 100 0 0 . Se desejamos a soluc¸a˜o com quatro algarismos significativos corretos, qual dos me´todos iterativos que voceˆ conhece poderia ser aplicado com garantia de convergeˆncia? Resolva o sistema pelo me´todo escolhido. 5.2 - Considere o circuito da figura a seguir, com resisteˆncias e baterias tal como indicado; escolhemos arbitrariamente as orientac¸o˜es das correntes. i3 i2i1 5Ω 10Ω 4Ω 26V 11Ω 7V 5Ω 5Ω6Ω ff ffff CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 186 Aplicando a lei de Kirchoff, que diz que a soma alge´brica das diferenc¸as de potencial em qualquer circuito fechado e´ zero, achamos para as correntes i1, i2, i3: 6i1 + 10(i1 − i2) + 4(i1 − i3)− 26 = 05i2 + 5i2 + 5(i2 − i3) + 10(i2 − i1) = 011i3 + 4(i3 − i1) + 5(i3 − i2)− 7 = 0 a) E´ poss´ıvel aplicar ao sistema acima o me´todo de Gauss - Seidel com convergeˆncia assegurada? Justifique. b) Se poss´ıvel, obtenha a soluc¸a˜o com erro relativo < 10−2. 5.3 - Suponha uma barra de metal homogeˆneo, como na figura a seguir, onde AB = CD = 4 : AC = BD = 3. y x D B 0o 0o R 1o 0o A C - 6 A temperatura ao longo de AB,AC,BD e´ mantida constante e igual a 0oC, enquanto que ao longo de CD ela e´ igual a 1oC. A distribuic¸a˜o do calor na barra R obedece a` seguinte equac¸a˜o: ∂2u ∂x2 + ∂2u ∂y2 = 0 , (5.25) com as condic¸o˜es de contorno: u(x, y) = 1 para 0 < x < 4 , u(x, 0) = 0 para 0 < x < 4 , u(0, y) = 1 para 0 < y < 3 , u(x, y) = 0 para 0 < y < 3 . A soluc¸a˜o nume´rica desse problema pode ser obtida considerando-se uma divisa˜o do retaˆngulo ABCD em retaˆngulos menores a partir de uma divisa˜o de AB em intervalos iguais de amplitude h e de uma divisa˜o de CD em intervalos iguais de amplitude k,como e´ mostrado na figura a seguir: CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 187 u6u5u4 u3u2u1 D BA C b b b d d ddd d d d b temp. 0o temp. 1o Nessa figura estamos considerando h = k = 1. A temperatura u nos pontos internos pode ser obtida numericamente simulando as derivadas segundas de (5.25), pelas diferenc¸as de segunda ordem ∆2u de modo que para h = k, obtemos: u(x− h, y)− 2u(x, y) + u(x+ h, y) h2 + u(x, y − h)− 2u(x, y) + u(x, y + h) h2 = 0 , para cada par (x, y) em R. Assim, por exemplo, para o ponto u1 = u(1, 2) da figura anterior vale: u(0, 2)− 2u1 + u2 12 + u4 − 2u1 + u(1, 3) 12 = 0 . Considerando todos os pontos da figura anterior obtemos um sistema de 6 equac¸o˜es lineares nas inco´gnitas:u1, u2, . . . , u6. Resolva-o por me´todo nume´rico a` sua escolha, com garantia de convergeˆncia. 5.4 - Considere a malha quadrada da figura a seguir, cujos bordos AC e BD sa˜o mantidos a` temperatura de 20oC, o bordo AB, a` 40oC, e CD a` 10oC, com o uso de isolantes te´rmicos em A,B,C,D. 20oC C 10oC D 20oC B40oCA 543210 5 4 3 2 1 0 i j@ @ d Para determinar as temperaturas de pontos interiores da malha, pode-se supor que a temperatura em cada ponto e´ igual a` me´dia aritme´tica dos quatro pontos cont´ıguos. Por exemplo: T32 = T22 + T31 + T33 + T42 4 . CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 188 As 16 relac¸o˜es deste tipo permitira˜o formar um sistema de 16 equac¸o˜es a 16 inco´gnitas Tij. Resolva-o por me´todo nume´rico com garantia de convergeˆncia. 5.5 - Suponha que uma membrana com dimenso˜es 80 cm × 80 cm tenha cada um dos seus lados man- tidos a uma temperatura constante. Usando a teoria de equac¸o˜es diferenciais parciais pode-se formular uma equac¸a˜o que determina o valor da temperatura no interior dessa membrana. Essa equac¸a˜o diferen- cial pode ser simplificada colocando-se uma malha com 9 pontos sobre essa membrana e calculando-se a temperatura nos pontos da malha, como mostra a figura: u9u8u7 u6u5u4 a a a aaa a a a u3u2u1 0oC 50oC 100oC 50oC onde u1, u2, ..., u9 sa˜o os valores da temperatura em cada ponto da malha. O sistema de equac¸o˜es resultante e´ dado por: −4 1 1 1 −4 1 1 1 −4 1 1 −4 1 1 1 1 −4 1 1 1 1 −4 1 1 −4 1 1 1 −4 1 1 1 −4 u1 u2 u3 u4 u5 u6 u7 u8 u9 = −50 −50 −150 0 0 −100 −50 −50 −150 . Encontre a soluc¸a˜o do sistema por me´todo nume´rico a` sua escolha, com garantia de convergeˆncia. 5.6 - Suponha que tenhamos um circuito que consiste de fontes de tensa˜o independantes e resistores concentrados como mostra a figura: +- R8 -+ V5 R11 + - V6i6R10i5R9i4 R6R3R7 V4 - + - + V1 i1 R2 i2 R4 i3 + - V3 R5V2R1 ffffff ffffff CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 189 A ana´lise completa de tal circuito requer a determinac¸a˜o dos valores das correntes da malha ik, indicados na figura, para os valores especificados das fontes de tensa˜o e dos resistores. e´ necessa´rio, enta˜o, formular um sistema de equac¸o˜es simultaˆneas com as quantidades ik como inco´gnitas. Cada uma das equac¸o˜es de tal sistema e´ determinada pela aplicac¸a˜o da lei de Kirchoff em torno das malhas. Por exemplo, para a malha definida pela corrente i1, temos: R1i1 +R2(i1 − i2) +R7(i1 − i4) = V1 . Fazendo um ca´lculo semelhante para as outras malhas obtemos um sistema de 6 equac¸o˜es nas inco´gnitas i1, i2, i3, i4, i5, i6. Resolver este problema para os seguintes dados: R = (10, 13, 7, 12, 20, 5, 6, 10, 8, 9, 20)t , e V = (29, 32, 37, 24, 24, 34)t , onde R em Ohms e V em Volts. 5.7 - Numa trelic¸a estaticamente determinada com juntas articuladas, como dada na figura a seguir: 45o30o45o 500 F8F6F2 F9F7F5 F3 F1 F4 5001000 ? * * ?? I ? 6 ? � � � � � � � @ @ @ @ @ @ @ d d d a tensa˜o, (Fi ), em cada componente pode ser obtida da seguinte equac¸a˜o matricial: 0.7071 0 0 −1 −0.8660 0 0 0 0 0.7071 0 1 0 0.5 0 0 0 0 0 1 0 0 0 −1 0 0 0 0 0 −1 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0.7071 0 0 0 0 0 0 0 0 −0.7071 0 0 0 0 0.8660 1 0 −1 0 0 0 0 0 −0.5 0 −1 0 0 0 0 0 0 0 0 0 1 0.7071 F = 0 −1000 0 0 500 0 0 −500 0 . Observe que as equac¸o˜es sa˜o obtidas fazendo-se a soma de todas as forc¸as horizontais ou verticais em cada junta igual a zero. Ale´m disso a matriz dos coeficientes e´ bastante esparsa, e assim um candidato natural e´ o me´todo de Gauss-Seidel. a) As equac¸o˜es podem ser rearranjadas de modo a se obter uma matriz estritamente diagonal- mente dominante? CAPI´TULO 5. SOLUC¸A˜O DE SISTEMAS LINEARES: ME´TODOS ITERATIVOS 190 b) E´ o sistema convergente se iniciarmos com um vetor com todas as componentes iguais a zero? c) Resolva o sistema pelo me´todo de Gauss-Seidel, partindo do vetor nulo e obtendo a soluc¸a˜o com precisa˜o de 10−4. 5.8 - O circuito mostrado a seguir e´ frequentemente usado em medidas ele´tricas e e´ conhecido com uma ”Ponte de Wheatstone”. I6 D CB A R5 R4 R3 R2R1 I5 I4 I3 I2I1 E ff @ @ R � � @ @R � � - @ @ @@ @ @ @@ � � � � � � �@ @ @ @ @ @ @ � � ��� � �� � � �� As equac¸o˜es que governam o sistema sa˜o obtidas a partir da lei de Kirchoff. Para a malha fechada atrave´s da bateria e ao longo de ABD, temos: I1R1 + I4R4 − E = 0 (1) Para a a malha fechada ABCA: I1R1 + I5R5 − I2R2 = 0 (2) Para a malha fechada BCDB: I5R5 + I3R3 − I4R4 = 0 (3) Para o no´ A: I6 = I1 + I2 (4) Para o no´ B: I1 = I5 + I4 (5) Para o no´ C: I3 = I2 + I5 (6) onde Ri representam as resisteˆncias; Ii as correntes e E a voltagem aplicada. Determinar as correntes no problema proposto quando: E = 20 V olts, R1 = 10 Ohms e R2 = R3 = R4 = R5 = 100 Ohms. Cap´ıtulo 6 Programac¸a˜o Matema´tica Com o objetivo de facilitar o aprendizado do estudante, pretendemos aqui relembrar alguns conceitos ba´sicos, que ira˜o facilitar a compreensa˜o dos me´todos nume´ricos apresentados nos pro´ximos cap´ıtulos. E´ claro que esperamos que o aluno para fazer um curso sobre me´todos nume´ricos ja´ possua conhecimento de alguns conceitos, principalmente, da a´lgebra linear e do ca´lculo diferencial e integral. Como e´ imposs´ıvel relembrar todos os conceitos dessas duas a´reas, salientamos que, a maioria dos conceitos aqui apresentados sa˜o de a´lgebra linear, e uma ana´lise mais profunda pode ser encontrado em livros dessa a´rea. 6.1 Espac¸o Vetorial Pretendemos aqui definir importantes noc¸o˜es de dependeˆncia linear, base, dimensa˜o e mudanc¸a de base em um espac¸o vetorial. Este Cap´ıtulo e´ do Marcos Arenales 191 Cap´ıtulo 7 Determinac¸a˜o Nume´rica de Auto-Valores e Auto-Vetores 7.1 Introduc¸a˜o Auto-valores e auto-vetores esta˜o presentes em diferentes ramos da matema´tica incluindo formas quadra´ticas, sistemas diferenciais; problemas de otimizac¸a˜o na˜o linear, e podem ser usados para resolver problemas de diversos campos, como economia, teoria da informac¸a˜o, ana´lise estrutural, eletroˆnica, teoria de controle e muitos outros. Nosso objetivo nesse cap´ıtulo e´ apresentar me´todos nume´ricos para a determinac¸a˜o dos auto-valores e correspondentes auto-vetores de uma matriz A de ordem n. Sugerimos ao leitor rever a sec¸a˜o sobre auto-valores e auto-vetores dada no Cap´ıtulo 1. A menos que a matriz seja de ordem baixa ou que tenha muitos elementos iguais a zero, a expansa˜o direta do determinante para a determinac¸a˜o do polinoˆmio caracter´ıstico, ver exemplo 1.22, e´ ineficiente. Assim os me´todos nume´ricos que estudaremos sa˜o obtidos sem fazer uso do ca´lculo do determinante. Tais me´todos podem ser divididos em treˆs grupos: i) me´todos que determinam o polinoˆmio caracter´ıstico, ii) me´todos que determinam alguns auto-valores, iii) me´todos que determinam todos os auto-valores. Nos dois u´ltimos casos determinamos os auto-valores sem conhecer a expressa˜o do polinoˆmio carac- ter´ıstico. Em relac¸a˜o aos me´todos do grupo i), uma vez determinado o polinoˆmio caracter´ıstico de A, para calcular os auto-valores devemos utilizar me´todos nume´ricos para determinac¸a˜o de zeros de polinoˆmio, (ver Cap´ıtulo 3). Nessa classe encontram-se, entre outros, os me´todos de Leverrier e Leverrier-Faddeev. Os me´todos do grupo ii), chamados iterativos, sa˜o usados se na˜o estamos interessados em todos os auto-valores de A. Incluem-se nessa classe os me´todos das poteˆncias, poteˆncia inversa. Em relac¸a˜o aos me´todos do grupo iii), podemos divid´ı-los em duas classes: a) me´todos nume´ricos para matrizes sime´tricas, b) me´todos nume´ricos para matrizes na˜o sime´tricas. Na classe a), inclui-se entre outros, o me´todo de Jacobi, o qual reduz uma dada matriz sime´trica numa forma especial, cujos auto-valores sa˜o facilmente determinados. Entre os me´todos da classe b) podemos citar os me´todos de Rutishauser (me´todo LR) e o de Francis (me´todo QR) os quais transformam a 192 CAPI´TULO 7. DETERMINAC¸A˜O NUME´RICA DE AUTO-VALORES E AUTO-VETORES 193 matriz dada numa matriz triangular superior. Todos os me´todos do grupo iii) fazem uso de uma se´rie de transformac¸o˜es de similaridade e assim sa˜o algumas vezes referenciados como me´todos de transformac¸o˜es ou me´todos diretos. Maiores detalhes sobre essas te´cnicas, bem como sobre a teoria desses me´todos podem ser encontradas em [Wilkinson,1965]. Descreveremos e exemplificaremos cada um dos me´todos nume´ricos mencionados acima, iniciando com aqueles que determinam o polinoˆmio caracter´ıstico. Antes pore´m precisamos do seguinte resultado. Teorema 7.1 - (Teorema de Newton ) - Seja o polinoˆmio: P (x) = a0xn + a1xn−1 + . . . + an−1x + an , cujas ra´ızes sa˜o: x1, x2, . . . , xn . Seja ainda: sk = n∑ i=1 xki , 1 ≤ k ≤ n , enta˜o: k−1∑ i=0 aisk−1 + k ak = 0 , k = 1, 2, . . . , n . Prova: A prova deste teorema pode ser encontrada em [Jennings,19..]. Atrave´s desse teorema vemos que existe uma relac¸a˜o entre os coeficientes de um polinoˆmio e as somas das poteˆncias das suas ra´ızes. Assim, conhecidas as somas das poteˆncias das ra´ızes do polinoˆmio podemos determinar os coeficientes do mesmo. Exemplo 7.1 - Sejam s1 = 6, s2 = 14, s3 = 36 as somas das poteˆncias das ra´ızes de um polinoˆmio P (x). Determinar P (x). Soluc¸a˜o: Pelo teorema 7.1, temos: k = 1 ⇒ a0s1 + a1 = 0 ⇒ a1 = −a0s1 k = 2 ⇒ a0s2 + a1s1 + 2a2 = 0 ⇒ 2a2 = −a0s2 − a1s1 k = 3 ⇒ a0s3 + a1s2 + a2s1 + 3a3 = 0 ⇒ ⇒ 3a3 = −a0s3 − a1s2 − a2s1 Tomando o coeficiente do termo de maior grau do polinoˆmio igual a 1, isto e´, fazendo a0 = 1, obtemos por substituic¸a˜o nas expresso˜es anteriores que: a1 = −6 , a2 = 11 , a3 = 6 . Portanto, o polinoˆmio procurado e´: P (x) = x3 − 6x2 + 11x− 6 . Logo, o conhecimento dos sk, k = 1, . . . , n, proporciona a determinac¸a˜o dos ak, k = 1, 2, . . . , n. Ob- serve que nesse exemplo as ra´ızes do polinoˆmio sa˜o: x1 = 1, x2 = 2 e x3 = 3. Para os me´todos nume´ricos descritos a seguir usaremos a seguinte notac¸a˜o para o polinoˆmio carac- ter´ıstico de uma matriz A, de ordem n: P (λ) = (−1)n [λn − p1λn−1 − p2λn−2 − . . .− pn−1λ− pn] . (7.1) CAPI´TULO 7. DETERMINAC¸A˜O NUME´RICA DE AUTO-VALORES E AUTO-VETORES 194 7.2 Me´todo de Leverrier O Me´todo de Leverrier fornece o polinoˆmio caracter´ıstico de uma matriz A de ordem n. Seja A uma matriz quadrada de ordem n. Se λ1, λ2, . . . , λn sa˜o os auto-valores da matriz A, isto e´, se λ1, λ2, . . . λn sa˜o os zeros do polinoˆmio (7.1) e se sk = n∑ i=1 λki , 1 ≤ k ≤ n , enta˜o, pelo Teorema 7.1, temos: kpk = sk − p1 sk−1 − . . .− pk−1s1 , 1 ≤ k ≤ n . (7.2) Portanto, se conhecermos os sk, 1 ≤ k ≤ n, poderemos determinar os coeficientes p1, p2, . . . , pn de P (λ). Vejamos enta˜o como determinar as somas parciais sk. Fazendo expansa˜o direta do determinante de A− λI, o coeficiente de λn−1 em P (λ) e´ (−1)n−1(a11 + a22 + . . . + ann). Por outro lado esse mesmo coeficiente em (7.1) e´ (−1)n−1p1. Logo devemos ter: p1 = a11 + a22 + . . .+ ann . A soma dos elementos da diagonal principal de uma matriz A e´ conhecida como trac¸o de A, cuja notac¸a˜o e´ tr(A). Ale´m disso, de (7.2), s1 = p1, e assim: s1 = tr (A) , isto e´, a soma dos auto-valores da matriz A e´ igual ao trac¸o de A. Enta˜o, desde que os auto-valores de Ak sa˜o a ka¯ poteˆncia dos auto-valores de A, (ver exerc´ıcio 1.26), temos: sk = tr(Ak) . Assim os nu´meros s1, s2, . . . , sn sa˜o obtidos atrave´s do ca´lculo das poteˆncias de A, e (7.2) pode ser usada para determinar os coeficientes do polinoˆmio caracter´ıstico. Determinando as ra´ızes desse polinoˆmio por qualquer dos me´todos nume´ricos estudados no Cap´ıtulo 3, obtemos os auto-valores de A. Exemplo 7.2 - Seja: A = 1 1 −10 0 1 −1 1 0 . Determinar seus auto-valores usando o Me´todo de Leverrier. Soluc¸a˜o: Temos: s1 = tr(A) = 3 , s2 = tr(A2) , A2 = A ·A = 2 0 0−1 1 0 −1 −1 2 , ⇒ s2 = 3 , s3 = tr(A3) , A3 = A2 ·A = 2 2 −2−1 −1 2 −3 1 0 , ⇒ s3 = −3 . CAPI´TULO 7. DETERMINAC¸A˜O NUME´RICA DE AUTO-VALORES E AUTO-VETORES 195 Usando (7.2), obtemos: p1 = s1 ⇒ p1 = 1 , 2p2 = s2 − p1s1 ⇒ p2 = 2 , 3p3 = s3 − p1s2 − p2s1 ⇒ p3 = −2 . De (7.1), segue que: P (λ) = (−1)3(λ3 − p1 λ2 − p2λ− p3) = (−1)3 (λ3 − λ2 + 2λ− 2) = −λ3 + 2λ2 − 2λ+ 2 . Para determinar os auto-valores de A basta determinar os zeros de P (λ). E´ fa´cil verificar que λ = 1 e´ uma raiz de P (λ). Usando o algoritmo de Briot-Ruffini-Horner, (Cap´ıtulo 3), obtemos: −1 1 2 −2 1 −1 0 2 −1 0 2 0 Assim, P (λ) = (λ− 1)(−λ2 + 2). Logo os auto-valores de A sa˜o: λ1 = 1, λ2 = − √ 2 e λ3 = √ 2. Exerc´ıcios 7.1 - Usando o me´todo de Leverrier, determinar o polinoˆmio caracter´ıstico e os auto-valores do operador T : IR3 → IR3, definido por: T (x, y, z) = (2x+ y, y − z, 2y + 4z) . 7.2 -Seja: A = 1 −3 33 −5 3 6 −6 4 . Determinar seu polinoˆmio caracter´ıstico e seus auto-valores pelo processo de Leverrier. 7.3 Me´todo de Leverrier-Faddeev Uma modificac¸a˜o do me´todo de Leverrier, devida a Faddeev, simplifica os ca´lculos dos coeficientes do polinoˆmio caracter´ıstico e fornece, em alguns casos, os auto-vetores de A. Tal me´todo e´ conhecido por Me´todo de Leverrier-Faddeev. Para descrever tal me´todo, definimos uma sequeˆncia de matrizes: A1, A2, . . . , An, do seguinte modo: A1 = A , q1 = trA1 , B1 = A1 − q1I ; A2 = AB1 , q2 = trA2 2 , B2 = A2 − q2I , A3 = AB2 , q3 = trA3 3 , B3 = A3 − q3I ; ... An = ABn−1 , qn = trAn n , Bn = An − qnI . (7.3) CAPI´TULO 7. DETERMINAC¸A˜O NUME´RICA DE AUTO-VALORES E AUTO-VETORES 196 Propriedades da sequeˆncia: A1, A2, . . . , An 1a¯) Os termos qk obtidos na sequeˆncia (7.3), sa˜o os coeficientes do polinoˆmio caracter´ıstico (7.1), isto e´: qk = pk, k = 1, 2, . . . , n . Prova: A prova sera´ feita por induc¸a˜o. a) Desde que A = A1, segue que: q1 = tr(A1) = tr(A) = p1. b) Suponhamos que: qi = pi, i = 1, 2, . . . , k − 1. c) Provemos que: qk = pk. Por (7.3), temos: A1 = A , A2 = AB1 = A (A1 − q1I) = A (A− q1I) = A2 − q1A , A3 = AB2 = A (A2 − q2I) = A ( A2 − q1A− q2I ) = A3 − q1A2 − q2A , ... Ak = ABk−1 = A (Ak−1 − qk−1I) = Ak − q1Ak−1 − q2Ak−2 − . . .− qk−1A . Desde que qi = pi, i = 1, 2, . . . , k − 1, (hipo´tese de induc¸a˜o), obtemos: Ak = Ak − p1Ak−1 − p2Ak−2 − . . .− pk−1A . (7.4) Aplicando trac¸o em ambos os membros da igualdade (7.4), segue que: tr(Ak) = tr ( Ak )− p1tr (Ak−1)− p2tr (Ak−2)− . . .− pk−1tr(A) . Agora, desde que si = tr(Ai), i = 1, 2, . . . , k, e, por (7.3) qk = tr(Ak) k , obtemos: kqk = sk − p1sk−1 − p2sk−2 − . . .− pk−2s2 − pk−1s1 . (7.5) Comparando (7.5) com (7.2), obtemos: qk = pk , o que completa a prova. 2a¯) Se A e´ uma matriz de ordem n, enta˜o: Bn = θ (matriz nula) . Prova: Pelo Teorema de Cayley-Hamilton, (Teorema 1.8), temos: An − p1 An−1 − . . . − pn−1 A − pn I = θ . Mas, por (7.3), e usando a 1a¯propriedade, segue que: Bn = An − pnI . Fazendo k = n em (7.4) e substituindo o valor de An, na expressa˜o anterior, obtemos: Bn = An − p1An−1 − . . .− pn−2A2 − pn−1A − pnI = θ . CAPI´TULO 7. DETERMINAC¸A˜O NUME´RICA DE AUTO-VALORES E AUTO-VETORES 197 3a¯) Se A e´ uma matriz na˜o singular, de ordem n, enta˜o: A−1 = 1 pn Bn−1 . Prova: De Bn = θ e Bn = An − pnI, temos: An = pnI . Mas, por (7.3), An = ABn−1 . Logo: ABn−1 = pnI . Se A e´ na˜o singular enta˜o existe A−1. Assim, pre´-multiplicando ambos os membros da igualdade anterior por A−1, segue que: A−1 = 1 pn Bn−1 . Observac¸o˜es: a) Com o me´todo de Leverrier-Faddeev, obtemos o polinoˆmio caracter´ıstico de A. Para determinar seus auto-valores basta determinar os zeros de P (λ). b) Se ao fazer os ca´lculos Bn resultar numa matriz diferente da matriz nula, voceˆ tera´ cometido erros de ca´lculo. c) Como Bn = θ e como Bn = An − pnI enta˜o An e´ uma matriz diagonal com todos os elementos na˜o nulos iguais a pn. d) Se A e´ singular enta˜o pn = 0. Nesse caso λ = 0 e´ um auto-valor de A. Ca´lculo dos Auto-Vetores Sejam λ1, λ2, . . . , λn auto-valores distintos de A. Mostraremos a seguir que cada coluna na˜o nula da matriz: Qk = λn−1k I + λ n−2 k B1 + . . . + λkBn−2 + Bn−1 , (7.6) e´ um auto-vetor correspondente ao auto-valor λk. Observac¸o˜es: 1) Em (7.6), Bi, i = 1, . . . , n − 1, sa˜o as matrizes calculadas para a determinac¸a˜o dos coeficientes do polinoˆmio caracter´ıstico, isto e´, sa˜o as matrizes obtidas em (7.3), e λk e´ o k-e´simo auto-valor de A. 2) Pode-se provar que Qk e´ matriz na˜o nula se os auto-valores de A sa˜o distintos. 3) Pode ocorrer que mesmo com λi iguais a matriz Qk na˜o seja nula. Provemos agora que cada coluna na˜o nula de Qk e´ um auto-vetor correspondente ao auto-valor λk. Temos: (λkI −A) Qk = (λkI −A) ( λn−1k I + λ n−2 k B1 + . . . + λkBn−2 +Bn−1 ) = λnkI + λ n−1 k (B1 −A) + λn−2k (B2 −AB1) + . . . + λk (Bn−1 − ABn−2) − ABn−1 = λnkI − p1λn−1k I − p2λn−2k I − . . .− pn−1λkI − pnI = θ , CAPI´TULO 7. DETERMINAC¸A˜O NUME´RICA DE AUTO-VALORES E AUTO-VETORES 198 desde que λk e´ auto valor de A e portanto e´ raiz do polinoˆmio caracter´ıstico. Assim, acabamos de mostrar que: AQk = λk Qk , Portanto, constru´ıdas as matrizes Bi e determinados todos os auto-valores da matriz A, para obter os auto-vetores correspondentes ao auto-valor λk basta calcular a matriz Qk usando (7.6). Entretanto, observe que se u e´ alguma coluna na˜o nula de Qk, enta˜o, podemos escrever que: Au = λku . isto e´, u e´ auto-vetor de A correspondente ao auto-valor λk. Assim, ao inve´s de determinarmos a matriz Qk, e´ muito mais vantajoso calcularmos apenas uma coluna u de Qk, da seguinte maneira: Fazemos, u0 = e ui = λkui−1 + bi , i = 1, 2, . . . , n− 1 , (7.7) onde e e´ uma coluna adotada da matriz identidade e bi e´ sua correspondente coluna da matriz Bi, isto e´, se adotamos e como sendo a i-e´sima coluna da matriz identidade enta˜o b1, b2, . . . , bn−1 em (7.7) sera˜o, respectivamente, a i-e´sima coluna das matrizes B1, B2, . . . , Bn−1. Logo, u = un−1 e´ o auto-vetor correspondente ao auto-valor λk. Note que em (7.7), i varia de 1 ate´ n− 1 pois Bn = θ. Observe que se calcularmos ate´ un−1 e este resultar no vetor nulo, devemos adotar outra coluna da matriz identidade e refazer os ca´lculos, pois por definic¸a˜o o auto-vetor e´ um vetor na˜o nulo. Exemplo 7.3 - Considere a matriz dada no exemplo 7.2. Usando o me´todo de Leverrier-Faddeev, de- terminar: a) seu polinoˆmio caracter´ıstico, b) seus auto-valores e correspondentes auto-vetores, c) sua inversa. Soluc¸a˜o: a) Para determinar o polinoˆmio caracter´ıstico devemos construir a sequeˆncia A1, A2, A3. Assim, CAPI´TULO 7. DETERMINAC¸A˜O NUME´RICA DE AUTO-VALORES E AUTO-VETORES 199 usando (7.3), obtemos: A1 = A = 1 1 −10 0 1 −1 1 0 , p1 = tr(A1) ⇒ p1 = 1 , B1 = A1 − p1I ⇒ B1 = 0 1 −10 −1 1 −1 1 −1 , A2 = AB1 ⇒ A2 = 1 −1 1−1 1 −1 0 −2 2 , p2 = tr(A2) 2 ⇒ p2 = 42 ⇒ p2 = 2 , B2 = A2 − p2I ⇒ B2 = −1 −1 1−1 −1 −1 0 −2 0 , A3 = AB2 ⇒ A3 = −2 0 00 −2 0 0 0 −2 , p3 = tr(A3) 3 ⇒ p3 = −63 ⇒ p3 = −2 , B3 = A3 − p3I ⇒ B3 = θ . Usando (7.1), segue que: P (λ) = (−1)3(λ3 − p1 λ2 − p2λ− p3) = (−1)3 (λ3 − λ2 + 2λ− 2) = −λ3 + 2λ2 − 2λ+ 2 . Para determinar os auto-valores de A basta determinar os zeros de P (λ). Ja´ fizemos esses ca´lculos no exemplo 7.2, e obtivemos: λ1 = 1, λ2 = − √ 2 e λ3 = √ 2. b) Determinemos agora os auto-vetores correspondentes a esses auto-valores. b.1) Para λ1 = 1, seja e = (1, 0, 0)t. Assim: u0 = e ⇒ u0 = 10 0 , u1 = λ1u0 + b1 ⇒ u1 = 1 10 0 + 00 −1 ⇒ u1 = 10 −1 , u2 = λ1u1 + b2 ⇒ u2 = 1 10 −1 + −1−1 0 ⇒ u2 = 0−1 −1 . Logo u = (0, −1, −1)t e´ um auto-vetor correspondente ao auto-valor λ1 = 1. CAPI´TULO 7. DETERMINAC¸A˜O NUME´RICA DE AUTO-VALORES E AUTO-VETORES 200 Observe que se adotamos e = (0, 1, 0)t obtemos u2 = (0, −1, −1)t que e´ auto-vetor de A correspon- dente ao auto-valor λ1 = 1; mas se adotamos e = (0, 0, 1)t obtemos u2 = (0, 0, 0)t e assim com esse vetor inicial na˜o obtemos uma resposta va´lida. b.2) Para λ2 = − √ 2, seja e = (1, 0, 0)t. Assim, u0 = e ⇒ u0 = 10 0 , u1 = λ2u0 + b1 ⇒ u1 = − √ 2 10 0 + 00 −1 ⇒ u1 = −√20 −1 , u2 = λ2u1 + b2 ⇒ u2 = − √ 2 −√20 −1 + −1−1 0 ⇒ u2 = 1−1√ 2 . Logo u = (1, −1, √2)t e´ um auto-vetor correspondente ao auto-valor λ2 = − √ 2. Novamente, observe que se adotamos e = (0, 1, 0)t obtemos u2 = (−1 − √ 2, 1 + √ 2, −2 − √2)t, enquanto que e = (0, 0, 1)t fornece u2 = (1 + √ 2, −1 − √2, 2 + √2)t. Ambos sa˜o auto-vetores de A correspondentes ao auto-valor λ2 = − √ 2. b.3) Para λ3 = √ 2, seja e = (1, 0, 0)t. Assim: u0 = e ⇒ u0 = 10 0 , u1 = λ3u0 + b1 ⇒ u1 = √ 2 10 0 + 00 −1 ⇒ u1 = √20 −1 , u2 = λ3u1 + b2 ⇒ u2 = √ 2 √20 −1 + −1−1 0 ⇒ u2 = 1−1 −√2 . Logo u = (1, −1, −√2)t e´ um auto-vetor correspondente ao auto-valor λ3 = √ 2. Observe que se adotamos e = (0, 1, 0)t obtemos u2 = (−1 + √ 2, 1−√2, −2 +√2)t, enquanto que e = (0, 0, 1)t fornece u2 = (1 − √ 2, −1 + √2, 2 − √2)t. Novamente, ambos sa˜o auto-vetores de A correspondentes ao auto-valor λ3 = √ 2. Finalmente observe que para cada auto-valor λk, a escolha do vetor inicial produz exatamente a co- luna correspondente da matriz Qk. Entretanto, como pode ser observado nesse exemplo, na˜o e´ necessa´rio calcular todas as colunas da matriz Qk, isto e´ , basta uma, pois as colunas na˜o nulas de Qk sa˜o mu´ltiplas uma das outras. c) Pela 3a propriedade, temos: A−1 = 1 p3 B2 , CAPI´TULO 7. DETERMINAC¸A˜O NUME´RICA DE AUTO-VALORES E AUTO-VETORES 201 e assim: A−1 = 1 −2 −1 −1 1−1 −1 −1 0 −2 0 ⇒ A−1 = 0.5 0.5 −0.50.5 0.5 0.5 0 1 0 . Exerc´ıcios 7.3 -Seja: A = 3 3 −3−1 9 1 6 3 −6 . Usando o me´todo de Leverrier-Faddeev, determinar: a) seu polinoˆmio caracter´ıstico, b) seus auto-valores e correspondentes auto-vetores, c) A−1. 7.4 - Seja T : IR2 → IR2, definido por: T (x, y) = (3x+ 5y, 3y) . Usando o me´todo de Leverrier-Faddeev, determinar seus auto-valores e correspondentes auto-vetores. 7.4 Me´todo das Poteˆncias O Me´todo das Poteˆncias consiste em determinar o auto-valor de maior valor absoluto de uma matriz A, e seu correspondente auto-vetor, sem determinar o polinoˆmio caracter´ıstico. O me´todo e´ u´til na pra´tica, desde que se tenha interesse em determinar apenas alguns auto-valores, de mo´dulo grande, e, que estes estejam bem separados, em mo´dulo, dos demais. Podem surgir complicac¸o˜es caso a matriz A na˜o possua auto-vetores linearmente independentes. O me´todo das poteˆncias baseia-se no seguinte teorema. Teorema 7.2 - Seja A uma matriz real de ordem n e sejam λ1, λ2, . . . , λn seus auto-valores e u1, u2, . . . , un seus correspondentes auto-vetores. Suponha que os auto-vetores sa˜o linearmente independentes, e que: |λ1| > |λ2| ≥ . . . ≥ |λn| . Seja a sequeˆncia yk definida por: yk+1 = Ayk , k = 0, 1, 2, . . . , onde y0 e´ um vetor arbitra´rio, que permite a expansa˜o: y0 = n∑ j=1 cjuj , com cj escalares quaisquer e c1 6= 0, enta˜o: lim k→∞ (yk+1)r (yk)r = λ1 , onde o ı´ndice r indica a r-e´sima componente. Ale´m disso, quando k → ∞, yk tende ao auto-vetor correspondente a λ1. CAPI´TULO 7. DETERMINAC¸A˜O NUME´RICA DE AUTO-VALORES E AUTO-VETORES 202 Prova: Temos por hipo´tese que: y0 = c1u1 + c2u2 + . . . + cnun . (7.8) Agora, lembrando que Aui = λiui, obtemos: y1 = Ay0 = c1Au1 + c2Au2 + . . .+ cnAun = c1λ1u1 + c2λ2u2 + . . .+ cnλnun = λ1 [ c1u1 + c2 λ2 λ1 u2 + . . .+ cn λn λ1 un ] , y2 = Ay1 = A2y0 = λ1 [ c1Au1 + c2 λ2 λ1 Au2 + . . . + cn λn λ1 Aun ] = λ1 [ c1λ1u1 + c2 λ2 λ1 λ2u2 + . . . + cn λn λ1 λnun ] = λ21 [ c1u1 + c2 ( λ2 λ1 )2 u2 + . . . + cn ( λn λ1 )2 un ] , ... yk = Ayk−1 = Aky0 = λk1 [ c1u1 + c2 ( λ2 λ1 )k u2 + . . . + cn ( λn λ1 )k un ] . Desde que, por hipo´tese, |λ1| > |λ2| ≥ . . . ≥ |λn|, temos enta˜o para i = 1, . . . , n que ∣∣∣ λiλ1 ∣∣∣ < 1, e portanto quando k →∞, ( λi λ1 )k → 0. Logo, o vetor: [ c1u1 + c2 ( λ2 λ1 )p u2 + . . . + cn ( λn λ1 )p un ] , converge para c1u1 que e´ um mu´ltiplo do auto-vetor correspondente ao auto-valor λ1. Assim, λ1 e´ obtido de: λ1 = lim k→∞ (yk+1)r (yk)r = lim k→∞ ( Ak+1y0 ) r (Aky0)r , r = 1, 2, . . . n . (7.9) e isso conclui a prova. Observe enta˜o que, teoricamente, a partir de (7.9) obtemos o auto-valor de maior valor absoluto de uma matriz A. Na pra´tica, para obter λ1, utilizamos o algoritmo dado a seguir. A partir de um vetor yk, arbitra´rio, na˜o nulo, constru´ımos dois outros vetores yk+1 e zk+1, do seguinte modo: zk+1 = Ayk yk+1 = 1 αk+1 zk+1, onde αk+1 = max 1≤r≤n | (zk+1)r | , CAPI´TULO 7. DETERMINAC¸A˜O NUME´RICA DE AUTO-VALORES E AUTO-VETORES 203 ou seja: dado um vetor y0 qualquer, na˜o nulo, constru´ımos a sequeˆncia: z1 = Ay0 y1 = 1 α1 z1 = 1 α1 Ay0 z2 = Ay1 = 1 α1 A2y0 y2 = 1 α2 z2 = 1 α1α2 A2y0 z3 = Ay2 = 1 α1α2 A3y0 ... yk = 1 αk zk = 1 α1α2 . . . αk Aky0 zk+1 = Ayk = 1 α1α2 . . . αk Ak+1y0. Assim, para obtermos λ1, calculamos: lim k→∞ (zk+1)r (yk)r = lim k→∞ ( Ak+1y0 ) r (Aky0)r = λ1 . Observe que podemos garantir que o valor resultante fornece λ1 desde que obtemos a mesma expressa˜o dada por (7.9). Assim, pelo algoritmo, temos que: lim k→∞ (zk+1)r (yk)r = λ1 . (7.10) Observac¸o˜es: a) No limite, todas as componentes de (zk+1)r (yk)r de (7.10), tendem a λ1. Entretanto, na pra´tica, uma das componentes converge mais rapidamente do que as outras. Assim, quando uma das compo- nentes satisfizer a precisa˜o desejada teremos o auto-valor procurado. Ale´m disso, a velocidade de convergeˆncia depende de λ2 λ1 . Portanto, quanto maior for |λ1| quando comparado com |λ2|, mais ra´pida sera´ a convergeˆncia. b) Para obtermos λ1 com uma precisa˜o �, em cada passo calculamos aproximac¸o˜es para λ1 usando (7.10). O teste do erro relativo para cada componente de λ1, isto e´: |λ(k+1)1 − λ(k)1 |r |λ(k+1)1 |r < � , e´ usado como crite´rio de parada. c) Quando todas as componentes de (7.10) forem iguais, enta˜o o vetor yk dessa iterac¸a˜o e´ o auto-vetor correspondente ao auto-valor λ1. d) Se algum vetor resultar no vetor nulo, o me´todo falha. Tal acontecimento deve ocorrer se as hipo´teses na˜o foram satisfeitas. CAPI´TULO 7. DETERMINAC¸A˜O NUME´RICA DE AUTO-VALORES E AUTO-VETORES 204 e) No Teorema 7.2 e´ feita a hipo´tese de c1 6= 0. Se c1 = 0, enta˜o a prova do Teorema 7.2 indica que, teoricamente, o vetor yk converge para u2. Entretanto, na pra´tica, para matrizes de ordem n ≥ 3, que satisfac¸am as demais condic¸o˜es do citado teorema, o me´todo funciona sempre, pois, mesmo que o vetor y0 na˜o tenha componentes na direc¸a˜o de u1, e desde que o me´todo envolve a cada iterac¸a˜o uma divisa˜o, os erros de arredondamento da ma´quina fara˜o com que y1 passe a ter componente nessa direc¸a˜o, apo´s uma ou duas iterac¸o˜es. Exemplo 7.4 - Usando o me´todo das poteˆncias determinar o auto-valor de maior valor absoluto da matriz: A = 3 0 12 2 2 4 2 5 , com precisa˜o de 10−2. Soluc¸a˜o: Tomemos y0 = (1, 1, 1)t. Temos: z1 = Ay0 = 46 11 ; α1 = max | (z1)r | = max(|4|, |6|, |11|) = 11 . y1 = 1 α1 z1 = 0.36360.5455 1 , z2 = Ay1 = 2.09083.8182 7.5454 . Podemos enta˜o calcular uma 1a¯ aproximac¸a˜o para λ1, usando (7.10). Logo: λ (1) 1 = (z2)r (y1)r = 5.75036.9995 7.5454 . Agora desde que α2 = max{|2.0908|, |3.8182|, |7.5454|} = 7.5454, obtemos: y2 = 1 α2 z2 = 0.27710.5060 1 , z3 = Ay2 = 1.83133.5662 7.1204 , Novamente, obtemos uma nova aproximac¸a˜o para λ1, fazendo: λ (2) 1 = (z3)r (y2)r = 6.60887.0478 7.1204 . Calculando enta˜o o erro relativo, obtemos: |λ(2)1 − λ(1)1 |r |λ(2)1 |r ' 0.130.07 0.13 , o qual possui todas as componentes maiores que 10−2. Assim, devemos fazer uma nova iterac¸a˜o. Agora desde que α3 = 7.1204, segue que: y3 = 1 α3 z3 = 0.25720.5008 1 , z4 = Ay3 = 1.82563.5160 7.0304 ⇒ λ(3)1 = (z4)r (y3)r = 7.09807.0208 7.0304 . CAPI´TULO 7. DETERMINAC¸A˜O NUME´RICA DE AUTO-VALORES E AUTO-VETORES 205 Novamente, calculando o erro relativo: |λ(3)1 − λ(2)1 |r |λ(2)1 |r ' 0.0690.004 0.013 , vemos que a segunda componente e´ menor que 10−2. Portanto, λ1 ' 7.0208 com � < 10−2 e u1 ' 0.25720.5008 1 = y3 . Observac¸o˜es: 1) E´ claro que se desejamos λ1 com precisa˜o maior basta continuar fazendo iterac¸o˜es. 2) Os auto-valores de A sa˜o: 1, 2 e 7 com auto-vetores: (0.5, 1, −1)t, (−1, 0.5, 1)t e (0.25, 0.5, 1)t, respectivamente. 3) O me´todo das poteˆncias deve ser aplicado se o objetivo e´ determinar o auto-valor de maior valor absoluto de uma matriz. A desvantagem desse me´todo e´ que ele fornece apenas um auto-valor de cada vez. Se todos os auto-valores sa˜o procurados devemos aplicar outros me´todos que sa˜o muito mais eficientes. 4) Algumas vezes o maior auto-valor, em mo´dulo, e´ o mais importante, mas se na˜o e´, devemos modificar o me´todo. Em alguns problemas, o mais importante e´ a determinac¸a˜o do auto-valor de menor valor absoluto. Para isso dispomos da seguinte estrate´gia. 7.4.1 Me´todo da Poteˆncia Inversa O Me´todo da Poteˆncia Inversa e´ usado para determinar o auto-valor de menor valor absoluto e seu correspondente auto-vetor de uma matriz A. O me´todo e´ u´til na pra´tica, desde que se tenha interesse em determinar apenas o auto-valor, de menor mo´dulo, e, que este esteja bem separado dos demais. Novamente, o me´todo pode na˜o funcionar caso a matriz A na˜o possua auto-vetores linearmente independentes. O me´todo da poteˆncia inversa e´ semelhante ao me´todo das poteˆncias, com a diferenc¸a que agora assumimos: |λ1| ≥ |λ2| ≥ . . . | ≥ λn−1| > |λn| , e desejamos determinar λn. Sabemos que se λ e´ auto-valor de A, enta˜o λ−1 e´ auto-valor de A−1. Ale´m disso, se |λn| e´ o menor auto-valor de A, enta˜o |λ−1n | e´ o maior auto-valor de A−1. Assim, o me´todo da poteˆncia inversa consiste em calcular pelo me´todo das poteˆncias o auto-valor de maior valor absoluto de A−1, pois assim teremos o menor auto-valor, em mo´dulo, de A. Portanto, dado yk, constru´ımos dois outros vetores yk+1 e zk+1 da seguinte forma : zk+1 = A−1yk yk+1 = 1 αk+1 zk+1, onde αk+1 = max 1≤r≤n | (zk+1)r | , e portanto: λ−1n = (zk+1)r (yk)r . CAPI´TULO 7. DETERMINAC¸A˜O NUME´RICA DE AUTO-VALORES E AUTO-VETORES 206 Note que na pra´tica na˜o e´ necessa´rio calcular A−1, pois de: zk+1 = A−1yk ⇒ Azk+1 = yk , e assim resolvemos o sistema usando a Decomposic¸a˜o LU( ver Cap´ıtulo 4). Este me´todo e´ particular- mente conveniente desde que as matrizes L e U sa˜o independentes de k e portanto basta obteˆ-las uma u´nica vez. Exemplo 7.5 - Deteminar o menor auto-valor, em mo´dulo, da matriz: A = 2 1 02 5 3 0 1 6 , usando o me´todo da poteˆncia inversa. Soluc¸a˜o: Os auto-valores de A sa˜o: λ1 = 7.44437, λ2 = 4.21809 e λ3 = 1.33754. Portanto o maior auto-valor de A−1 e´ λ−13 = 1 1.33754 ' 0.7476, e e´ esse valor que desejamos encontrar. Decompondo A em LU , obtemos: L = 1 0 01 1 0 0 0.25 1 , U = 2 1 00 4 3 0 0 5.25 . Assim, tomando y0 = (1, 1, 1)t em Az1 = y0 ou seja fazendoLUz1 = y0, segue que: z1 = 0.5715−0.1429 0.1905 , α1 = 0.5715 , y1 = 1 α1 z1 = 1−0.2500 0.3333 . Resolvendo agora LUz2 = y1, obtemos: z2 = 0.7024−0.4048 0.1230 ⇒ λ−13 = (z2)r(y1)r = 0.70241.6192 0.3690 . Agora, α2 = 0.7024. Continuando o processo, obtemos: y2 = 1 α2 z2 = 1−0.5763 0.1751 , e de LUz3 = y2 ⇒ z3 = 0.7377−0.4754 0.1084 ⇒ λ−13 = (z3)r (y2)r = 0.73770.8249 0.6192 . Temos : α3 = 0.7377, e assim : y3 = 1 α3 z3 = 1−0.6444 0.1469 e de LUz4 = y3 ⇒ z4 = 0.7454−0.4908 0.1063 . ⇒ λ−13 = (z4)r (y3)r = 0.74540.7617 0.7235 . Finalmente, α4 = 0.7454, e portanto : CAPI´TULO 7. DETERMINAC¸A˜O NUME´RICA DE AUTO-VALORES E AUTO-VETORES 207 y4 = 1 α4 z4 = 1−0.6584 0.1426 e de LUz5 = y4 ⇒ z5 = 0.7471−0.4942 0.1061 , ⇒ λ−13 = (z5)r (y4)r = 0.74710.7506 0.7443 . Logo λ−13 ' 0.7471 e´ o auto-valor de maior valor absoluto de A−1. Portanto 1λ−13 ' 1.3385 e´ o auto-valor de menor valor absoluto de A. 7.4.2 Me´todo das Poteˆncias com Deslocamento Suponha agora que A tem auto-valores λi, reais, com λ1 > λ2 ≥ λ3 ≥ . . . ≥ λn−1 > λn . e considere a sequeˆncia de vetores definida por: zk+1 = (A− qI)yk yk+1 = 1 αk+1 zk+1, onde αk+1 = max 1≤r≤n | (zk+1)r | , onde I e´ a matriz identidade de ordem n e q e´ um paraˆmetro qualquer. Isto e´ chamado Me´todo das Poteˆncias com Deslocamento, porque A − qI tem auto-valores λi − q, isto e´, os auto-valores de A sa˜o deslocados q unidades na reta real. Os auto-vetores de A− qI sa˜o os mesmos da matriz A. Portanto o Teorema 7.2 pode ser aplicado a` matriz A− qI, e pode ser mostrado que yk converge para o auto-vetor correspondente a`quele que maximiza |λi − q|. Portanto se: q < λ1 + λn 2 enta˜o yk → u1 e lim k→∞ (zk+1)r (yk)r → λ1 − q , q > λ1 + λn 2 enta˜o yk → un e lim k→∞ (zk+1)r (yk)r → λn − q , Assim, a escolha apropriada de q pode ser usada para determinar os dois auto-valores extremos, corres- pondendo ao maior e ao menor auto-valor de A. Observe que se q = (λ1+λn)/2 enta˜o λ1−q = −(λn−q), e assim A− qI tem dois auto-valores de mesmo mo´dulo, mas de sinais opostos. Neste caso, a sequeˆncia de vetores oscilara´ entre dois limites os quais sa˜o duas combinac¸o˜es de u1 e u2. O auto-valor e o auto-vetor dominante sa˜o usualmente calculados tomando um deslocamento zero, isto e´, o ca´lculo para determinar λ1 e u1 sa˜o realizados na matriz A, atrave´s do me´todo das poteˆncias. A matriz pode enta˜o ser deslocada de λ1 para estimar o auto-valor λn. Exemplo 7.6 - Determinar o auto-valor de menor valor absoluto da matriz dada no exemplo 7.4, usando o me´todo das poteˆncias com deslocamento. CAPI´TULO 7. DETERMINAC¸A˜O NUME´RICA DE AUTO-VALORES E AUTO-VETORES 208 Soluc¸a˜o: No exemplo 7.4, o auto-valor de maior valor absoluto foi estimado ' 7. Assim, para determinar o auto-valor de menor valor absoluto, vamos aplicar o me´todo das poteˆncias na matriz: A− 7I = −4 0 12 −5 2 4 2 −2 = A∗. Iniciando com y0 = 11 1 , obtemos: z1 = A∗y0 = −3−1 4 ; α1 = max | (z1)r | = 4 . y1 = 1 α1 z1 = −0.75−0.25 1 , z2 = A∗y1 = 4.001.75 −5.50 . Podemos, enta˜o, calcular uma primeira aproximac¸a˜o para λ∗1. Assim: λ ∗(1) 1 = (z2)r (y1)r = −5.33−7.00 −5.50 . Continuando o processo, obteremos: y19 = −0.52−0.94 1 , z20 = A∗y19 = 3.035.71 −5.98 ⇒ λ∗(19)1 = (z20)r (y19)r = −5.92−5.95 −5.98 . Assim, podemos concluir que o auto-valor dominante de A∗ e´ aproximadamente −5.98 com auto-vetor aproximado u∗1 = (−0.52, −0.94, 1)t. Portanto a matriz original possui o mesmo auto-vetor mas seu auto-valor e´ −5.98+7.00 = 1.02. A lentida˜o na convergeˆncia neste caso se deve ao fato que os auto-valores de A∗ sa˜o: −6,−5 e 0 e assim a convergeˆncia e´ governada pelo fator: ( 5 6 )k . Compare com o exemplo 7.4, e 7.5, onde a raza˜o de convergeˆncia e´ ( 2 7 )k e ( 1.33754 4.21809 )k , respectivamente. Em geral, se yk → u1, enta˜o na presenc¸a do deslocamento q, a velocidade de convergeˆncia depende de:( λi − q λ1 − q )k , e assim uma escolha adequada de q pode acelerar a convergeˆncia. Por exemplo, se A e´ uma matriz de ordem 3, com auto-valores: 5, 7 e 10, sem deslocamento a convergeˆncia depende de ( 7 10 )k , mas com um deslocamento de 6 dependera´ de ( 1 4 )k , pois A− 6I tem auto-valores: −1, 1 e 4. CAPI´TULO 7. DETERMINAC¸A˜O NUME´RICA DE AUTO-VALORES E AUTO-VETORES 209 Portanto, na pra´tica na˜o e´ trivial encontrar o melhor valor de q, a menos que alguns dos auto-valores sejam conhecidos a priori. O me´todo das poteˆncias e /ou o me´todo das poteˆncias com deslocamento devem ser utilizados se apenas um ou dois dos auto-valores sa˜o desejados. Se o objetivo e´ determinar mais auto-valores enta˜o o me´todo da poteˆncia inversa com deslocamento pode ser usado, ou seja, como no me´todo da poteˆncia inversa, calculamos: (A− qI)zk+1 = yk , usando a decomposic¸a˜o LU , e assim os auto valores de (A−qI)−1 sera˜o 1(λi − q) . Novamente, o Teorema 7.2 pode ser aplicado a (A − qI)−1 e deduzimos que yk converge para o auto-vetor correspondente ao auto-valor que maximiza 1|λi − q| . Escolhas adequadas dos valores de q nos permitem determinar todos os auto-valores de A, e na˜o somente aqueles correspondentes aos auto-valores extremos. Assim, se o auto-valor pro´ximo a q e´ λj , enta˜o o valor de λj pode ser calculado a partir de: λ¯j = 1 (λj − q) , onde λ¯j e´ o auto-valor de (A− qI)−1, obtido pelo me´todo da poteˆncia inversa com deslocamento q. Exemplo 7.7 - Determinar o segundo maior auto-valor, em valor absoluto, da matriz dada no exemplo 7.4. Soluc¸a˜o: Ja´ determinamos dois auto-valores desta matriz: 7 e 1.02 (Exemplos 7.4 e 7.6). Sabemos que o trac¸o de uma matriz e´ igual a soma dos seus auto-valores . Neste exemplo o trac¸o de A e´ 10 e assim o outro auto-valor e´ aproximadamente 1.98, o qual sera´ tomado como o valor de q na iterac¸a˜o inversa com deslocamento. Assim, montamos a matriz: A− 1.98I = 1.02 0 12 0.02 2 4 2 3.02 , e a decompomos no produto LU , onde: L = 11.9608 1 3.9216 100 1 , U = 1.02 0 10.02 0.0392 −4.8216 . Tomando como vetor inicial y0 = (1, 1, 1)t, e resolvendo o sistema linear LUz1 = y0, resulta : z1 = 19.9226−10.1707 −19.3211 ⇒ y1 = 119.9226z1 = 1−0.5105 −0.9698 De LUz2 = y1, obtemos: z2 = 50.2356−25.0940 −50.2403 ⇒ λ∗(1)2 = z2y1 = 50.235649.0500 51.8048 . Agora, y2 = 1 −50.2403z2 = −0.99990.4995 1 . CAPI´TULO 7. DETERMINAC¸A˜O NUME´RICA DE AUTO-VALORES E AUTO-VETORES 210 Fazendo LUz3 = y2, obtemos: z3 = −50.408824.1885 50.4166 → λ∗(2)2 = z3y2 = 50.413848.3180 51.4166 . Assim, λ∗2 ' 50.41. Portanto, o segundo maior auto-valor, em valor absoluto de A e´: λ2 = 1.98 + 1 50.41 = 1.9998 . Observe que o sucesso do me´todo das poteˆncias com deslocamento depende de nossa habilidade em obter estimativas precisas para usar no deslocamento. Neste u´ltimo exemplo, uma estimativa para λ2 foi obtida usando a relac¸a˜o entre o trac¸o da matriz e a soma dos auto-valores. Infelizmente, para matrizes de ordem > 3, na˜o e´ fa´cil obter valores apropriados para os deslocamentos. Como ja´ dissemos anteriormente, se desejamos todos os auto-valores devemos usar outros me´todos. Exerc´ıcios 7.5 - Determinar o auto-valor de maior valor absoluto e seu correspondente auto-vetor, da matriz: A = 1 −1 3−1 1 3 3 −3 9 . , calculando apenas a primeira aproximac¸a˜o pelo me´todo das poteˆncias. O qua voceˆ pode concluir? 7.6 - Usando o me´todo das poteˆncias calcular, o auto-valor de maior valor absoluto e seu correspondente auto-vetor, da matriz: A = 2 −1 0−1 2 −1 0 −1 2 . com precisa˜o de 10−2. 7.7 - Usando o me´todo da poteˆncia inversa, calcule o auto-valor de menor valor absoluto da matriz: A = 2 4 −24 2 2 −2 2 5 , com precisa˜o de 10−2. 7.8 - Sabendo que o auto-valor de maior valor absoluto da matriz: A = 4 −1 11 1 1 −2 0 −6 , e´ aproximadamente: −5.76849, e que seu correspondente auto-vetor e´ aproximadamente: (−0.1157, −0.1306, 1)t, calcule os demais auto-valores e correspondentes auto-vetores de A, usando: a) o me´todo das poteˆncias com deslocamento para obter o menor auto-valor, em valor absoluto, b) o me´todo da poteˆncia inversa com deslocamento para obter o auto-valor λ2. CAPI´TULO 7. DETERMINAC¸A˜O NUME´RICA DE AUTO-VALORES E AUTO-VETORES 211 7.5 Auto-Valores de Matrizes Sime´tricas Nessa sec¸a˜o restringiremos nossa atenc¸a˜o para matrizes sime´tricas de ordem n. Matrizes deste tipo possuem auto-valores reais e os auto-vetores sa˜o linearmente independentes. O me´todo de Jacobi, que des- creveremos mais adiante, e´ usado para determinar os auto-valores e auto-vetores, de matrizes sime´tricas, atrave´s de uma se´rie de transformac¸o˜es similares: Ak+1 = U−1k AkUk , k = 1, 2, . . . , onde A1 = A. As matrizes A1, A2, . . . convergem num nu´mero infinito de passos para uma matriz diagonal.