UNIVERSIDADE ESTADUAL DE MARINGÁ CENTRO DE CIÊNCIAS EXATAS DEPARTAMENTO DE MATEMÁTICA PROGRAMA DE PÓS-GRADUAÇÃO EM MATEMÁTICA

Livre

0
0
161
1 year ago
Preview
Full text

  

UNIVERSIDADE ESTADUAL DE MARINGÁ

CENTRO DE CIÊNCIAS EXATAS

DEPARTAMENTO DE MATEMÁTICA

PROGRAMA DE PốS-GRADUAđấO EM MATEMÁTICA

  

(Mestrado)

FERNANDO CORDEIRO DE QUEIROZ

LINEARIZAđấO DE SISTEMAS DE CONTROLE

  Maringá-PR 2016 UNIVERSIDADE ESTADUAL DE MARINGÁ CENTRO DE CIÊNCIAS EXATAS

  DEPARTAMENTO DE MATEMÁTICA PROGRAMA DE PốS-GRADUAđấO EM MATEMÁTICA

  

LINEARIZAđấO DE SISTEMAS DE

CONTROLE

ERNANDO ORDEIRO DE UEIROZ F C Q

  Dissertação apresentada ao Programa de Pós- Graduação em Matemática do Departamento de Matemática, Centro de Ciências Exatas da Uni- versidade Estadual de Maringá, como requisito para obtenção do título de Mestre em Matemá- tica.

  Área de concentração: Geometria/Topologia.

  Orientador: Prof. Dr. Marcos André Verdi.

  Maringá-PR 2016

  

LINEARIZAđấO DE SISTEMAS DE CONTROLE

  Dissertação apresentada ao Programa de Pós-Graduação em Matemática do Departamento de Matemática, Centro de Ciências Exatas da Universidade Estadual de Maringá, como requisito para obtenção do título de Mestre em Matemática.

  Prof. Dr. Marcos André Verdi Universidade Estadual de Maringá - UEM - PR

  Prof. Dr. Alexandre José Santana Universidade Estadual de Maringá - UEM - PR

  Prof. Dr. Hélio Vinicius Moreno Tozatti Universidade Tecnológica Federal do Paraná - campus Campo Mourão - PR Maringá, 17 de Junho de 2016.

  Este trabalho é dedicado aos meus pais, Sr. Milton de Queiroz e,

  Sr

  a . Maria Luzani Cordeiro de Queiroz.

  

Agradecimentos

  Primeiramente agradeço à Deus por ter me dado forças para persistir na realização deste trabalho.

  a

  Aos meus pais, Sr. Milton de Queiroz e Sr . Maria Luzani Cordeiro de Queiroz que sempre me apoiaram e incentivaram desde o início desta jornada. Agradeço a todos os professores do departamento de matemática da Universidade

  Estadual de Maringá com quem tive contato no curso de graduação e mestrado que adicionaram muito para minha formação pessoal e profissional, à banca examinadora pelas correções e sugestões. Agradeço especialmente o Prof. Dr. Marcos André Verdi pela orientação no curso de mestrado, pelo aprendizado e por contribuir sempre com muita paciência e dedicação para o meu crescimento profissional.

  Aos amigos que conquistei durante este percurso e que sempre me ajudaram quando precisei. Agradeço especialmente ao Me. João A. N. Cossich, Me. Bruno A. Rodrigues, Juniormar Organista, Me. Jonathan Prass e Fernando H. da Silva Vieira pela amizade, e pelas várias horas de estudos.

  Finalmente, agradeço à CAPES pelo apoio financeiro que foi fundamental no pe- ríodo de realização deste trabalho.

  

Resumo

  Nessa dissertação estudaremos alguns resultados clássicos da teoria de sistemas de controle. Demonstraremos o Critério de Kalman para a controlabilidade de sistemas lineares, o Teorema da Órbita e os Teoremas de Rashevsky-Chow e Krener. Também abordaremos a classificação dos sistemas de controle lineares controláveis, através da forma normal de Brunovský. Por fim, apresentamos o principal resultado desta disser- tação: estabelecer condições para que um sistema de controle afim seja equivalente a um sistema linear controlável.

  Palavras-chave: Sistemas de controle; Critério de Kalman; Forma Normal de Bru- novský; linearização de sistemas afins.

  

Abstract

  In this work we study some classical results of the control theory. We will demons- trate the Kalman Condition for controlability of linear systems, the Orbit Theorem and Rashevsky-Chow and Krener theorems. We will also discuss the classification of linear controllable systems, through of the Brunovský normal form. Finally, we present the main result in this dissertation: to establish conditions in order to affine control system be equivalent to a controllable linear system.

  Keywords: Control systems; Kalman condition; Brunovský normal form; affine systems linearization.

  

CONTEÚDO

  

  14

  . . . . . . . . . . . . . . . 14

  . . . . . . . . . . . . . . . . . . . 18

  

   . . . . . . . . . . . . . . . . . . . . . . . . . 32

  . . . . . . . . . . . . 32

  . . . . . . . . . 41

  

  47

  . . . . . . . . . . . . . . . . . . . . . . . . . 47

  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

  

  55

  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64

  

  75

  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

  

101

  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

  . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

  . . . . . . . . . . . . . . . . 113

  . . . . . . . . . . . . . . . 119 . . . . . . . . . . . . . . . . . . . . 122

  . . . . . . . . . . . . . . . 126

  

139

INTRODUđấO

  A Teoria de Controle formalizada matematicamente como a conhecemos hoje é re- lativamente recente. Porém, a ideia de regulação de sistemas, que norteia a Teoria de Controle, tem suas origens na antiguidade, surgindo da necessidade de regular certos mecanismos físicos para uma finalidade cotidiana, como por exemplo, na construção de mecanismos de marcação de tempo e nas construções de aquedutos. Alguns his- toriadores afirmam que na antiga Mesopotâmia, em torno de 2000 anos a.C, já era praticado o controle sobre o sistema de irrigação.

  Muito tempo depois, os trabalhos realizados por Ch. Huygens e R. Hooke, no final do século XVII, sobre as oscilações do pêndulo originaram um exemplo marcante da importância da Teoria de Controle. O objetivo era conseguir uma medição precisa de tempo e localização, que eram muito importantes para a navegação. Esse trabalho ins- pirou J. Watt a inventar, com ajustes, a máquina a vapor. De modo geral, o mecanismo consistia de um sistema com bolas rotativas em torno de um eixo de rotação, que com o aumento da velocidade de rotação se afastavam do eixo, ativando um controlador que abria válvulas permitindo que a pressão diminuísse e, consequentemente, diminuía a velocidade de rotação. Dessa forma, a máquina funcionava com uma velocidade pró- xima de uma constante. Mais tarde, o astrônomo G. Airy foi o primeiro cientista a analisar matematicamente o sistema de regulação inventado por J. Watt. Porém, uma descrição matemática definitiva foi dada apenas em 1868 por J. C. Maxwell.

  Com a necessidade cada vez maior da automação de equipamentos, o interesse por essa teoria cresceu no início do século XX. No pós Segunda Guerra, ficou claro para os cientistas e engenheiros que os modelos considerados até então não eram su- ficientemente precisos para descrever a complexidade das situações, criando maiores esforços em pesquisa de controlabilidade de sistemas não lineares, isto é, sistemas que são afetados por forças externas. Após 1960, os métodos e as ideias anteriores foram consideradas como parte da “Teoria de Controle Clássica”. Sugerimos o artigo para o leitor interessado em obter mais notas históricas.

  Os alicerces da Teoria de Controle Moderna foram estabelecidos por R. Bellman, R. Kalman e L. Pontryagin. A Teoria de controle pode ser considerada hoje em dia a partir de dois pontos de vistas diferentes e complementares: como suporte teórico para Engenharia de Controle e também como uma área de pesquisa matemática. A separação destas áreas é extremamente vaga e, na verdade, a Teoria de Controle é uma das mais interdisciplinares áreas de pesquisa hoje em dia.

  O ponto de vista adotado neste trabalho é puramente matemático. De uma maneira um pouco informal, um sistema de controle pode ser visto como uma família de equa- ções diferenciais ordinárias, parametrizadas por um controle u, sobre uma variedade diferenciável. A variedade é chamada de espaço estado. Para cada controle e estado ini- cial fixado, obtemos uma trajetória do sistema, que é um curva-solução do Problema de Valor Inicial obtido. Um problema interessante da Teoria de Controle é o da controlabi- lidade : partindo de um estado inicial x e “caminhando"sobre as trajetórias do sistema, mudando de trajetória sempre que desejarmos, quais são os pontos que podemos atin- gir num certo tempo? Quais as propriedades dos conjuntos de pontos que podemos atingir? Veremos algumas respostas para essas perguntas nessa dissertação. Outros aspectos da Teoria de Controle, que não serão tratados aqui, são: A estabilidade, que analisa se um estado é estável para o sistema de controle; a observabilidade, que estuda a questão em que, conhecendo um controle e uma equação de observação, podemos descobrir o estado inicial do sistema; a otimizabilidade, que estuda a existência de con- troles que permitem partir de um estado e alcançar um outro num tempo mínimo.

  Nessa dissertação estudaremos essencialmente aspectos da controlabilidade. Os n sistemas de controle mais simples são os sistemas lineares em R . Esses sistemas são da forma k

  X n ˙x = Ax + u i b i , i =1 k onde x, b , . . . , b k são vetores de R e o controle u = (u , . . . , u k ) está em R . Condições 1 1 relativamente simples para a controlabilidade do sistema, isto é, para que possamos atin- gir qualquer ponto à partir de um estado inicial, são estabelecidas no chamado critério de Kalman. Por esta razão, é interessante saber quando um sistema não linear é, de alguma forma, equivalente a um linear. Como a controlabilidade do sistema depende de suas trajetórias, as boas transformações de equivalência de sistemas, sob o ponto de vista da controlabilidade, são aquelas nas quais as trajetórias de um sistema são leva- das nas trajetórias do outro. Isso pode ser feito de duas formas: levar uma trajetória de um sistema em uma trajetória do outro, correspondendo ao mesmo controle; ou en- tão levar a trajetória em outra correspondente a um controle diferente. Estes tipos de transformação são chamadas, respectivamente, de state transformações e feedback trans- formações, e são o principal objeto de estudo dessa dissertação. A principal referência deste trabalho é o livro dos autores Andrei Agrachev e Yuri Sachkov.

  Essa dissertação está organizada da seguinte forma: o Capítulo 1 tem caráter in- trodutório, contendo várias definições e resultados essenciais para o restante do tra- balho. As Seções 3 e 4 têm maior relevância, pois nelas são definidas as principais ferramentas utilizadas aqui, como o colchete de Lie e o operador adjunto. No Capítulo 2 introduzimos formalmente o conceito de sistema de controle e provamos o Critério de Kalman para controlabilidade de sistemas lineares. No Capítulo 3, estudamos as condições para que um sistema não linear seja localmente e globalmente equivalente, por state transformações, a um sistema linear controlável. No Capítulo 4 apresentamos um importante resultado da teoria de controle, o Teorema da Órbita. A órbita de um sistema de controle através de um ponto é, de uma maneira informal, o conjunto dos pontos que podemos atingir através do ponto inicial, considerando tempos positivos e negativos. Num primeiro momento, a órbita poderia ser um conjunto qualquer, sem “boas"propriedades. No entanto, o Teorema da Órbita estabelece que esses conjuntos são na verdade subvariedades imersas, descrevendo também seus espaços tangentes. Com o auxílio deste resultado, descrevemos os conjuntos atingíveis para uma família de campos de vetores. No Capítulo 5 aprofundamos um pouco mais o conceito de state equivalência, que já foi tratada no Capítulo 3, e introduzimos formalmente a noção de feedback equivalência. Além disso, apresentamos uma classificação de sistemas de controle lineares. Isto é feito da seguinte maneira: definimos um tipo mais simples de sistemas lineares, chamado forma normal de Brunovský, e mostramos que todo sistema linear é state-feedback equivalente um sistema que é desta forma. Por fim, no Capítulo 6, estabelecemos condições para que um sistema de controle afim seja equivalente, por state-feedback transformações, a um sistema linear controlável.

  

CAPÍTULO 1

PRELIMINARES

  O objetivo principal deste capítulo é definir o ambiente e as ferramentas fundamentais com as quais vamos desenvolver este trabalho. As Seções 1 e 2 con- tém várias definições básicas e os principais resultados sobre variedades diferenciá- veis, campos vetoriais, E.D.O’s e o fluxo gerado por um campo vetorial, que podem ser aprofundadas em As Seções 3 e 4 possuem maior relevância. Ne- las definimos o conjunto dos pontos atingíveis do sistema de controle, o colchete de Lie, fornecemos exemplos e introduzimos uma correspondência entre variedades e o espaço das funções continuamente diferenciáveis. Esta correspondência será funda- mental para todo o restante do texto.

  Esta seção introduz apenas a essência dos conceitos de variedades e campos de vetores diferenciáveis sem a preocupação com a classe de diferenciabilidade de ambos concei- tos. Desta forma, assumiremos que são de classe C em todo o texto. Apresentaremos somente os principais resultados necessários ao nosso objetivo. n

  é uma subvariedade diferenciável de

  Definição 1.1 Dizemos que um subconjunto M ⊂ R n n

  ⊂ R de dimensão k ≤ n se, para qualquer ponto q ∈ M, existem vizinhanças abertas O q R , n n

  O ⊂ → O

  R da origem em R e uma aplicação diferenciável Φ : O q com Φ(q) = 0 e n dim(D q Φ · ) = n R tal que k Φ(O q ∩ M ) = O ∩ . R

  A seguir apresentaremos uma definição de variedade abstrata. Esta usa o conceito de paracompacidade que será omitida, mas pode ser encontrada em página 284.

  

Definição 1.2 Uma variedade diferenciável M de dimensão k é um espaço topológico de Haus-

  dorff, paracompacto munido de uma estrutura diferenciável, isto é: M é coberto por um sistema de subconjuntos abertos M = ∪ α O α , chamadas vizinhanças coordenadas, tal que para cada O α existe um homeomorfismo k

  → Φ α : O α R , chamado sistema de coordenadas locais, tal que para quaisquer α, β as composições − k k 1

  Φ β ◦ Φ : Φ α (O α ∩ O β ) ⊂ → Φ β (O α ∩ O β ) ⊂ α R R são difeomorfismos.

  

Definição 1.3 Sejam M, N variedades diferenciáveis de dimensões k e l respectivamente.

  Uma aplicação continua ϕ : M → N é diferenciável se a expressão de ϕ em coordenadas locais é diferenciável, isto é, se M = ∪ α O α , N = ∪ β V β são cobertas por vizinhanças coordenadas de M, N respectivamente, e k l

  Φ α : O α → Ψ β : V β → , R R são sistemas de coordenadas locais, então − − k l 1 1 Ψ β ◦ ϕ ◦ Φ : Φ α (O α ∩ ϕ (V β )) ⊂ → Ψ β (ϕ(O α ) ∩ V β ) ⊂ α R R é diferenciável para quaisquer α, β.

  

Definição 1.4 Sejam M, N variedades diferenciáveis. Dizemos que M é difeomorfa a N se

  existe um homeomorfismo 1 ϕ : M → N tal que ϕ e ϕ são diferenciáveis. A função ϕ é chamada de difeomorfismo.

  Denotaremos por Diff(M) = {ϕ : M → M | ϕ é difeomorfismo} o conjunto de todos os difeomorfismos de M em M.

  

Definição 1.5 Dizemos que uma aplicação diferenciável ϕ : M → N é um mergulho de M

  em N se ϕ : M → ϕ(M ) 1

  é um difeomorfismo. Uma aplicação ϕ : M → N é dita própria se ϕ (K) é compacto para todo subconjunto compacto K ⊂ N.

  

Teorema 1.6 (Whitney) Toda variedade diferenciável conexa de dimensão k pode ser mergu-

2k+1 .

  lhada propriamente em R Da mesma forma que omitimos a classe de diferenciabilidade, assumiremos que todas as variedades e subvariedades mencionadas no restante do texto são diferenciá- veis. Assim, omitiremos também a palavra diferenciável. n

  

Definição 1.7 Seja M ⊂ R uma subvariedade de dimensão k ≤ n e q ∈ M. O espaço

tangente à M no ponto q é o subespaço vetorial de dimensão k dado por 1 k

  · T q M = (D q Φ) R , onde Φ é a aplicação da definição

   Note nesta definição, que é fundamental o ambiente euclidiano que contém a sub- variedade. Quando nos referimos a uma variedade abstrata M, não temos esta refe- rência euclidiana. Desta forma, também é necessário definir o espaço tangente à M de maneira abstrata. A maneira que vamos definir o espaço tangente abstrato é inspi- rado em que consiste em escolher um ponto da variedade e construir um conjunto formado por todos os caminhos que passam pelo ponto escolhido no mesmo instante de tempo, e diferenciável neste instante. Em seguida, definiremos uma relação neste conjunto, que será uma relação de equivalência. O espaço tangente à variedade é então definido como o espaço quociente do conjunto construído por esta relação. Em outras palavras, um vetor será uma classe de equivalência.

  Sejam M uma variedade abstrata de dimensão k e q ∈ M. Denote por C q o conjunto de todos os caminhos contínuos α : I → M, onde I é um intervalo contendo zero, com α(0) = q e diferenciável em t = 0. k

  Sejam α ∈ C q um caminho e Φ : O → R um sistema de coordenadas locais com q ∈ O . Ajustando, se necessário, o intervalo I, obtemos a composição k (Φ ◦ α) : I → .

  R Diremos que dois caminhos α, β ∈ C q são equivalentes, e escreveremos α ∼ β se k existe um sistema de coordenadas locais Φ : O → R em M com q ∈ O tal que, (Φ ◦ α) : k k

  I → → 1 R e (Φ ◦ β) : I 2 R têm o mesmo vetor-velocidade em t = 0, ou seja ′ ′ (Φ ◦ α) (0) = (Φ ◦ β) (0). Note que a igualdade acima é válida para toda vizinhança coordenada O contendo q e contida em O. Logo, esta igualdade valerá para todo sistema de coordenadas locais.

  Esta relação é claramente reflexiva e simétrica. Agora, se α ∼ β e β ∼ γ, então existem sistemas de coordenadas locais Φ ′ ′ ′ ′ 1 e Φ 2 , tais que (Φ ◦ α) (0) = (Φ ◦ β) (0), (Φ ◦ β) (0) = (Φ ◦ γ) (0). 1 1 2 2

  Como ambas igualdades são válidas para todo sistema de coordenadas locais, obtemos ′ ′ (Φ ◦ α) (0) = (Φ ◦ γ) (0), 1 1 segue que esta relação é transitiva α ∼ γ e, portanto, uma relação de equivalência.

  O espaço tangente à M no ponto q é definido como o conjunto quociente C q = T q M.

  ∼ Desta forma, o vetor-velocidade ˙α do caminho α ∈ C q , é a classe de equivalência de α.

  Ou seja, | β ∼ α} ∈ T ˙α = {β ∈ C q q M.

  

Definição 1.8 Um campo de vetores diferenciável sobre uma variedade M é uma aplicação

  diferenciável V : M → T M, que associa a cada ponto q de M um vetor V (q) de T q M do fibrado tangente T M.

  Denotaremos por Vec(M) = {V : M → T M | V é diferenciável} o conjunto de todos os campos de vetores diferenciáveis sobre M. Assumiremos também que todo campo de vetores mencionado no restante do texto é diferenciável, salvo menção con- trária.

  Esta seção contém, além de uma breve introdução do conceito de E.D.O gerada por um campo de vetores sobre M, o importante Teorema de Existência e Unicidade de soluções para subvariedades. Definiremos também o fluxo gerado por um campo de vetores e finalizaremos tratando da completude de um campo de vetores.

  

Definição 1.9 Uma equação diferencial ordinária, ou simplesmente E.D.O, sobre uma varie-

  dade M é uma equação da forma: ˙q = V (q), (1.2-1) ou d q(t) = V (q(t)), dt onde V ∈ Vec(M), q ∈ M e q(t) representa uma aplicação de R em M.

  Um problema de Cauchy consiste de uma E.D.O sujeita a uma condição inicial da forma ∈ M. q(0) = q , q Uma solução de é uma aplicação diferenciável (ou curva integral) definida em um intervalo aberto de R em M :

  α : I ⊂ R → M, tal que

  ˙α(t) = V (α(t)) ∀t ∈ I.

  

Definição 1.10 Sejam M, N variedades e Φ : M → N uma aplicação diferenciável. A dife-

  rencial de Φ em um ponto q ∈ M é a transformação linear D q Φ : T q M → T Φ(q) N definida por: d d

  D q Φ α(t) = Φ(α(t)) , dt dt t t =0 =0 onde α : I ⊂ R → M é uma aplicação diferenciável iniciando em q, isto é, α(0) = q.

  Observação 1.11 Sejam

  ˙q = V (q) ∀q ∈ M, (1.2-2) uma E.D.O e Φ : M → N um difeomorfismo entre as variedades M e N, com x = Φ(q).

  Consideremos α : I ⊂ R → M uma solução de e seja x(t) = Φ(α(t)). Pela regra da cadeia obtemos: d

  ˙x(t) = Φ(α(t)) dt = D q Φ( ˙α(t)) = D q Φ(V (α(t))) 1 1 = D Φ · V (Φ (x(t))). Φ (x) Com isso, obtemos a E.D.O sobre N, induzida pelo difeomorfismo Φ : 1 1 ˙x(t) = D Φ · V (Φ (x)). Φ (x) O campo de vetores em N induzido por V pelo difeomorfismo Φ é definido como 1 1

  Φ ∗ V (x) = D Φ · V (Φ (x)). (1.2-3) Φ (x)

  

Teorema 1.12 (Existência e unicidade de soluções) Considere o problema de Cauchy em

n

  uma subvariedade M de R ,  

  ˙q = V (q)  q(0) = q .

  ∈ M para qualquer q fixado. Então existe uma única solução do problema acima q : (a, b) ⊂

  R → M onde (a, b) e um intervalo suficientemente pequeno com a < 0 < b tal que q(0) = q .

  Demonstração : Pela Definição existe uma aplicação diferenciável n n ⊂ → O ⊂

  Φ : O q R R com Φ(q ) = 0 e n dim (D q Φ · ) = n

  R tal que k Φ(O q ∩ M ) = O ∩ . R

  Como o fato de D q Φ ser sobrejetora implica que tal aplicação é também injetora, temos que D q Φ é um isomorfismo. Logo, Φ é um difeomorfismo local, ou seja, existem ′ ′ ⊂ O q ⊂ O vizinhanças abertas O e O tais que: q ′ ′ n

  Φ : O → O ⊂ q R n

  é difeomorfismo. Considere o campo de vetores em R induzido pelo difeomorfismo Φ :

  (Φ ∗ V ) (x) x ∈ U e o problema de Cauchy  

  ˙x = (Φ ∗ V ) (x)  x(0) = 0. ′ n

  Sabemos que existe uma única solução x(t) em O passando por 0 ∈ R (ver Capitulo 1). Além disso existe uma única curva q(t) em O tal que Φ(q(t)) = x(t). Pela q regra da cadeia,

  ˙x(t) = D q Φ · ˙q(t), (1.2-4) e por ˙x = (Φ ∗ V ) (x) = D q Φ · V (q(t)). (1.2-5)

  De (1.2-4) e (1.2-5) obtemos que:  

  ˙q = V (q) 1  q(0) = Φ (x(0)) = q .

  Portanto q(t) é solução local do problema de Cauchy em M.

  Observação 1.13 A aplicação q do teorema anterior

  q : (a q , b q ) × M → M 7−→ q(t, q

  (t, q ) ) é diferenciável. Em particular, o domínio da solução q(·, q ) : (a q , b q ) → M pode ser escolhido continuamente dependendo do ponto q . n e

  Teorema 1.14 Sejam M uma subvariedade de R n

  ˙q = V (q) q ∈ (1.2-6) R uma E.D.O tal que q ∈ M ⇒ V (q) ∈ T q M.

  Então para qualquer ponto inicial q ∈ M, existe ǫ > 0 tal que a solução q(t) de (1.2-6) com q(0) = q pertence a M para t ∈ (−ε, ε).

  Demonstração : Considere a restrição do campo de vetores V sobre M : f = V . M Obtemos assim o problema de Cauchy:

   

  ˙q = f (q) q ∈ M  q(0) = q .

  Pelo Teorema existe uma única solução local q(t) do problema acima para t ∈ (a, b) com a < 0 < b. Tome ε > 0 suficientemente pequeno tal que (−ε, ε) ⊂ (a, b). Portanto, pela unicidade da solução, temos que q(t) é também solução de (1.2-6), e q(t) ⊂ M para todo t ∈ (−ε, ε).

  

Definição 1.15 Dizemos que um campo de vetores V ∈ Vec(M) é completo se, para todo

  ∈ M, q a solução q(t) do problema de Cauchy:  

  ˙q = V (q) q ∈ M  q(0) = q

  é definida para todo t ∈ R.

  Exemplo 1.16 O campo de vetores definido por

  V (q) = q é completo em R, R \ {0}, (−∞, 0), (0, +∞), {0}.

  De fato, temos o problema de Cauchy:  

  ˙q = q,  q(0) = q , t q .

  com solução q(t) = e Observe que este campo não é completo em todas as subvariedades de t q, q ∈ S, não está R. De fato, para a subvariedade S = (0, 1) ⊂ R temos que a solução q(t) = e t definida para todo t ∈ R pois, tomando t > 0 suficientemente grande obtemos e q / ∈ (0, 1) .

  Veja a Figura abaixo. Para as outras subvariedades diferentes daquelas mencionadas no inicio, a análise é análoga.

  t

  Figura 1.1: e q

  Exemplo 1.17 O campo de vetores definido por 2 V (q) = q não é completo em nenhuma subvariedade de R, exceto {0}.

  De fato, para q 6= 0, temos o problema e Cauchy:  2

   ˙q = q ,

   q(0) = q , com solução

  1 x(t) = , 1 k − t para todo t 6= k e k = constante. Mas, se M = {0} então q = 0. Logo o problema de q Cauchy possui única solução q(t) = 0 para todo t ∈ R.

  Observação 1.18 Considere o problema de Cauchy

   

  ˙q = V (q),  q(0) = q .

  ∈ M Pelo Teorema de Existência e Unicidade de soluções, sabemos que para cada ponto q existe um intervalo suficientemente pequeno (a q , b q ) ⊂

  R no qual a solução está definida. Suponha que exista um intervalo (−ε, ε) ⊂ R, ε > 0, tal que a solução do problema de Cauchy com q(0) = q está definido em (−ǫ, ǫ) para todo q ∈ M. Definamos para cada t ∈ (−ε, ε) a aplicação t

  P : M → M t 7→ P q (q ) = q(t, q ), onde q(t, q ) é solução do problema de Cauchy com condição inicial q(0) = q . t Devido a unicidade e diferenciabilidade de q(t) em cada ponto, temos que P está bem definida e é diferenciável.

  Considere a família de aplicações diferenciáveis t P = {P | t ∈ (−ε, ε)}.

  Essa família tem as seguintes propriedades: se t, s, t + s ∈ (−ε, ε) então t s s t t +s (i) P ◦ P = P ◦ P = P ; (ii) P = Id; t −t

  ◦ P = Id; (iii) P t t − 1 (iv) P = (P ) .

  Para mostrar o item (i), considere as curvas t s t s s ◦ P

  α(t) = P (q ) = P (P (q )) = q(t, P (q )) t +s β(t) = P (q ) = q(t + s, q ).

  Temos que d t s s s ˙α(t) = P (P (q )) = ˙q(t, P (q )) = V (q(t, P (q ))) dt

  = V (α(t)) e também, d t +s

  ˙ β(t) = P (q ) = ˙q(t + s, q ) = V (q(t + s, q )) dt

  = V (β(t)). s

  (q ) s Logo, α(t) e β(t) são soluções do mesmo problema de Cauchy no ponto P pois, α(0) = P (q ) = β(0). Pela unicidade de solução, α(t) = β(t) para todo t ∈ (−ε, ε). Portanto t s t +s t

  P ◦ P = P . O item (ii) segue direto da definição de P , enquanto que os itens (iii) e t (iv) são consequências de (i). Como consequência, para cada t ∈ (−ε, ε) temos que P é um difeomorfismo. A família P é chamada de um grupo a 1-parâmetro.

  Definição 1.19 Para um campo de vetores V ∈ Vec(M) completo, a aplicação t

  t 7→ P t tV é chamada de fluxo gerado por V e neste caso denotaremos P (q ) = e (q ) . n

  

Exemplo 1.20 Seja A uma matriz real de ordem n × n e considere o campo (linear) em R

  definido por V (x) = Ax.

  A solução do problema de Cauchy  

  ˙x = V (x)  tA t tA x(0) = x ,

  é dada por x(t) = e x . Neste caso, P (x) = e x satisfaz as propriedades (i)-(iv) da obser- vação anterior, pois são as propriedades básicas da exponencial de matrizes.

  Temos o seguinte resultado importante sobre campos de vetores completos.

  Proposição 1.21 Suponha que exista ε > 0 tal que para qualquer ponto q ∈ M

  a solução do problema de Cauchy no ponto q está definida para todo t ∈ (−ε, ε). Então o campo de vetores é completo. Demonstração : De acordo com a observação anterior, considere a família de aplicações t P = {P | t ∈ (−ε, ε)}.

  Para concluir que o campo de vetores é completo, basta mostrar que o intervalo (−ε, ε)

  ∈ pode ser estendido a R. De fato, para qualquer t R fixado, existem n ∈ N e

  ε

  0 ≤ r < 2 tais que: ε ±t = ± n + r.

  2 Logo, t ± n ± ± ± r ε ε ε ε 2 +r 2 2 2 P (q ) = P (q ) = P ◦ P ◦ · · · ◦ P ◦P (q ).

  | {z } t n-vezes ∈ P ∈

  Portanto, P para qualquer t R. Note que se t = 0, então n = r = 0. Logo, P (q ) = q .

  

Proposição 1.22 Sejam V ∈ Vec(M) e K ⊂ M um subconjunto compacto. Então existe

  ∈ K ε K > 0 tal que, para todo q a solução q(t, q ) do problema de Cauchy está definida para todo t ∈ (−ε K , ε K ).

  Demonstração : Pelo Teorema para cada ponto q ∈ M existe uma solução q(t, q) : (a q , b q ) → M, com a q < 0 < b q .

  Pela Observação (1.13) temos que o domínio da aplicação q pode ser escolhido conti- nuamente dependendo do ponto, isto é, a aplicação que associa a cada ponto q ∈ M um domínio (a q , b q ) ⊂ R: q 7→ (a q , b q )

  |, |b |} > 0 é continua. Defina ε q = min{|a q q e a função:

  ϕ : K → R

  7→ ε q q . Temos que ϕ é continua e definida em um subconjunto compacto K. Assim, ϕ as- sume um valor mínimo ǫ q > 0 em algum q ∈ K. Seja ε K = ε q . Isto significa que,

  ∀q ∈ K. (−ε K , ε K ) ⊂ (a q , b q )

  Portanto, para cada ponto q ∈ K, a solução do problema de Cauchy q(t, q) está definida para todo t ∈ (−ε K , ε K ).

  

Corolário 1.23 Se M é uma variedade compacta, então qualquer campo de vetores V ∈ Vec(M)

  é completo.

  Corolário 1.24 Suponha que V ∈ Vec(M) tem suporte compacto, ou seja:

  supp(V ) = {q ∈ M | V (q) 6= 0} é compacto. Então V é completo.

  : Como o suporte de V é compacto, pela Proposição existe ε > 0 Demonstração tal que para cada ponto q ∈ supp(V ) a solução q(t, q) do problema de Cauchy está definida para todo t ∈ (−ε, ε). Pela Proposição V restrito ao supp(V ) é completo.

  Para pontos q ∈ M \ supp(V ), temos que V (q) = 0.

  Consequentemente, o campo V é nulo fora do suporte de V . Logo, toda solução é constante. Portanto V é completo.

  

Observação 1.25 Assumiremos no restante do texto que todos os campos de vetores conside-

rados são completos.

  Apresentamos até o momento conceitos básicos e resultados fundamentais a respeito de uma E.D.O determinada por um campo de vetores V sobre uma variedade M. Um resultado essencial apresentado foi o teorema de existência e unicidade, para cada E.D.O, ou seja, dado um ponto inicial, existe uma única solução em cada campo de vetores V definido. Com isto, podemos pensar em uma família de campos de vetores sobre M. O estudo das propriedades qualitativas de um sistema de controle depende das propriedades dos campos desta família e as interações entre eles. Neste contexto, surge de maneira natural uma ferramenta para entender essas interações, o colchete de Lie.

  

Definição 1.26 Sejam M uma variedade e V u uma família de campos de vetores completos sobre M. Um sistema de controle em M é um sistema dinâmico da forma: Σ : ˙q = V u (q). (1.3-7)

  A família V u é parametrizada por controles u ∈ U, onde U é em geral um subcon- junto de uma variedade, e chamada espaço de parâmetros de controles. Os pontos q ∈ M são chamados de estado e M de espaço estado do sistema de controle.

  Intuitivamente, podemos trocar a dinâmica do sistema em qualquer momento atra- vés dos controles u e, para cada u fixado, o campo V u gera um fluxo, que denotaremos t . por P u

  Uma questão que surge é: podemos, a partir de um estado inicial q ∈ M, alcançar ∈ M um outro estado final q 1 através dos fluxos, usando os controles u ∈ U, mudando de um para o outro quando necessário?

  ∈ M Suponha que iniciemos de um ponto q e considere a seguinte estratégia: escolhemos um controle u ∈ M e depois outro controle u ∈ M. Para u temos a 1 2 1 E.D.O: t ˙q = V (q), u (1.3-8) 1 a qual gera um fluxo P (q ). O conjunto de pontos que podemos alcançar mediante o u 1 controle u 1 é: t

  {P (q ) | t ≥ 0}, u 1 que é uma semi trajetória. Para o controle u 2 , obtemos a E.D.O: s ′ ˙q = V u (q), (1.3-9) ′ t 2 que fornece um fluxo P (q ) para cada q ∈ {P (q ) | t ≥ 0}. Deste modo, o conjunto u u 2 1 de pontos que podemos alcançar usando a nossa estratégia com os controles u s t 1 e u 2 é: {P ◦ P (q ) | s, t ≥ 0}, u u 2 1 que é parte de uma superfície de dimensão 2.

  Esta discussão motiva a definição seguinte:

  

Definição 1.27 O conjunto de pontos atingíveis do sistema de controle (1.3-7), com controles

  ∈ M constantes por partes, a partir de um ponto q num tempo t ≥ 0 é definido como: k n o t t t t k k− 1 2 1 X

  A q (t) = P ◦P ◦· · ·◦P ◦P (q ); t i = t, t i ≥ 0, k ∈ i ∈ U ⊂ M. (1.3-10) u u u u k k− 1 2 1 i =1 N, u O conjunto de pontos atingíveis a partir de q é definido como

  [ A A q = q (t). (1.3-11) t≥ Figura 1.2: Conjunto atingível A q .

  

Observação 1.28 Suponha que o espaço dos parâmetros de controle U consiste de dois con-

, u }.

  troles, isto é, U = {u 1 2 Assim, o conjunto de pontos atingíveis para um tempo t ≥ 0 arbitrário, torna-se: k n o t t t t k k− 1 2 1 X A = P ◦ P ◦ · · · ◦ P ◦ P (q ); t = t, t ≥ 0, k ∈ ∈ U . q u u u u 2 1 2 1 i =1 i i N, u i s t

  Aqui surge uma questão sobre a comutatividade dos fluxos P , P (q ). Quando os fluxos i ∈ U, u u 2 1 comutam, obtemos que: para k ∈ N e u t t t t k k− 1 2 1 A q = P ◦ P ◦ · · · ◦ P ◦ P (q ) u u u u t t t t k k− 2 1 2 3 2 1 1 ◦ P ◦ · · · ◦ P ◦ P

  = P (q ) u u u u t k +t k− +···+t t k− +t k− +···+t 2 2 2 2 1 1 3 1 1 = P ◦ P (q ) u u s t 2 1

  = P ◦ P (q ), u u 2 1 onde s = t k + t k− 2 + · · · + t 2 , e t = t k− 1 + t k− 3 + · · · + t 1 , que é parte de uma superfície de dimensão 2. De modo geral, se temos k ≥ 2 controles, e se os fluxos correspondentes a esses campos comutam, então A q é parte de uma variedade de dimensão k.

  Esta discussão nos motiva a procurar propriedades comutativas dos campos de vetores sem conhecer seus fluxos explicitamente. Para tanto, sejam V , V ∈ Vec(M). 1 2 Considere a aplicação, −t s t α(s, t) = P ◦ P ◦ P (q), 1 2 1 para q ∈ M fixado e s, t ∈ R. Se os fluxos comutam, então obtemos uma curva s

  α(s, t) = P (q), 2 que não depende de t.

  É natural esperar que termos de baixa ordem na expansão de Taylor de α(s, t) pos- sam dar pistas sobre a comutatividade dos fluxos dos campos de vetores V e V . Veja- 1 2 mos isso em um exemplo. n V (x) = Ax

  Exemplo 1.29 Sejam A e B matrizes reais n × n e considere os campos em R −tA sB tA 1

  e V (x) = Bx . Então α(s, t) = e e e x . Um cálculo direto mostra que as derivadas de 2 primeira ordem e as derivadas puras de segunda ordem, calculadas em s = t = 0, são dadas por 2 2 ∂α ∂α ∂ α ∂ α 2 s

  = Bx = V (x), = 0, = 0 = B x = V (P (x)), 2 e 2 2 2 2 ∂s ∂t ∂t ∂s as quais não fornecem qualquer pista sobre a comutatividade dos fluxos. Agora, a derivada mista de ordem 2 2

  ∂ α −tA sB tA −tA sB tA = −Ae Be e x + e Be Ae x = (−AB + BA)x (0,0) (0,0)

  ∂t∂s dá uma ideia precisa da comutatividade dos fluxos.

  O exemplo anterior motiva a seguinte definição. t s

  Definição 1.30 Sejam V , V ∈ Vec(M) com fluxos P , P , 1 2 respectivamente. O campo de 1 2

  vetores denotado por [V 1 , V 2 ] ∈ Vec(M), definido por 2−t s t

  [V , V ](q) = P ◦ P ◦ P (q) ∈ T q M, 1 2 1 2 1 ∂s∂t s =t=0

  é chamado o colchete de Lie dos campos V 1 , e V 2 .

  O colchete de Lie fornece informações sobre a comutatividade dos campos de veto- res, no sentido que o campo [V 1 , V 2 ] é nulo se, e somente se, os campos V 1 e V 2 comutam. Um resultado relevante para este texto é

  

Proposição 1.31 [V , V ] = 0 se, e somente se, seus fluxos correspondentes comutam, isto é,

t s −s −t 1 2 P ◦ P = P ◦ P . 1 2 2 1 : Ver Apêndice A.

  Demonstração A seguinte fórmula é muito útil para calcular o colchete de Lie em coordenadas locais. n

  ∈

  Proposição 1.32 Para V 1 , V 2 Vec(R ), o colchete de Lie é dado por

  dV dV 2 1 [V , V ](x) = 1 2 V (x) − 1 V (x), 2 dx dx dV 1 dV 2 onde e denotam respectivamente as matrizes jacobianas de V 1 e V 2 . dx dx Demonstração : Ver Apêndice A. 2

  )

  Exemplo 1.33 Sejam f, g ∈ Vec(R definidos por

     

  1   f (x) =  , g(x) =  . x 1 Pela Proposição obtemos com um simples cálculo que,

    [f, g](x) =   . n

  1 De maneira mais geral, para f, g ∈ Vec(R ), se f(x) = Ax e g(x) = b, onde A é uma matriz n × n, e b constante. Temos que [f, g](x) = [Ax, b](x) = 0 − Ab = −Ab.

  ∞

  Introduziremos nesta seção uma importante relação entre uma variedade M e a álgebra C (M ).

  Mais precisamente, exibiremos uma relação entre pontos, difeomorfismos e campos de vetores sobre M com funcionais, operadores e derivações lineares sobre C

  (M ) (ver Isto nos permite estudar fluxos e sistemas não lineares através de (M ). seus representantes lineares em C

  

  Recordemos que C (M ) representa o espaço de todas as aplicações diferenciáveis de M (M ) em R. Na álgebra C estão definidas as operações:

  (a + b)(q) = a(q) + b(q) (a · b)(q) = a(q) · b(q) (α · a)(q) = α · a(q), para quaisquer a, b ∈ C (M ), q ∈ M, α ∈

  R. ∞ ∞ Começaremos com uma identificação entre M e L(C (M ), (M ), R), onde L(C R) denota o espaço de todos os funcionais lineares de C (M ).

  Associamos a cada ponto q ∈ M um funcional linear q : C (M ) → R b a q(a) = a(q).

  7→ b Obtemos facilmente que bq está bem definido e único. Temos também que bq é um homomorfismo das álgebras C (M ) e R com as operações definidas em C (M ) : q(a + b) = (a + b)(q) = a(q) + b(q) = q(a) + q(b), b b b q(a · b) = (a · b)(q) = a(q) · b(q) = q(a) · q(b), b b b q(α · a) = (α · a)(q) = α(q) · a(q) = α · q(q), b b

  (M ) para todo a, b ∈ C e α ∈ R. A proposição a seguir mostra que a correspondência entre pontos e funcionais line- ares é biunívoca. Para demonstrá-la, é necessário o conceito de partições da unidade. Enunciaremos várias definições e um teorema, do qual omitiremos a demonstração. O leitor pode aprofundar mais os conceitos mencionados abaixo em Capitulo 8, Seção

  3. Definição 1.34 Dizemos que uma família de subconjuntos L = (L ) α de M é localmente α∈ Λ

finita se, para cada ponto q ∈ M, existe uma vizinhança V q ⊂ M contendo q tal que V q

intersecta um número finito de subconjuntos de L.

  

Definição 1.35 Seja M uma variedade. Uma partição da unidade em M é uma família de

  funções (ψ α ) α∈ de C (M ), tais que Λ

  1. Para todo ponto q ∈ M e α ∈ Λ, ψ α (q) ≥ 0;

  2. A família S = (supp(ψ α )) α∈ é localmente finita em M; Λ

  X ψ α (q) = 1.

  3. Para todo q ∈ M tem-se α∈ Λ

  

Definição 1.36 Seja C = (C β ) uma cobertura de M. Dizemos que uma partição da unidade

β∈ Γ

  X ψ α (q) = 1 α∈ Λ está subordinada à cobertura C se, para cada α ∈ Λ, existe um β ∈ Γ tal que

  X supp(ψ α ) ⊂ C β . Dizemos também que uma partição ψ α (q) = 1 da unidade é estritamente α∈ Λ

  subordinada à cobertura C = (C β ) α ) ⊂ C α β∈ Γ se Γ = Λ e, além disso, supp(ψ para todo α ∈ Λ.

  Teorema 1.37 Dada uma cobertura aberta C = (C β ) β∈ Γ de M, existe uma partição da unidade estritamente subordinada à cobertura C.

Lema 1.38 Em qualquer variedade diferenciável M existe uma função h ∈ C (M ) tal que,

  para todo ε > 0, existe um subconjunto compacto K ⊂ M no qual h(q) > ε, q ∈ M \ K. Demonstração : Seja ψ k , k ∈ N, uma partição da unidade em M: ψ k ∈ C (M ) para cada k ∈ ) ⊂ M

  N, os suportes supp(ψ k são compactos e formam uma cobertura localmente

  P ∞ ψ ≡ 1. finita de M e k Basta definir k =1

  X h(q) = kψ (q). k =1 k Finalmente, estamos aptos para demonstrar o próximo resultado.

  Proposição 1.39 Seja ϕ : C (M ) →

  R um homomorfismo não trivial. Então existe um ponto q ∈ M tal que bq = ϕ.

  (M ) → Demonstração : Seja ϕ : C R um funcional linear (homomorfismo não trivial e sobrejetor). O conjunto ker(ϕ) = {f ∈ C (M )| ϕ(f ) = 0}, é um ideal maximal em C (M ). De fato, claramente este conjunto é um ideal de C (M ) .

  Agora, pelo Teorema do Homomorfismo, temos que C (M ) é isomorfo a R. C (M ) ker(ϕ)

  Como R é corpo, temos que é corpo e, portanto ker(ϕ) é maximal. Considere o ker(ϕ) ideal de C (M ) definido por

  I q = {f ∈ C (M )| f (q) = 0}, para qualquer q ∈ M.

  

Afirmação: ker(ϕ) ⊂ I q para algum q ∈ M. De fato, suponha que ker(ϕ) * I q para

  todo q, isto é, para cada ponto q ∈ M existe uma função f q ∈ ker(ϕ) tal que f q ∈ I / q , implicando em f q (q) 6= 0. Sem perda de generalidade, podemos assumir que f q (q) > 0. Logo, pela continuidade de f q obtemos:

  ∀q ∈ M ∃f q ∈ ker(ϕ), O q ⊂ M tal que f q (q) > 0, q ∈ O q . (1.4-12) Fixe a função h ∈ C (M ) satisfazendo o Lema Denote ϕ(h) = α > 0. Então

  ϕ(h − α) = 0.

  Logo, (h − α) ∈ ker(ϕ). (1.4-13)

  Pelo Lema temos que para este α existe um subconjunto compacto K ⊂ M tal que h(q) − α > 0 para todo q ∈ M \ K.

  Como K é compacto, K admite uma subcobertura finita através dos abertos dados em n

  [ K ⊂ O . i =1 q i Considere uma partição da unidade ψ , ψ , . . . , ψ n ∈ C (M ), estritamente subordinada 1

  à cobertura M \ K, O q , O q , . . . , O q n , 1 2 de M. Desta forma, definimos a função sobre M, pondo: g = ψ (h − α) + ψ 1 f q + · · · + ψ n f q n . 1 Como supp(ψ i ) ⊂ O q temos que ao menos um membro da soma de g é maior do que i zero. Assim, g > 0. Como (h − α), f q ∈ ker(ϕ) para i = 1, . . . , n, e ϕ é homomorfismo, i temos que g ∈ ker(ϕ). Porém, sendo g > 0, podemos escrever

  1

  1 1 = ϕ(g ) = ϕ(g)ϕ( ). g g

  Segue que ϕ(g) 6= 0. Esta é uma contradição, obtida por supor Portanto, ker(ϕ) ⊂ I q , q ∈ M. Como I q (M ) e ker(ϕ) é ideal maximal, obtemos a igual- C dade ker(ϕ) = I q . : C (M ) → (f ) = f (q ) . Para mostrar que Defina bq R, dada por bq ϕ = q , basta mostrar a afirmação seguinte. b

  ) = C (M ). De fato, temos

  Afirmação: ker(ϕ − bq

  ker(ϕ) = I q q ), (1.4-14) ⊂ ker(ϕ − b

  ) assim, basta mostrar que a inclusão acima é estrita exibindo uma função f ∈ ker(ϕ− bq e f / ∈ I q . Seja f ∈ C (M ) dada por f(q) = 1, ∀q ∈ M. Claramente f / ∈ I q . Temos que, se ϕ(f) = k ∈ R, então k = 1. Com efeito, se ϕ(f) = k então ϕ(f − k) = 0, consequentemente (f − k) ∈ ker(ϕ) = I q , isto é, (f − k)(q ) = 0 , que implica em, 1 = f (q ) = k. Finalmente,

  (ϕ − q )(f ) = ϕ(f ) − q (f ) = ϕ(f ) − f (q ) = 1 − 1 = 0, b b ). Segue que a inclusão é estrita. Sendo ker(ϕ) mostrando que f ∈ ker(ϕ − bq ) = C (M ), . um ideal maximal, concluímos que ker(ϕ − bq e portanto ϕ = bq

  Apresentaremos agora uma identificação entre os conjuntos Diff(M) e Aut(C (M )), onde Aut(C (M )) é o conjunto de todos os automorfismos de C (M ). Para qualquer P ∈ Diff(M) definimos: ∞ ∞ b

  P : C (M ) → C (M ) b a 7→ P (a) : M →

  R 7→ b q P (a)(q) = a(P (q)), para todo a ∈ C (M ) e q ∈ M. Mostremos que b P assim definido é de fato um auto- morfismo.

  Para quaisquer a, b ∈ C (M ), q ∈ M e α ∈ R temos: b P (a + b)(q) = (a + b)(P (q)) = a(P (q)) + b(P (q)) = b P (a)(q) + b P (b)(q), b

  P (a · b)(q) = (a · b)(P (q)) = a(P (q)) · b(P (q)) = b P (a)(q) · b P (b)(q), b P (α · a)(q) = (α · a)(P (q)) = α(P (q)) · a(P (q)) = α · b P (a)(q).

  Além disso, b b P (a) = b P (b) ⇒ P (a)(q) = b P (b)(q) ∀q ∈ M

  ⇒ a(P (q)) = b(P (q)) ∀q ∈ M ⇒ a = b. 1 Naturalmente, a inversa de b P é dada por d P .

  Esta identificação é também sobrejetora, conforme mostra a Proposição 1.40 Para qualquer A ∈ Aut(C (M )) existe P ∈ Diff(M) tal que A = b P . Demonstração : Seja q ∈ M um ponto qualquer e considere o funcional linear corres- pondente q : C (M ) → R. b

  Temos o funcional linear q ◦ A : C (M ) → R, b onde A é o automorfismo dado. Pela Proposição existe um ponto p ∈ M tal que p = q ◦ A. b b Por Capitulo 2, Seção 2.2, existe um difeomorfismo P ∈ Diff(M) tal que P (q) = p.

  Logo, q ◦ A(a) = p(a) = d P (q)(a) = a(P (q)) = b P (a)(q) = q( b P (a)) b b b

  = q ◦ b P (a), b P (a) para todo q ∈ M. Portanto, A = b P . ou seja, bq◦ A(a) = bq◦ b

  Vamos agora identificar os vetores tangentes com certos funcionais lineares. Dados q ∈ M e v ∈ T q M , seja q : I → M uma curva tal que q(0) = q e ˙q(0) = v. Defina o (M ) →

  R por funcional bv : C d a(q(t)). bva = dt t =0

  Note que, pela definição da diferencial de uma função, temos q a · v. bva = D Além disso, dados a, b ∈ C (M ) , temos: d

  ((a · b)(q(t))) bv(a · b) = dt t =0 d

  = (a(q(t)) · b(q(t))) dt t =0 d d = a(q(t)) · b(q(0)) + a(q(0)) · b(q(t)) dt dt t t =0 =0

  = bva · b(q) + a(q) · bvb A igualdade acima é conhecida como a regra de Leibniz no ponto q. Qualquer funci- onal ξ : C (M ) → R satisfazendo a regra de Leibniz em q é chamada derivação em q. O conjunto dessas derivações é denotado por Der q (M ) .

  Do que vimos acima, a um dado vetor v ∈ T q M podemos associar uma derivação ˆ v ∈ Der q (M ) , a qual será chamada de derivada direcional ao longo de v. Para mostrar que esta correspondência é biunívoca, precisaremos do seguinte resultado: ∞ n

  , onde U ⊂ R

Lema 1.41 (Lema de Hadamard) Seja f : U → R uma função de classe C ∞

  é aberto convexo contendo 0. Então, existem funções b i : U → R de classe C , i = 1, 2, . . . , n tais que n

  X f (x) = f (0) + x i b i (x), i =1 para todo x = (x , x , . . . , x n ) ∈ U . Além disso, as funções b i são dadas por 1 2 Z 1 ∂f b i (x) = (tx)dt.

  ∂x i Demonstração : Ver Capitulo 3, seção 3.3.

  Proposição 1.42 Para toda derivação ξ ∈ Der (M ) existe v ∈ T q M tal que ˆv = ξ.

q

  Demonstração : Primeiramente, note que o valor de uma derivação em q aplicada em uma função depende somente dos valores de a em vizinhanças arbitrariamente peque- nas de q, isto é, se para alguma vizinhança O|q de q tivermos a| O q = ˜ a| O q , então ξa = ξ˜a. De fato, tomando b ∈ C (M ) tal que b M −O ≡ 1 e b(q) = 0, temos que (˜a − a)b = ˜a − a q e assim:

  ξ(˜ a − a) = ξ((˜ a − a)b) = ξ(˜ a − a) · b(q) + (˜ a − a)(q) · ξ(b) = 0. Desta forma, a proposição é de natureza local e será provada em coordenadas.

  Sejam (x , . . . , x n ) coordenadas locais sobre M centradas no ponto q. Vamos mostrar 1 que existem α , . . . , α n ∈ 1 R tais que n

  X ∂ ξ = α i . i =1 ∂x i Para isso, observe primeiro que ξ(1) = ξ(1) · 1 + 1 · ξ(1) = 2ξ(1).

  Assim, ξ(1) = 0 e, por linearidade, ξ se anula sobre funções constantes. Agora, dado a ∈ C (M ) , usamos o Lema de Hadamard para escrever n

  X a(x) = a(0) + b i (x)x i . i =1 Assim, n n n

  X X

  X ∂a

  ξ(a) = ξ(b i x i ) = ((ξb i )x i (0) + b i (0)(ξx i )) = α i (0), i i i =1 =1 =1 ∂a ∂x i onde α i = ξx i e foi usada a igualdade b i (0) = (0) . ∂x i Por fim, identificaremos o conjunto dos campos de vetores diferenciáveis em M com o conjunto das derivações em M. Uma derivação em M é um operador linear ∞ ∞ ∞

  D : C (M ) → C (M ) tal que, para quaisquer a, b ∈ C (M ) , D(a · b) = D(a) · b + a · D(b).

  O conjunto das derivações em M será denotado por Der(M).

  Para cada V ∈ Vec(M) definimos ∞ ∞ b V : C (M ) → C (M ) b a 7→ V a : M →

  R q 7→ b V a(q) = D q a · V (q).

  Note que b V a(q) = [ V (q)a.

  De fato, def d [

  V (q)a = a(q(t)) = D q a · V (q) = b V a(q), dt t =0

  V onde q(t) é uma curva em M com q(0) = q e ˙q(0) = V (q). Note que b é uma derivação: b

  V (a · b)(q) = [ V (q)(a · b) = ([ V (q)a) · b(q) + a(q) · ([ V (q)b) = b V a · b(q) + a(q) · b V b.

  Chamamos b V de derivada de Lie ao longo do campo V.

  A proposição seguinte nos garante a recíproca da discussão precedente.

  

Proposição 1.43 Para toda derivação D ∈ Der(M) existe um campo de vetores V ∈ Vec(M)

V = D.

  tal que b Demonstração : Seja ∞ ∞

  D : C (M ) → C (M ) uma derivação. Seja q ∈ M um ponto qualquer e consideremos o funcional linear q : C (M ) → R. b

  Defina o funcional linear d q = q ◦ D. Mostremos que d q satisfaz a regra de Leibniz b no ponto q : d (a · b) = q ◦ D(a · b) = q(D(a · b)) q b b

  = q((Da)b(q) + a(q)(Db)) b = q(Da)b(q) + q(a(q)(Db)) b b = q(Da) · b(q) + a(q) · q(Db) b b = (d q a)b(q) + a(q)(d q b).

  Pela Proposição existe um vetor v ∈ T q M q . Como q é arbitrário, tal que bv = d obtemos um campo de vetores V ∈ Vec(M).

  Nesta subseção identificamos, pontos, difeomorfismos, vetores e campos de vetores com objetos do espaço dos funcionais e operadores. Com isso, obtemos uma versão do colchete de Lie para derivações.

  Definição 1.44 Sejam b V , c W ∈ Der(M ) derivações. O colchete de Lie dos operadores b

  V e c W é dado por [ b V , c W ] = b V ◦ c W − c W ◦ b V . (1.4-15)

  Nesta subseção usaremos as ferramentas apresentadas na seção anterior para introdu- zir um tipo especial de funcional e operador em Der q (M ) e Der(M) respectivamente, que são induzidos por um difeomorfismo, os quais serão fundamentais para o restante do texto.

  Sejam M uma variedade, v ∈ T q M e P ∈ Diff(M). Considere uma curva q(t) ∈ M tal que q(0) = q e ˙q(0) = v. Com isso, obtemos uma curva P (q(t)) ∈ M com vetor velocidade d

  P (q(t)) = D q P · v = P ∗ v ∈ T P M. (q) dt t =0 O vetor P ∗ v tem um correspondente em Der P (M ). (q) Afirmamos que d

  P ∗ v = P . (1.4-16) bv ◦ b De fato, a derivada direcional ao longo do vetor d P ∗ v, foi definida por d d

  P ∗ va = a(P (q(t))) dt t =0 d = D P (a ◦ P ) · q(t) (q(t)) dt t =0

  \ d = q(t) a ◦ P dt t =0

  = P a) bv( b ∀a ∈ C = ( P )a, (M ). bv ◦ b

  Portanto, d P ∗ v : C (M ) →

  R a 7→ d P ∗ va = P a. bv ◦ b

  Agora, dado V ∈ Vec(M) vamos determinar uma expressão para P ∗ V como uma derivação em M. Afirmamos que 1 d ◦ b

  P ∗ V = b P V ◦ b P . (1.4-17) Para provar isso, vamos destacar algumas igualdades.

  P = d P ∗ v, como já foi provado em (i) bv ◦ b

  P = d P (q). De fato, (ii) bq◦ b ( q ◦ b P )a = q( b P (a)) = b P (a)(q) = a(P (q)) = d P (q)a. b b

  V = [ V (q). De fato, (iii) bq◦ b ( q ◦ b V )a = q( b V a) = b V a(q) = D a(V (q)). q b b

  Por outro lado, d [ V (q)a = a(q(t)) = D q a(V (q)). dt t =0

  \ \ (iv) P ∗ V (P (q)) = P ∗ (V (q)). De fato, por temos P ∗ V (P (q)) = D q P (V (q)).

  Por outro lado, d P ∗ (V (q)) = P (q(t)) = D q P (V (q)). dt t =0 Como P ∗ V (P (q)) = P ∗ (V (q)), então (iv) segue.

  Mostraremos agora (1.4-17). Para todo q ∈ M, temos (ii) (iii) (iv) (i) (iii) \ \ q ◦ b P ◦ d P ∗

  V = d P (q) ◦ d P ∗ V = P ∗ V (P (q)) = P ∗ (V (q)) = [ V (q) ◦ b P = q ◦ b V ◦ b P , b b de onde obtemos a igualdade desejada. Vemos assim que difeomorfismos agem em campos de vetores por semelhanças.

  

Observação 1.45 Daqui em diante, omitiremos o simbolo circunflexo ”b” sobre os funcionais e operadores. Isto não causará ambiguidade, visto que q ◦ V, V ◦ W por exemplo, só fazem sentido se forem operadores. O objetivo é simplificar a notação.

  V O operador P ∗ tem a propriedade de preservar composições. De fato, 1 P ∗ (V ◦ W )a = (P ◦ V ◦ W ◦ P )a − − 1 1 ◦ V ◦ (P ◦ P

  = (P ) ◦ W ◦ P )a 1 − 1 = (P ◦ V ◦ P ) ◦ (P ◦ W ◦ P ) a = (P ∗ V ◦ P ∗ W ) a, ∀a ∈ C (M ).

  Consequentemente, P ∗ V preserva o colchete de Lie: 1 P ∗ [V, W ]a = (P ◦ [V, W ] ◦ P )a 1 = (P ◦ (V ◦ W − W ◦ V ) ◦ P )a − − 1 1

  ◦ V ◦ W ◦ P − P ◦ W ◦ V ◦ P = P a = (P ∗ V ◦ P ∗ W − P ∗ W ◦ P ∗ V ) a = [P ∗ V, P ∗ W ]a, ∀a ∈ C (M ). (1.4-18) (M )).

  Seja T ∈ Aut(C A notação padrão para semelhanças é AdT : 1 ( AdT ) V = T ◦ V ◦ T . (1.4-19)

  Com essa notação, temos 1 P ∗ = AdT ∀P ∈ Diff(M).

  Um campo vetorial não autônomo sobre uma variedade diferenciável M é uma aplicação que associa à cada par (t, p) ∈ J × M, onde J é um intervalo da reta real, um vetor V (t, p) ∈ T p M . Tais campos são também chamados de campos dependentes

  

do tempo. Dado um campo vetorial não autônomo V , também temos o teorema de

  existência e unicidade de solução do Problema de Valor Inicial  ddt q(t) = V (t, q(t))  q(t ) = q

  Para uma demonstração deste fato, veja Teorema 17.15. t Seja P o fluxo de uma E.D.O determinada pelo campo de vetores não autônomo t

  V ∈ Vec(M). Vimos que P é um difeomorfismo e, portanto, pode ser considerado como um automorfismo de C (M ) que, por sua vez, é a única solução do Operador Problema de Cauchy (problema de Cauchy visto como operador):

   t t ˙

   P = P ◦ V

  (1.4-20)  t t t − t P = Id. 1 Como P é invertível, seja Q = (P ) . Desta forma, Q é a solução do Operador

  Problema de Cauchy:  t t

  ˙ 

  Q = −V ◦ Q (1.4-21)

   Q = Id. Vamos enunciar, sem demonstração, uma importante propriedade sobre famílias continuas de operadores. A demonstração pode ser encontrada em apêndice A. t t ∞

  Proposição 1.46 Se A

  (M ) e B famílias continuas de operadores em C que são diferenciá- t t veis em t , então a família de operadores A ◦ B é continua e diferenciável em t . Mais ainda, satisfaz a regra de Leibniz:

  ! ! d d d t t t t t t A ◦ B = A ◦ B + A ◦ B . (1.4-22) dt dt dt t t t t

  

Proposição 1.47 Sejam P o automorfismo correspondente ao fluxo gerado pelo campo de ve-

  tores não autônomo V , e W uma derivação. Então, d t t AdP W = AdP [V, W ]. dt

  Demonstração : Basta usar as equações para obter a expressão: d d t t t t − 1 ( )W = ( )[V, W ] + P ◦ W ◦ (P ) . AdP AdP dt dt d

  Como W não depende de t, temos que W ≡ 0. Portanto, dt d t t ( AdP )W = ( AdP )[V, W ]. dt

  De acordo com a proposição acima, obtemos, em particular, o colchete de Lie d dt t =0

  X = d dt t =0

  Por outro lado, ainda por (1.4-24) d dt t =0

  X = ( adV ) X ◦ Y + X ◦ (adV ) Y − (adV ) Y ◦ X − Y ◦ (adV ) X = ( adV ) X ◦ Y − Y ◦ (adV ) X + X ◦ (adV ) Y − (adV ) Y ◦ X = [( adV ) X, Y ] + [X, (adV ) Y ] . (1.4-27)

  AdP t

  AdP t Y ◦ X − Y ◦ d dt t =0

  AdP t Y − d dt t =0

  AdP t X ◦ Y + X ◦ d dt t =0

  X = d dt t =0

  AdP t Y ◦ AdP t

  AdP t X ◦ AdP t Y − d dt t =0

  AdP t X ◦ AdP t Y − AdP t Y ◦ AdP t

  ( AdP t

  [ AdP t X, AdP t Y ] = d dt t =0

  AdP t [X, Y ] = d dt t =0

  AdP t [X, Y ] = [ AdP t X, AdP t Y ], (1.4-26) diferenciando esta igualdade e usando obtemos d dt t =0

  ( adV ) W = [V, W ]. (1.4-25) Esta igualdade acima será bastante utilizada no restante do texto. Devido a temos a igualdade

  AdP t . (1.4-24) Por obtemos

  P t t =0 def = d dt t =0

  Definimos adV = ad d dt

  (P t ◦ W ◦ (P t ) 1 ) = V ◦ W − W ◦ V = [V, W ]. (1.4-23)

  )W = d dt t =0

  AdP t [X, Y ] = adV [X, Y ] = [V, [X, Y ]]. (1.4-28) Por (1.4-27) e (1.4-28), temos [V, [X, Y ]] = [( adV ) X, Y ] + [X, (adV ) Y ] ou de outra forma,

  [V, [X, Y ]] = [[V, X], Y ] + [X, [V, Y ]] . De maneira simétrica podemos escrever ainda como

  [V, [X, Y ]] + [Y, [V, X]] + [X, [Y, V ]] = 0, esta forma é conhecida com Identidade de Jacobi.

  O colchete de Lie de campos de vetores satisfaz as seguintes propriedades: Para todo X, Y, Z ∈ Vec(M), e α, β ∈ R valem

  (i) Bilinear: [αX + βY, Z] = α[X, Z] + β[Y, Z];

  (ii) Antissimétrica: [X, Y ] = −[Y, X];

  (iii) Identidade de Jacobi: [V, [X, Y ]] + [Y, [V, X]] + [X, [Y, V ]] = 0.

  Com essas propriedades, temos que o espaço vetorial (Vec(M), [ , ]) munido com o colchete de Lie é uma álgebra de Lie de campos de vetores.

  

CAPÍTULO 2

  Estudaremos neste capítulo a definição formal de controlabilidade. Tam- bém introduziremos a classe mais simples de sistemas de controle: sistemas lineares. Apresentaremos a demonstração de um importante resultado da Teoria de Controle, conhecido como critério de Kalman, que fornece condições para a controlabilidade com- pleta de sistemas de controle lineares.

  n

  Faremos uma apresentação bastante objetiva de sistemas lineares em R , com os prin- cipais resultados. Esta seção tem fundamental importância para o próximo capítulo, uma vez que, a investigação sobre a "linearizabilidade"do sistema de controle não li- near se baseia na existência de uma correspondência com um sistema linear. n

  Um sistema de controle linear em R tem a forma: m

  X n m ˙x = Ax + c + u i b i , x ∈ u = (u , . . . , u m ) ∈ , (2.1-1) n n i =1 R 1 R onde c, b i ∈ , i ∈ {1, . . . , m}, e A ∈ M n×n ( ) são constantes.

  R R

  X i =1 u i b i .

  Z t e −τ A m

  X i =1 u i b i + c = Ax(t, x ) + c + m

  !!

  X i =1 u i b i + c ! dτ

  Z t e −τ A m

  X i =1 u i b i + c = A e tA x +

  !!

  X i =1 u i b i dτ + Z t e −τ A cdτ

  Z t e −τ A m

  X i =1 u i b i + c = A e tA x +

  !

  X i =1 u i b i dτ + e tA Z t e −τ A c dτ

  = A e tA x + e tA Z t e −τ A m

  X i =1 u i b i + A e tA Z t e −τ A c dτ + c

  X i =1 u i b i dτ + m

  Z t e −τ A c dτ + e tA e −tA c = A e tA x + A e tA

  O sistema linear com a condição inicial       

  (τ ), . . . , u m (τ )) é localmente integrável e e tA = Id + tA + t 2

  ˙x = Ax + c + m

  X i =1 u i b i , x ∈ R n x(0, x ) = x tem uma única solução, que corresponde aos controles admissíveis u(τ) = (u 1

  (τ ), . . . , u m (τ )) localmente integráveis. Esta solução é conhecida como, Fórmula de Cauchy para sistemas lineares , e descrita como: x(t, x o ) = e tA x +

  Z t e −τ A m

  X i =1 (u i (τ )b i + c)dτ

  ! (2.1-2) onde u(τ) = (u 1

  2! A 2 + · · · + t n n!

  X i =1 u i b i

  A n + · · · . De fato, reescrevendo (2.1-2) como: x(t, x ) = e tA x + e tA

  Z t e −τ A m

  X i =1 u i b i ! dτ + e tA

  Z t e −τ A c dτ, diferenciando obtemos: ˙x(t, x ) = A e tA x + A e tA

  Z t e −τ A m

  X i =1 u i b i dτ + e tA e −tA m

  • A e tA
  • m
  • m
  • m
Portanto, a fórmula de Cauchy é a solução de

  Vimos na seção anterior a fórmula de Cauchy para sistemas lineares Denotando por U o conjunto dos controles localmente integráveis, n U = {u : | u

  R → R é localmente integrável}, obtemos uma aplicação n F : U →

  R definida por m ! Z t Z t tA −τ A tA −τ A

  X u 7→ x(t, u, x + ) = e x e c dτ + e e u i b i dτ. i =1 Por simplicidade, escrevemos m

  X i =1 u i b i = Bu n ∈ onde B ∈ M m×n ( i e u = (u 1 , . . . , u m ). R) é formada pelos vetores coluna constantes b R

  Com isso, obtemos tA −τ A tA −τ A Z t Z t u 7→ x(t, u, x ) = e x e c dτ + e e Bu dτ. + Observe que F é uma aplicação afim. Segue que, o conjunto de pontos atingíveis n partindo do estado x para um tempo t > 0 fixado, é um subespaço afim de R . Daremos agora a definição geral de controlabilidade.

  

Definição 2.1 Dizemos que um sistema de controle Σ é completamente controlável para

  um tempo t > 0 sobre um espaço estado M se, A q (t) = M, ∀q ∈ M.

  Chamaremos tais sistemas simplesmente de controláveis para um tempo t > 0.

  Esta definição nos diz que, se um sistema de controle Σ é controlável para um

  , q ∈ M, tempo t > 0, então para quaisquer pontos q 1 existe um controle u (admis- sível), cuja solução q(t, u, q ) do problema de Cauchy ˙q = V u (q), q(0, u, q ) = q satisfaz, q(0, u, q ) = q , q(t, u, q ) = q , 1 ou seja, é possível atingir q 1 à partir de q em t unidades de tempo.

  

Observação 2.2 Para sistemas de controle lineares controláveis para um tempo t > 0 sobre

n

  , a aplicação afim R n

  F : U → R torna-se sobrejetora. Ou seja, Z t −τ A u 7→ e Bu dτ

  é sobrejetora.

  Isto deixa a investigação sobre controlabilidade de Σ facilitada pela análise da sobrejetividade de F. Em geral, dados espaços vetoriais V , W e uma transformação afim F : V → W da forma 1 F x = b + T x , com b ∈ W e T : V → W linear, temos que F é sobrejetora se, e somente 1 tA n 1 se, T é sobrejetora. Além disso, como e é um isomorfismo linear de R , a sobrejetividade da aplicação F é equivalente à sobrejetividade da aplicação

  Z t −τ A u 7→ e Bu dτ.

  Apresentaremos agora o principal teorema deste capítulo n

  Teorema 2.3 O sistema de controle linear em R m

  X ˙x = Ax + c + u b i =1 i i

  é completamente controlável para um tempo t > 0 se, e somente se, j n span{A b i | j = 0, . . . , n − 1, i = 1, . . . , m} = . (2.2-3) R

  A igualdade (2.2-3) é conhecida como critério de Kalman para controlabilidade de sistemas lineares. Demonstração : Suponha que j n

  | j = 0, . . . , n − 1, i = 1, . . . , m} 6= span{A b i R . j Isto significa que o conjunto dos elementos da forma A b i , para j = 0, . . . , n − 1 e n i = 1, . . . , m

  , não geram o espaço R . Logo, existe um funcional linear ϕ 6= 0 n ϕ : →

  R R, tal que j ϕA b i = 0, j = 0, . . . , n − 1, i = 1, . . . , m. (2.2-4)

  Seja n n− 1 n− 2 p(λ) = n − A) = λ + α n− λ + α n− λ + · · · + α Id n det(λId 1 2 o polinômio característico da matriz A n×n , onde α , . . . , α n− ∈ 1 R.

  Pelo Teorema de Cayley-Hamilton, temos que: n n− n− 1 2 ϕ(A) = A + α n− A + α n− A + · · · + α Id n = 0, 1 2 logo, n− 1 n n− n− k 1 2 X

  A = β n− A + β n− A + · · · + β Id n = β k A , (2.2-5) 1 2 k =0 com β , . . . , β n− ∈ 1 R.

  Consequentemente, temos n− 1 r r k

  X r A = β A , (2.2-6) k =0 k para todo r ∈ N, e β ∈ k R. De fato, para cada r ∈ {0, 1, . . . , n − 1} podemos escrever r n− n− r 1 2 A = 0 · A + 0 · A + · · · + 1 · A + · · · + 0 · A + 0 · Id n .

  Logo, a igualdade (2.2-6) é válida para todo r ∈ {0, 1, . . . , n − 1}. Se r = n então a igualdade (2.2-6) é a própria (2.2-5). Para r > n aplicamos (2.2-5) repetidamente. Por exemplo, se r = n + 1 temos, n− n− n− 1 1 2 n n k k n k +1

  X X +1

  X A = A · A = A · β k A = β + k A = β n− · A β k A k k k =0 =0 =0 1 n− n− 1 ! 2 X k k

  X ·

  = β β A + n− n− 1 n− 1 k β k A k k =0 =0 2 X k k

  X = β + n− · β k A β k A k =0 k =0 1 n− 2 n− k 1 X

  · β · β n− 1 1 1 + = β n− n− A (β k + β n− k ) A k =0 1 X n +1 k n +1 = γ A , k =0 k n +1 · β

  · β onde γ = β k + β n− k 1 k , para k ∈ {0, 1, . . . , n − 2}, e γ = β n− n− 1 1 n− 1 . Portanto, a igualdade é válida para todo r ∈ N.

  Combinando as equações temos n− 1 n− ! 1 r r k r k

  X X ϕ (A b i ) = ϕ β A b i = β ϕA b i = 0, ∀i ∈ {1, . . . , m}, r ∈ k =0 k =0 k k N, o que implica 2 n −τ A (−τ ) (−τ ) 2 n

  ϕ e b i = ϕ Id + (−τ )A + A + · · · + A + . . . b i 2! n! 2 n

  (−τ ) (−τ ) 2 n = ϕId · b + (−τ )ϕAb + i i ϕA b i + · · · + ϕA b i + . . .

  2! n! = 0.

  Assim, m m Z t Z t −τ A −τ A

  X X ϕ e u i b i dτ = u i ϕ e b i dτ = 0. i =1 i =1 Desta forma, definindo m

  Z t −τ A

  X T (u) = e u i (τ )b i dτ, i =0 n temos que ϕ(T (u)) = 0 ∀u ∈ U. Como existe v ∈ tal que ϕv 6= 0 , segue que R

  T (u) 6= v para qualquer u ∈ U. Portanto, T não é sobrejetora. Pela Observação n concluímos que A q (t) 6= R . n n

  (t) 6= ∈ , Reciprocamente, supondo que A x R para algum x R temos que a apli- cação m

  Z t T −τ A n

  X u ∈ U 7−→ e u b dτ ∈ i =1 i i R n ∗ não é sobrejetora. Logo existe um funcional linear ϕ ∈ (R ) , ϕ 6= 0, tal que ∀u ∈ U. ϕ (T (u)) = 0, (2.2-7) s

  Considere o controle u(τ) = (0, . . . , 0, u (τ ), 0, . . . , 0) , onde a única componente não i nula é dada por:   s 1 se 0 ≤ τ ≤ s; u (τ ) = i

   se τ > s. Deste modo a equação (2.2-7) fica sendo

  Z s −τ A ϕ e b i dτ = 0. (2.2-8)

  Como ϕ é linear, a primeira derivada fica Z s Z s d d −τ A −τ A −sA 0 = ϕ e b i dτ = ϕ e b i dτ = ϕ e b i . ds ds

  Logo, −sA ϕ e b i = 0, ∀s ∈ R, i ∈ {1, . . . , m}.

  Derivando sucessivamente a igualdade acima em s = 0, obtemos k ϕ(−A b i ) = 0, i ∈ {1, . . . , m}, k ∈ N. Portanto encontramos um funcional linear não-nulo ϕ tal que j ϕA b i = 0, j ∈ {0, 1, . . . , n − 1}, i ∈ 1, . . . , m.

  Isto implica que j n | j = 0, . . . , n − 1, i = 1, . . . , m} 6= span{A b i R .

  2

  :

  Exemplo 2.4 O sistema linear em R

          −2

  ˙x 1 2 x 1

  1      

   =  + u, ˙x 2 1 −1 x 2 2 | {z } | {z } =A =b

  , x ) ∈ com (x 1 2 R , e u ∈ R, é completamente controlável. De fato, T T 2 span{b, Ab} = span{(1, 0) , (−2, 1) } = . 2 R :

  Exemplo 2.5 O sistema linear em R

          ˙x 1 a 1 a 2 x 1

  1      

   =  + u, ˙x 2 1 x 2 2 | {z } | {z } =A =b

  , x ) ∈ , a , u ∈ com (x 1 2 R , a 1 2 R, não é completamente controlável. De fato, T T T 2 span{b, Ab} = span{(1, 0) , (a , 0) } = span{(1, 0) } 6= . 1 R

  

CAPÍTULO 3

LINEARIZAđấO DE SISTEMAS DE CONTROLE

  Nosso objetivo neste capitulo é caracterizar os sistemas de controle não li- neares que são equivalentes à sistemas de controle lineares controláveis num espaço euclidiano, localmente e globalmente. Vamos introduzir algumas ferramentas impor- tantes para esta equivalência. Para tanto, sejam M uma variedade de dimensão n e f , f , . . . , f m campos de vetores em M. Estudaremos sistemas de controle não lineares 1 da forma m

  X m ˙q = f (q) + u i f i (q) q ∈ M, (3.0-1) i =1 onde u = (u , . . . , u m ) ∈ . 1 R

  Para tratarmos da linearização, o conceito fundamental é o colchete de Lie, que nos fornece informações sobre como os campos de vetores interagem entre si e sobre a comutatividade ou não dos fluxos. Além disso, o colchete de Lie também é invariante por difeomorfismos:

  ∀ V, W ∈ Φ ∗ [V, W ] = [Φ ∗ V, Φ ∗ W ] , Vec(M). (3.1-2) No caso em que os campos de vetores são da forma f (x) = Ax + c, e f i (x) = b i , i = 1, . . . , m temos, usando que 2 ( adf ) f i (x) = [f , f i ](x) = [Ax + c, b i ](x) = −Ab i , 2

  ( adf ) f i = ( adf ) ( adf ) f i = ( adf ) [f , f i ] = [f , [f , f i ]] = (−A) b i

  e, de modo geral, temos j j ( adf ) f i = [f , [· · · [f , f i ] · · · ] ] = (−A) b i , j = 0, 1, 2, . . . . (3.1-3)

  | {z }

  j-vezes

  Neste caso, novamente por temos h i h i j j j j 1 2 1 2 ( adf ) f i , ( adf ) f i = (−A) b i , (−A) b i = 0, (3.1-4) 1 2 1 2 ≥ 0 ≤ m. para todo j 1 , j 2 e 1 ≤ i 1 , i j 2 Nas condições do Teorema podemos escrever n span{(adf ) f i (x ) | 0 ≤ j ≤ n − 1, 1 ≤ i ≤ m} = T x . (3.1-5)

  R O próximo resultado fornece condições que "retificam"os campos de vetores não lineares localmente. Para a demonstração, usaremos a notação da Definição

  ∈

Lema 3.1 Sejam M uma variedade de dimensão n e V i Vec(M) i ∈ {1, . . . , k}, k ≤ n.

Existe um difeomorfismo local n

  Φ : O ⊂ → O q ⊂ M R tal que

  ∂ Φ ∗ = V i , i = 1, . . . , k, ∂ n ∂x i

  ∈ ) onde Vec(R são campos de vetores constantes na direção das coordenadas se, e somente ∂x i se, [V i , V j ] = 0 i, j = 1, . . . , k, e dim span{V (q ), . . . , V k (q )} = k, 1 isto é, os campos V i , i = 1, . . . , k formam um conjunto linearmente independente.

  Demonstração : (⇒) Basta notar que o colchete de Lie de campos de vetores constantes é nulo e, juntamente com temos o desejado. De fato,

  ∂ ∂ ∂ ∂ [V i , V j ] = Φ ∗ , Φ ∗ = Φ ∗ , = 0

  ∂x i ∂x j ∂x i ∂x j pois, Φ ∗ é um isomorfismo uma vez que Φ é um difeomorfismo local. Por este fato, e pela igualdade

  ∂ Φ ∗ = V i , i i ∈ {1, . . . , k} ∂x i temos que V são também linearmente independentes.

  (⇐) Reciprocamente, suponha que os campos de vetores formam um conjunto V , . . . , V 1 k linearmente independente no ponto q . Vamos completar este conjunto ∈ M para formar uma base para T q M. Escolhemos V k , . . . , V n ∈ Vec(M) tais que

  • +1 span{V (q ), . . . , V n (q )} = T q M.
  • 1 Como os campos V , . . . , V n são linearmente independentes no ponto q , são também 1 linearmente independentes em uma vizinhança de q . Denote por U q tal vizinhança.

      Assim, span{V (q), . . . , V n (q)} = T q M, ∀q ∈ U q . 1 Considere a aplicação n Φ : U ⊂ → U q ⊂ M

      R x n V n x 1 V 1 (x , . . . , x n ) 7→ e ◦ · · · ◦ e (q ) 1 n onde U é uma vizinhança da origem em R . Vamos mostrar que Φ é o difeomorfismo x 1 V x n 1 V n que queremos. De fato, Φ é diferenciável pois os fluxos e , . . . , e são diferenciá- veis. Além disso, ∂ def ∂

      Φ ∗ = Φ (x) ∂x i ∂x i x x =0 =0

      ∂ x n V n x 1 V 1 = e ◦ · · · ◦ e (q )

      ∂x x n i V n x i x =0 V i x 1 V 1 = e ◦ · · · ◦ e ◦ V i ◦ · · · ◦ e (q ) x =0 = V i (q )

      ∂ εV i = e (q ),

      ∂ε ε =0 ou seja, ∂ def ∂ εV i

      Φ ∗ = e (q ) = V i (q ). (3.1-6) ∂x i ∂ε x ε =0 =0

      Isto significa que n Φ ∗ : T → T q M n R leva a base canônica de R na base de T q M em q . Logo Φ ∗ é um isomorfismo. Pelo n

      ⊂ ⊂ M Teorema da Função Inversa, existem abertos O R e O q tal que

      Φ : O → O q é um difeomorfismo local. Pela Proposição a hipótese

      [V i , V j ] = 0, ∀i, j = 1, . . . , k implica que seus correspondentes fluxos comutam, isto é, x i i j j j j i i i i +x j j V x V x V x V x V V e ◦ e = e ◦ e = e , i, j = 1, . . . , k.

      Com isso podemos reescrever Φ na forma x n V n x k k i i +1 +1 i V x P k =1 V ◦ · · · ◦ e ◦ e

      Φ(x 1 , . . . , x k , x k +1 , . . . , x n ) = e (q ). Assim, para i = 1, . . . , k temos ∂ ∂

      Φ ∗ = Φ(x , . . . , x i + ε, . . . , x n ) 1 ∂x i ∂ε Φ(x) =0 ε

      P k

      ∂ x n V n x k +1 +1 V k x j j =1 V j εV i = e ◦ · · · ◦ e ◦ e ◦ e (q )

      ∂ε ε =0 x n V n x

    k +1 k +1

    V x j P k j =1 V j εV i = e ◦ · · · ◦ e ◦ e ◦ e (q ) ◦ V i ε =0 = V i (Φ(x)).

      ∈ M Isto mostra que o difeomorfismo Φ retifica localmente os campos de vetores V i .

      

    Teorema 3.2 (Linearização local) Sejam M uma variedade de dimensão n, q ∈ M, , . . . , f m ∈

      e f Vec(M). Existe um difeomorfismo local n

      ⊂ M → O ⊂ Φ : O q R tal que

      (Φ ∗ f ) (x) = Ax + c, x ∈ O (3.1-7) (Φ f ) (x) = b , x ∈ O , i = 1, . . . , m ∗ i i n n (3.1-8) onde c ∈ R , A ∈ M n ( i ∈ satisfazendo a condição de

      R) é uma matriz constante real e b R controlabilidade se, e somente se, j span{(adf ) f i (q )} = T q M (3.1-9) h i j j 1 2

      ( adf ) f i , ( adf ) f i (q) = 0, ∀q ∈ U q (3.1-10) 1 2 ≤ n − 1, ≤ m. com 0 ≤ j, j 1 , j 2 e 1 ≤ i, i 1 , i 2 Demonstração : (⇒) Por hipótese, a condição de controlabilidade é satisfeita.

      Então temos j n span{A b i | j = 0, . . . , n − 1, i = 1, . . . , m} = R e, por podemos escrever j n span{(adΦ ∗ f ) Φ ∗ f i (x)} = T x (3.1-11) R para j = 1, . . . , n − 1, i = i, . . . , m. Assim, se x ∈ O , por temos h i j j 1 2 0 = ( adΦ ∗ f ) Φ ∗ f i , ( adΦ ∗ f ) Φ ∗ f i (x) 1 2 h h i i

      = Φ ∗ f , · · · [f , f i ] · · · , f , · · · [f , f i ] · · · (x) 1 2 h i j j 1 2 = Φ ( ) f , ( ) f (x) ∗ adf i adf i 1 2 h i j j − 1 2 1

      = Φ ∗ − ( adf ) f i , ( adf ) f i Φ (x) Φ 1(x) 1 2 h i j j 1 2 1 ∗ : T q M → T x q , = Φ ∗ q ( adf ) f i , ( adf ) f i (q) , onde Φ (x) = q ∈ O q . n 1 2 Como Φ q R é isomorfismo para cada q ∈ O temos que h i j j 1 2 ( adf ) f i , ( adf ) f i (q) = 0, 1 2 ou seja h i j j 1 2 ( adf ) f i , ( adf ) f i (q) = 0, ∀q ∈ O q . 1 2 Isto prova

      De (3.1-11) temos n j T R = span{(adΦ ∗ f ) Φ ∗ f i (0)}

      = span{Φ ∗ [f , [· · · [f , f i ]] · · · ] (0)} j = span{Φ ∗ ( adf ) f i (q )}. − n 1 q0 → T

      Visto isso, e novamente que Φ : T R q M é isomorfismo, obtemos − j j 1 q0 Φ Φ ∗ ( adf ) f i (q ) = ( adf ) f i (q ). q0 q0 Consequentemente, j

      ) f i (q )} = T q M, span{(adf par todo j = 1, . . . , n − 1, e i = 1, . . . , m. Isto prova

      (⇐) M

      Reciprocamente, da hipótese podemos extrair uma base para T q for- j mada por vetores da forma (adf ) f i (q ). Por simplicidade, denotaremos j α ( adf ) f i α = Y α α = 1, . . . , n.

      Assim, obtemos T q M = span{Y α (q ) | α = 1, . . . , n}, segue que dim span{Y α (q ) | α = 1, . . . , n} = n.

      Devido a hipótese temos [Y α , Y α ] (q) = 0, ∀q ∈ U q 1 ≤ α , α ≤ n. 1 2 1 2 Pelo Lema existe um difeomorfismo local: n Φ : O q ⊂ M → O ⊂

      R tal que ∂ Φ ∗ (Y α ) = , α = 1, . . . , n. ∂x α

      Vamos mostrar que Φ é o difeomorfismo desejado. De fato, como Φ é um difeomor- fismo local e f i para i = 1, . . . , m, são campos de vetores em M, temos que Φ ∗ f i são n ⊂ campos de vetores induzidos em O R . Assim, podemos escrevê-los em coordena- das locais. Para cada i = 1, . . . , m temos n

      X i ∂ Φ ∗ f i (x) = b (x) , α i n α =1 ∂x α

      ⊂ → com b : O R R funções reais. Escrevemos também os campos de vetores cons- α tantes em coordenadas locais n

      X ∂ ∂ β

      Φ ∗ (Y β ) = = a (x) , β = 1, . . . , n, α ∂x β ∂x α α =1

      β n

      : O ⊂ → com a R R funções reais dadas por α   β 1 se α = β, a (x) = α

       se α 6= β. Com isso obtemos, pela Proposição que n i β

      X ∂ ∂b ∂a ∂ β α i α

      − b , Φ ∗ f i = a κ κ

      ∂x β ∂x κ ∂x κ ∂x α α,κ =1 n i

      X β α ∂b ∂ = a κ α,κ =1 n i ∂x κ ∂x α

      X ∂b ∂ α

      = . (3.1-12) α =1 ∂x β ∂x α Por outro lado

      ∂ , Φ ∗ f i = [Φ ∗ Y β , Φ ∗ f i ] = Φ ∗ [Y β , f i ]

      ∂x β h i j β = Φ ∗ ( adf ) f i , ( adf ) f i β = Φ ∗ 0 = 0. (3.1-13)

      Agora, por (3.1-12) e (3.1-13), temos n i

      X ∂b (x) ∂ α = 0. α =1 ∂x β ∂x α

      Logo i ∂b (x) α i

      = 0 =⇒ b (x) = constante α ∂x β para cada i = 1, . . . , m e todo α = 1, . . . , n. Isto implica que, n Φ ∗ f i (x) = b i ∀x ∈ O i = 1, . . . , m

      ∈ com constantes b i R . Aqui fica provado Analogamente, escrevemos n

      X ∂

      Φ f (x) = b (x) , ∗ α n α =1 ∂x α em coordenadas locais, onde b α : O ⊂ → R R são funções reais para cada α = 1, . . . , n. E para cada γ = 1, . . . .n, os campos constantes em coordenadas locais ficam ∂

      ∂x γ (x) = n

      ∂x β , Φ ∗ f = Φ ∗ (Y γ ) , [Φ ∗ (Y β ) , Φ ∗ f ]

      ∂x β ∂x κ ∂

      ∂x α = n

      X α =12 b α

      ∂x β ∂x γ ∂

      ∂x α . Por outro lado,

      ∂ ∂x γ

      , ∂

      = Φ ∗ (Y γ ) , Φ ∗ [Y β , f ] = Φ ∗ Y γ , [Y β , f ] = Φ ∗ h

      = n

      ( adf ) j γ f i γ , h ( adf ) j β f i β , f ii

      = Φ ∗ h ( adf ) j γ f i γ , − h f , ( adf ) j β f i β ii

      = −Φ ∗ h ( adf ) j γ f i γ , ( adf ) ( adf ) j β f i β i

      = −Φ ∗ h ( adf ) j γ f i γ , ( adf ) j β +1 f i β i

      = 0, devido a hipótese Consequentemente, n

      X α =12 b α

      ∂x β ∂x γ ∂

      X α,κ =1 a γ κ2 b α

      ∂ ∂x α

      X α =1 a γ α (x) ∂

      X α =1 a γ α

      ∂x γ , onde a γ α : O ⊂

      R n

      R são funções reais dadas por: a γ α (x) =    1 se α = γ, se α 6= γ. Logo, pela Proposição temos

      ∂ ∂x γ

      , ∂

      ∂x β , Φ ∗ f =

      " n

      ∂x γ , n

      ∂a γ α ∂x κ

      X α =1 ∂b α

      ∂x β ∂

      ∂x α #

      = n

      X α,κ =1 a γ κ2 b α

      ∂x β ∂x κ −

      ∂b κ ∂x β

      ∂x α = 0. Isto significa que, 2 ∂ b α

      = 0, ∀α = 1, . . . , n ∂x β ∂x γ n

      ∈ ou seja, para cada α = 1, . . . , n existem A α = (A α 1 , . . . , A αn ) ∈ R e c α R tais que b α (x) = A α x + c α . Logo, obtemos uma matriz constante real A n×n formada por A α s e n uma constante c ∈ R formada por c α s tais que Φ f (x) = Ax + c, provando obtemos o sistema de controle linear em n

      ⊂ O R m

      X ˙x = (Φ ∗ f ) (x) + u i (Φ ∗ f i ) (x) m i =1

      X = Ax + c + u i b i . i =1 Resta mostrarmos que o sistema acima satisfaz a condição de controlabilidade

      Com efeito, temos que j α ∗ : T q M → T q M = span{(adf ) f i α (q )}, ∀α = 1, . . . , n. n Como Φ R é isomorfismo, então j j α α n n Φ ∗ ( adf ) f i (q ) = ( adΦ ∗ f ) Φ ∗ f i (0) α α é base para T R = R , e por temos j α n span{(−A) b i | α = 1, . . . , n} = . α R

      Para provarmos a versão global do último resultado, precisaremos de alguns resulta- dores auxiliares. n

      um subgrupo. Então H é discreto se, e somente se, a origem

      Proposição 3.3 Seja H ⊂ R n 0 ∈ é isolado.

      R Demonstração : (⇐) Provaremos por contra-positiva. Suponha que H não é discreto.

      Então existe h ∈ H tal que B(h , ǫ) ∩ (H \ {h }) 6= ∅ ∀ǫ > 0.

      Com isso, obtemos uma sequencia (h n ) ⊂ (H \ {h }) que converge a h , ou seja → h ⇒ − h h n (h n ) → 0. Repare que (h n − h ) ∈ H pois, H é subgrupo. Portanto, n B(0, ǫ) ∩ (H \ {h }) 6= ∅ ∀ǫ > 0, ou seja, a origem 0 ∈ R é não isolada.

      (⇒) A reciproca é óbvia.

      A demonstração do próximo resultado, de natureza puramente algébrica, pode ser encontrada em Proposição 4.2. n n é um subgrupo discreto não-trivial, então existem e 1 , . . . , e k em R

      Lema 3.4 Se H ⊂ R

      linearmente independentes tais que ( ) k

      X H = z i e i | z i ∈ . i =1 Z Neste caso, o subgrupo H é chamado de reticulado. k k k No próximo resultado, denotaremos por T o quociente de um espaço euclideano por um reticulado H ⊂ R . Com essa notação, estabelecemos um resultado sobre R linearização global:

      

    Teorema 3.5 (Linearização global) Sejam M uma variedade conexa de dimensão n, e f , f . . . , f m

    1

      campos de vetores em M, m ≤ n. Existe um difeomorfismo global k n−k Φ : M → × k ≤ n

      T R k n−k

      × , tal que, para todo x ∈ T R temos (Φ ∗ f ) (x) = Ax + c, (3.2-14) n ( (Φ ∗ f i ) (x) = b i , i = 1, . . . , m (3.2-15) onde A ∈ M R) é uma matriz real constante, com as primeiras k-linhas nulas: n A e i = 0 i = 1, . . . , k (3.2-16)

      ∈ e c, b i R são constantes satisfazendo as condições de Kalman se, e somente se, h i j j 1 2 0 = ( adf ) f i , ( adf ) f i (q), (3.2-17) 1 j 2 T q M = span{(adf ) f i (q)}, (3.2-18) j

      ( ) f − adf i são campos de vetores completos, (3.2-19) para todo 0 ≤ j, j , j ≤ n − 1 , 1 ≤ i, i , i ≤ m , e q ∈ M. 1 2 1 2 Demonstração : (⇐) Fixe q ∈ M. Pela hipótese podemos encontrar n vetores j α da forma Y α = ( adf ) f i α tais que span{Y 1 (q ), . . . , Y n (q )} = T q M, para α = 1, . . . , n. Vamos mostrar que Y α , para α = 1, . . . , n, são linearmente indepen- dentes em todo ponto de M. Considere o conjunto L = {q ∈ M | span{Y (q), . . . , Y n (q)} = T q M }. 1 Afirmamos que L = M. De fato, L é um conjunto aberto pois, dado um ponto x ∈ L, temos que span{Y 1 (x), . . . , Y n (x)} = T x M. Como os vetores Y α (x) para α = 1, . . . , n são linearmente independentes em x, são também linearmente independentes em uma vizinhança aberta V de x, ou seja,

      ∀y ∈ V, span{Y 1 (y), . . . , Y n (y)} = T y M logo x ∈ V ⊂ L. Vamos mostrar que L é um conjunto fechado. Para todo i, j nas condições dadas e q ∈ L, temos que n j ij

      X ij ∞ ij ( adf ) f i (q) = a Y α (q), α =1 α onde a ∈ C (L) . Mostraremos que a são constantes. De fato, por e a regra α α de Leibniz, temos " # ! ! n n n n

      X ij ij ij ij

      X X

      X 0 = Y + β , a Y α = Y β a Y α a [Y β , Y α ] = Y β a Y α n α α α α =1 =1 =1 =1 α α α α

      X ij = Y β a Y α . α =1 α Como Y α são linearmente independentes então, ij ij ij Y a = 0, ∀ α, β = 1, . . . , n. β α Lembrando que (Y β a )(q) = D q a · Y β (q) (ver subseção temos α α ij ij

      ⇒ ∀q ∈ L, Y β a = 0 D q a = 0, α α que implica em ij ij ij a (q) = K , ∀q ∈ L α α onde K são constantes reais. α

      ∈ L → x Agora, dado qualquer x ∈ L, existe uma sequencia x n tal que x n . Como x n ∈ L então n j

      X ij j ( adf ) f i (x n ) = K Y α (x n ) α =1 α → x como x n e (adf ) f i são continuas então j j

      ( adf ) f i (x n ) → ( adf ) f i (x) e n n

      X ij ij

      X α =1 α =1 K Y α (x n ) → K Y α (x). α α Como limite é único, obtemos n j ij

      X ( adf ) f i (x) = K Y α (x) α =1 α

      ∈ L,

      e, portanto, x ∈ L. Assim, o conjunto L é não vazio, pois q aberto e fechado em M. Como M é conexo, segue que L = M e os campos Y α , para α = 1, . . . , n, são linearmente independentes em M. j

      Como os campos (adf ) f i são completos, (hipótese podemos definir a aplicação n → M,

      Ψ : R x = (x x Y x Y 1 1 n n 1 , . . . , x n ) x 7→ e ◦ · · · ◦ e (q ).

      Pela hipótese temos que os campos de vetores comutam, logo

      P n α =1 x α Y α

      Ψ(x 1 , . . . , x n ) = e (q ). Temos que Ψ é diferenciável e a diferencial é um isomorfismo. De fato, para cada α = 1, . . . , n

      ∂Ψ d (x) = Ψ(x 1 , . . . , x α + ǫ, . . . , x n )

      ∂x α dǫ x =0 ǫ =0

      P n

      d β =1 x Y ǫY α β β ◦ e

      = e (q ) dǫ ǫ =0

      P n β =1 x Y ǫY β β α

      = e ◦ e (q ) ◦ Y α ǫ =0

      P n β =1

    x Y

    β β

      = e (q ) ◦ Y α = Y α (Ψ(x)). n n Desta forma, a diferencial Ψ ∗x : → T q M transforma a base canônica de R na base

      R n {Y } 1 , . . . , Y n de T q M . Logo Ψ ∗x é um isomorfismo em cada ponto x ∈ R . Como n consequência, Ψ é um difeomorfismo local em cada x ∈ R . n n

      Vamos mostrar que Ψ(R ) = M. De fato, Ψ(R ) é aberto em M pois, dado qualquer n n n y ∈ Ψ( ) existem x ∈ R , abertos U x ⊂ e V y ⊂ M tais que R R

      Ψ : U x → V y

      ) é um difeomorfismo local. Logo, Ψ(U x é uma vizinhança aberta de y contida em n n n

      Ψ( ). Temos também que Ψ(R ) é fechado em M. De fato, dado qualquer q ∈ Ψ(R ) R fixado, podemos definir a aplicação n

      Φ : → M, R dada por

      P n α =1 y Y α α

      Φ(y 1 , . . . , y n ) = e (q), n que satisfaz as mesmas propriedades que a aplicação Ψ. Como consequência, Φ(R ) é n um subconjunto aberto contendo q. Como q ∈ Ψ(R ) , então n n Φ( ) ∩ Ψ( ) 6= ∅. ′ n ′ n ′ ′ ′ n R R Segue que existe y ∈ tal que Φ(y ) ∈ Ψ( ) , logo Φ(y ) = Ψ(x ) para algum x ∈ ,

      R R R temos ′ ′

    ′ y Y α x Y α ′

    P n P n α =1 α =1

    α α

    Φ(y ) = e (q) = e (q) = Ψ(x ).

      Com isso, e novamente pelo fato dos campos de vetores serem completos,

      P n α =1 (x α −y α )Y α q = e (q ) = Ψ(x − y). n n

      Segue que existe z = x − y ∈ R tal que Ψ(z) = q, isto é, q ∈ Ψ(R ) concluindo que n n Ψ( R ) é fechado. Como Ψ(R ) é não vazio, aberto e fechado em M, que é conexa, n concluímos que Ψ(R ) = M.

      Defina o conjunto 1 n n = Ψ (q ) = {x ∈ | Ψ(x) = q } ⊂ .

      G R R n Note que G 6= ∅ pois 0 ∈ G . Além disso G é um subgrupo de R pois, se x, y ∈ G então, n n

      P P α α =1 =1

    x Y y Y

    α α α α

      Ψ(x) = e (q ) = q = e (q ) = Ψ(y) logo, n n n n

      P P P P

    α α α α =1 =1 =1 =1 (x α +y α )Y α α α α α α α x Y y Y y Y Ψ(x + y) = e (q ) = e ◦ e (q ) = e (q ) = q . Assim mostramos que x + y ∈ G . Mais ainda, dado x ∈ G temos n n

      P P α α =1 =1 (−x α )Y α α α − x Y

      Ψ(−x) = q ◦ e = q ◦ e = q − x Y x Y P n P n α α =1 =1 α α α α ◦ e ◦ e pois q é a trajetória reversa de q . Concluímos aqui que G é n n um subgrupo de R . Além disso, G é discreto pois na origem 0 ∈ R existem abertos n

      U ⊂ e V q ⊂ M tais que Ψ: U → V q é um difeomorfismo local. Isso significa que R

      ∩ não pode existir um ponto x ∈ U com x 6= 0, caso contrario, Ψ(0) = Ψ(x) = q , G n violando a injetividade de Ψ em U . Logo, a origem é um ponto isolado de G em R . n Portanto, pela Proposição G é um subgrupo discreto de R .

      Definimos a aplicação n R

      Ψ : → M G n x 7→ Ψ(x), onde x ∈ R é um representante da classe x. Temos que Ψ é bem definida e injetora pois, x = y ⇔ x − y = 0

      ⇔ x − y ∈ G

      ⇔ Ψ(x − y) = q

      P n α =1

    (x α −y α )Y α

      ⇔ e (q ) = q

      P n P n α α =1 =1 x Y y Y α α α α

      ⇔ e (q ) = e (q ) ⇔ Ψ(x) = Ψ(y) ⇔ Ψ(x) = Ψ(y).

      Mais ainda, Ψ é um difeomorfismo local devido a Ψ. Por simplicidade, denote Ψ = Ψ. Temos assim n

      R Ψ : → M

      G n R

      é uma aplicação injetora e um difeomorfismo local em cada ponto de , consequente- G mente Ψ é um difeomorfismo global. Pelo Lema G é reticulado. Logo, o quociente

      é um cilindro: n R k n−k = × .

      T R G Finalmente, obtemos um difeomorfismo global: − k n−k 1 Φ = Ψ : M → × .

      T R Resta mostrar que Φ satisfaz as condições desejadas. De fato, a hipótese é satisfeita, com a mesma demons- tração do Teorema

      Mostramos que Ψ ∗ é isomorfismo verificando as ∂ Φ ∗ = Y α , α = 1, . . . , n. ∂x α

      Logo, 1 ∂ Φ ∗ (Y α ) = Ψ (Y α ) = . ∂x α

      Visto isso, com a hipótese n R

      Finalmente, o campo Ax + c está bem definido no quociente pois Φ ∗ é um iso- G morfismo. Se x ∈ G então, x = 0 ⇒ Ax + c = A0 + c = c ⇒ Ax = 0.

      Como e i formam uma base para o reticulado G , temos que e i ∈ ⇒ A e i = 0, G para todo i = 1, . . . , k. Isto mostra

      (⇒) Reciprocamente, temos o sistema linear (Φ ∗ f ) (x) = Ax + c, n (Φ ∗ f i ) (x) = b i , i = 1, . . . , m

      R sobre o cilindro . Note que j G j j j 1 j −A b i = ( adΦ ∗ f ) Φ ∗ f i = Φ ∗ ( adf ) f i ⇒ Φ −A b i = ( adf ) f i . j

      b ) Como os campos (−A i são constantes, não dependem do tempo t. Consequente- j mente (adf ) f i não dependem de t, logo são campos completos, mostrando

      Além disso, h i h i j j j j 1 2 1 2 0 = ( ∗ f ) Φ ∗ f i , ( ∗ f ) Φ ∗ f i = Φ ∗ ( ) f i , ( ) f i . adΦ adΦ adf adf 1 2 1 2 Como Φ ∗ é isomorfismo, obtemos h i j j 1 2

      ∀q ∈ M, ( adf ) f i , ( adf ) f i = 0, 1 2 mostrando temos que j n

      R span{(adΦ ∗ f ) Φ ∗ f i (x)} = T x . G

      Como Φ é isomorfismo, podemos obter − R 1 n Φ : T x → T q M, x = Φ ∗ (q). ∗x G

      Portanto, j span{(adf ) f i (q)} = T q M, mostrando 3

      :

      Exemplo 3.6 Considere o sistema não linear sobre R

            2 ˙x x − 2x x + x 4x x 1 2 2 3 3 2 3

                 

      = u, (3.2-20)

    • ˙x x −2x

       2   3   3       

      ˙x 3

      1 com     2 x − 2x x + x 4x x 2 2 3 3 2 3

              f = , e g = . x −2x

       3   3     

      1 Temos que ( adf) g(x) = [f, g](x) = Jac(g(x))f(x) − Jac(f(x))g(x), que é:         2 0 4x 4x x − 2x x + x 0 1 − 2x −2x + 2x 4x x 3 2 2 2 3 3 3 2 3 2 3

                     

      − ,

      −2 −2x x 3

      1 3                

      1 e fazendo os cálculos, obtemos  

      2x 2     ( adf) g(x) = .

      −1   2   g(x) = [f, [f, g]] = Jac([f, g](x))f (x) − Jac(f (x))[f, g](x),

      Temos também que ( adf) que é:

              2 0 2 0 x − 2x x + x 0 1 − 2x −2x + 2x 2x 2 2 3 3 3 2 3 2                

      − , 0 0 0 x

      1 −1    3              0 0 0 resolvendo, obtemos

       

      1 2     ( g(x) = . adf)

          2 Com cálculos simples, podemos mostrar que o conjunto {g, ( adf) g, (adf) g} é um conjunto 3 linearmente independente para todo x ∈ R . Consequentemente, 2 3 span{g, ( adf) g, (adf) g} = , 3 R . para todo x ∈ R Analogamente, obtemos também que j l 3 [( adf)

      g, ( adf) g](x) = 0, 2 para todo x ∈ R e 0 ≤ j, l ≤ 2. Finalmente, como g, ( adf) g, e (adf) g não dependem garante que existe do tempo t, segue que são campos completos. Desta forma o Teorema um difeomorfismo global Φ que transforma o sistema não linear em um sistema linear

      3 3

      → controlável. De fato, defina Φ : R R dada por 2 2 Φ(x , x , x ) = (x + x , x + x , x ) = (z , z , z ). 1 2 3 1 2 2 3 3 1 2 3 Assim, o sistema com as novas coordenadas (z 1 , z 2 , z 3 ) têm a forma  

      ˙z = z  1 2

       

      ˙z = z 2 3     3 ˙z 3 = u, que é um sistema linear em R . Podemos escrever este sistema como

      ˙z = A(z) + bu, onde     0 1 0        

      A = , b = , 0 0 1         2 0 0 0 T T T

      1 3 e obtemos span{b, Ab, A b} = span{(0, 0, 1) , (0, 1, 0) , (1, 0, 0) } = , satisfazendo a con- R dição de Kalman.

      

    CAPÍTULO 4

    O TEOREMA DA ốRBITA E APLICAđỏES

      Neste capitulo retornaremos ao estudo dos conjuntos atingíveis definido em mas agora através de um conjunto com uma estrutura mais simples, a órbita de uma família F ⊂ Vec(M). Esta têm a propriedade bastante natural de ser subvariedade imersa de M, como será demonstrado no Teorema da Órbita. Primeiramente tratare- mos das subvariedades imersas, que são requisitos importantes para introduzirmos o Teorema da Órbita. Veremos também como alguns resultados ficam simplificados no caso analítico, e concluiremos este capitulo retornando ao estudo dos conjuntos atingí- veis.

      Esta seção tem o objetivo de fixar a definição de subvariedade que aparece natural- mente na descrição do Teorema da Órbita. O conceito de subvariedade tem interpre- tações distintas na literatura, dependendo do contexto ou necessidade. Para o nosso objetivo, trabalharemos com subvariedades imersas.

      

    Definição 4.1 Sejam M, N variedades de dimensões n, k respectivamente e ϕ : M → N uma

      aplicação diferenciável. Dizemos que ϕ é uma imersão se, para cada q ∈ M, a diferencial no ponto q é uma aplicação injetora, isto é D q ϕ : T q M → T ϕ N, com kerD q ϕ = {0}. (q)

      

    Definição 4.2 Dizemos que um subconjunto W ⊂ M é uma subvariedade imersa de di-

      mensão k ≤ n de M se existir uma imersão injetora de uma variedade N de dimensão k em M :

      Φ : N → M, tal que W = Φ(N ). De forma equivalente, uma subvariedade imersa W de M pode ser definida como uma variedade contida em M tal que a inclusão i : W → M, q 7→ q

      é uma imersão. Desta forma, temos que se W é uma variedade contida em M e para cada p ∈ W existe uma vizinhança V de p em W tal que V é subvariedade de M, então W é subvariedade de M. Usaremos este fato para mostrarmos o Teorema da Órbita.

      

    Observação 4.3 Uma subvariedade imersa em geral herda uma topologia menos fina que a

      topologia induzida pelo espaço ambiente, logo não é necessariamente uma subvariedade mergu- lhada, de acordo com a Definição

      Porém, vizinhanças apropriadas suficientemente pequenas em uma subvariedade imersa são subvariedades mergulhadas. 2 uma imersão injetora tal que

      Exemplo 4.4 Seja Φ : R → R t→ lim Φ(t) = Φ(0). +∞ 2 .

      A imagem Φ(R) é uma subvariedade imersa de R Os conjuntos Φ(−ǫ, ǫ) para todo ǫ > 0, são 2 abertos na topologia herdada de R mas não são abertos na topologia induzida de R . Logo, 2 Φ : R → R não é um mergulho. Portanto Φ(R) não é subvariedade no sentido da definição

      Um exemplo menos trivial e mais interessante é:

      

    Exemplo 4.5 (Curva de Kronecker) Considere o oscilador com 2 graus de liberdade descrito

      pelas equações: ˙z(t) = iαz(t), z(t) ∈

      C (4.1-1) w(t) = iβw(t), ˙ w(t) ∈

      C, com α e β constantes reais não-nulas. Este possui as seguintes soluções: iαt z(t) = z(0)e , iβt (4.1-2) w(t) = w(0)e .

      Repare que a norma de z(t), é: iαt |z(t)| = |z(0)e |

      = |z(0)| · | cos(αt) + i sin(αt)| q 2 2 = |z(0)| · cos (αt) + sin (αt) = |z(0)| = constante.

      Analogamente obtemos, |w(t)| = |w(0)| = constante. Logo, toda solução de pertence ao Toro invariante: 2 2

      = {(z, w) ∈ ; |z| = k e |w| = k , k , k ∈ T C 1 2 2 1 2 R}.

      Note que a reciproca é verdadeira, isto é, cada par (z, w) ∈ T corresponde a condições iniciais . Lembrando que este toro é parametrizado pelos para argumentos de z e w módulo 2π, obtemos 2 2 C R

      ≃ ≃ T . 2 2 (2π (2π

      Z) Z) β τ = βt. Introduzimos um novo parâmetro τ = αt que implica em Temos assim, a reta que α

      β

      passa pela origem com ângulo α 2 λ :

      R → R β β τ 7→ λ(τ ) = τ, 2 α com gráfico Graf(λ) = {(τ, τ ) | τ ∈ R} ⊂ R . α Defina a aplicação 2 R

      ϕ : Graf(λ) → 2 (2π β β Z)

      (τ, τ ) 7→ (τ + 2π τ + 2π 2 α α Z, Z), R ou seja, as soluções (z, w) ∈ são imagens da reta λ(τ). Claramente ϕ é injetora, e uma 2

      (2π Z) imersão pois a matriz Jacobiana

        1 0  

      Jac(ϕ) = α β possui determinante não-nulo. Logo, as soluções de são imagens de uma imersão inje- tora, e portanto são subvariedades imersas do Toro invariante. β

      Se é irracional, as soluções são conhecidas como Curvas de Kronecker que, intuitiva- α mente, são enrolamentos densos de retas λ(t) no toro. Portanto, cada Curva de Kronecker é uma subvariedade imersa mas, não uma subvariedade.

      

    Observação 4.6 As subvariedades imersas herdam muitas propriedades locais das subvarie-

    dades. Enunciaremos as que serão úteis posteriormente.

      (i) Seja W uma subvariedade imersa de M. Assim, existe uma imersão injetora Φ de uma variedade N em M tal que Φ(N) = W. Restringindo à imagem, a diferencial de Φ num ponto p ∈ N

      D p Φ : T p N → T q W, Φ(p) = q é isomorfismo, logo D p Φ(T p N ) = T q W.

      (ii) Seja V ∈ Vec(M). Então, tV V (q) ∈ T q W, ∀q ∈ W ⇐⇒ e (q) ∈ W, (4.1-3) para |t| suficientemente pequeno.

      A demonstração é análoga à demonstração do Teorema

      Seja F ⊂ Vec(M) uma família de campos de vetores. Vamos estudar o conjunto atingí- vel de F a partir de um ponto q ∈ M num tempo t ≥ 0, k n o t f t f 1 1 k k

      X A q (t) = e ◦ · · · ◦ e (q ) | f i ∈ F, t i = t, k ∈ i =1 N usando a órbita à partir de um ponto, que é definida a seguir:

      Definição 4.7 A Órbita de uma família F a partir de um ponto q ∈ M é definida por: t f t f 1 1 k k

      O = {e ◦ · · · ◦ e (q ) | f ∈ F, t ∈ q i i R, k ∈ N}. (4.2-4) Abaixo comparamos o conjunto de pontos atingíveis para uma família F partindo de um ponto q num tempo t ≥ 0 (figura (a)), com a órbita partindo do mesmo ponto e para a mesma família (figura (b)).

      (a) Conjunto atingível A q . (b) Órbita O q .

      

    Observação 4.8 É importante notar que no conjunto atingível temos t ≥ 0, e para a órbita

      temos t ∈ R. Intuitivamente, a órbita é um conjunto que abrange os pontos atingíveis, isto é, A ⊂ O q q . Repare que a igualdade A q = O q , depende da simetria da família F. De modo formal, se

      F = −F, então O q ∋ e −t 1 f 1 ◦ · · · ◦ e −t k f k (q ) = e t 1 (−f 1 ) ◦ · · · ◦ e t k (−f k ) (q )

      = e t 1 f 1 ◦ · · · ◦ e t k f k (q ) ∈ A q .

      Assim, O q = A q . Defina em M uma relação (∼): q 1 ∼ q 2 ⇔ q 1 ∈ O q 2 .

      A relação (∼) é: (i) Reflexiva pois, claramente q 1 ∈ O q 1 , logo q 1 ∼ q 1 . (ii) Simétrica pois, se q 1

      ∈ O q 2 , então q 1 = e t 1 f 1 ◦ · · · ◦ e t k f k (q 2 ), t i ∈

      R, f i ∈ F. Logo, e s k f k

      ◦ · · · ◦ e s 1 f 1 (q 1 ) = q 2 , onde s i = −t i ∈ R. Portanto, q 2

      ∈ O q 1 ⇒ q 2 ∼ q 1 .

      (iii) Transitiva pois, se q 1 ∼ q 2 e q 2 ∼ q 3 então q 1 ∈ O q 2 ⇒ q 1 = e t 1 f 1 ◦ · · · ◦ e t k f k (q 2 )

      e, q 2 ∈ O q 3 ⇒ q 2 = e s 1 g 1 ◦ · · · ◦ e s k g k (q 3 ), onde s i ∈

      R e g i ∈ F. Logo, q 1 = e t 1 f 1 ◦ · · · ◦ e t k f k

      ◦ e s 1 g 1 ◦ · · · ◦ e s k g k (q 3 ).

      Portanto, q 1 ∈ O q 3 ⇒ q 1 ∼ q 3 .

      Concluímos que (∼) é uma relação de equivalência em M. Consequentemente, as classes de equivalência de M

      = {O q | q ∈ M } são órbitas.

      Introduziremos as seguintes notações

      def

      ( AdP) F = {( AdP ) f | P ∈ P, f ∈ F}, onde t f t f 1 1 k k P = {e ◦ · · · ◦ e | t i ∈ i ∈ F, k ∈

      R, f N} ⊂ Diff(M) é o subgrupo de difeomorfismos gerado pelos fluxos correspondentes aos campos f i ∈

      F, e

      def Π q = span{(AdP)F(q)} ⊂ T q M, q ∈ M.

      Lema 4.9 Para q ∈ M , dim Π q = dim Π q para todo q ∈ O q .

      Demonstração : Dado q ∈ O q podemos escrever q = Q(q ), com Q ∈ P. Seja

      ( ) ∈ Π AdP ) f(q q um elemento arbitrário. Lembrando a subseção temos

      Q ∗ (( )) = q ◦ ( AdP ) f(q AdP ) f ◦ Q 1

      = q ◦ P ◦ f ◦ P ◦ Q − − 1 1 ◦ Q) ◦ Q ◦ P ◦ f ◦ P ◦ Q

      = (q 1 = q ◦ ◦ P f

      Ad Q 1 1 = Ad Q ◦ P f (q) ∈ Π q , ◦ P ∈ P. ⊂ Π pois Q Isto mostra que Q ∗ Π q q . Como R ∗ é isomorfismo, concluímos 1 que dim Π q ≤ dim Π q . Agora, podemos escrever q = Q (q) e aplicar o argumento acima, invertendo os papéis de q e q . Assim, obtemos a desigualdade oposta e, conse- quentemente, a igualdade.

      Enunciamos agora o principal resultado deste capitulo.

      

    Teorema 4.10 (Teorema da Órbita (Nagano-Sussmann)) Sejam F ⊂ Vec(M) uma famí-

      lia de campos de vetores e q ∈ M. Então

      (i) A órbita O q é uma subvariedade conexa imersa de M, (ii) T q O q = span{(AdP )f(q) | P ∈ P, f ∈ F} para todo q ∈ O q .

      A demonstração do Teorema da Órbita é longa e será dividida em diversos lemas, que terão natureza extremamente técnica. Antes de enunciarmos tais lemas, daremos uma ideia geral da demonstração do Teorema da Órbita: para cada q ∈ M, definire- k mos certas aplicações ξ q tendo como domínio um espaço R , para k menor ou igual a dimensão de M, e cuja imagem está contida na órbita através de q. Mostraremos que restringindo convenientemente seu domínio, ξ q é uma imersão. Portanto, as imagens destas aplicações serão subvariedades imersas de M. Mostraremos que essas imagens dão origem a uma topologia em M, mais fina que a topologia original. Em relação a essa topologia, as órbitas serão as componentes conexas de M (e, consequentemente, serão conexas). À partir daí usamos novamente as aplicações ξ q para munir cada órbita de uma estrutura de variedade diferenciável. Como as imagens das aplicações ξ q são abertas na órbita (em relação à nova topologia), temos que cada ponto da órbita pos- sui uma vizinhança que é uma variedade imersa, de onde concluímos que a própria órbita é subvariedade imersa conexa. A prova do item (ii) será consequência dessa construção.

      ∈ (AdP)F

      Lema 4.11 Para cada q ∈ M, escolha V 1 , . . . , V m tais que

      span{V (q), . . . , V m (q)} = Π q 1 e defina m ξ q : → M

      R t 1 V t m 1 V m (t , t , . . . , t m ) 7→ e ◦ · · · ◦ e (q). 1 2 m Então existe uma vizinhança O da origem em R tal que ξ| é uma imersão e ξ q (O ) ⊂ O q . O : Primeiramente, observe que, ξ q é diferenciável e

      Demonstração ∂ ξ q (t) = V i (q), i = 1, . . . m. ∂t i t =0

      Logo, m D ξ q : → Π q ⊂ T q M.

      R

      ξ Pelo Teorema do Núcleo e da Imagem, temos que D q é injetora. Pela Forma Local das m Imersões, ξ q é localmente injetora, isto é, existe uma vizinhança W ⊂ da origem tal

      R que, ξ : W → M q é injetora. Temos que V i (q) , para i = 1, . . . , m, são linearmente independentes em q, logo são ⊂ M. também linearmente independentes em uma vizinhança U q m m

      Seja U q ∩ ξ q ( ) , que é aberto em ξ q ( ). Como ξ q é continua obtemos um subcon- R R junto aberto 1 m m Z = ξ (U q ∩ ξ q ( )) ⊂ . m q R R

      ∩ W ⊂ Considerando S = Z R , temos uma imersão injetora:

      ξ q : S → M,

      e, como toda imersão é localmente um mergulho, existe uma vizinhança suficiente- mente pequena O tal que ξ q : O ⊂ S → ξ q (O ) é um homeomorfismo. Portanto ξ q (O ) é subvariedade (imersa) de dimensão m de M.

      Mostremos que ξ q (O ) ⊂ O q , ∀q ∈ O . De fato, t i i i ( i )f i i (P i i ) i i V t AdP t ◦f ◦P t f − i 1 1 ◦ e ◦ P ∈ P, e = e = e = P i i o que implica t i i V e ∈ P, ∀i = 1, . . . , m.

      Segue que, t i i V ξ q (t i ) = e (q) ∈ O q , t i ∈ O .

      Portanto, t 1 V t 1 m m V ξ q (t , . . . , t m ) = e ◦ · · · ◦ e (q) ∈ O q , ∀t ∈ O . 1

      Lema 4.12 Com as notações do lema anterior, m

      D t ξ q ( ) = Π ξ , ∀t ∈ O . (4.2-5) R q (t)

      : De fato, como D t ξ q é injetora para todo t ∈ O então, Demonstração m dim D t ξ q ( ) = m, ∀t ∈ O . (4.2-6)

      R Por outro lado, já vimos que ξ q (O ) ⊂ O q . Logo o Lema nos dá dim Π q = dim Π q = m, ∀q ∈ ξ q (O ). (4.2-7) Por segue que m dim D t ξ q ( ) = dim Π = m.

      R ξ q (t) m Para concluirmos basta verificar que D t ξ q ( ) ⊂ Π ξ . Para cada i = 1, . . . , m − t i +1 +1 V i t m V m R q (t)

      ◦ · · · ◦ e ∈ P 1 denote Q i = e . Assim, ∂ ∂ t 1 V t m 1 V m

      ξ q (t) = e ◦ · · · ◦ e (q) ∂t ∂t i i t 1 V t 1 i i m m V t V

      = e ◦ · · · ◦ e ◦ V i ◦ · · · ◦ e (q) t 1 V t 1 i i i +1 i +1 V t V t m V m − 1 ◦ · · · ◦ e ◦ e ◦ · · · ◦ e ◦ Q ◦ V ◦ Q

      = e 1 i i i = ξ q (t) ◦ Q ◦ V i ◦ Q i − − i 1 1

      = ξ q (t) ◦ Q ◦ P i ◦ f i ◦ P ◦ Q i i i 1 ◦ P

      = ξ q (t) ◦ AdQ i f i 1 i m = AdQ ◦ P i f i (ξ q (t)) ∈ Π ξ . i q (t) Portanto, D t ξ q ( ) ⊂ Π ξ q .

      R (t)

      Lema 4.13 O conjunto

      B = {ξ q (O )|q ∈ M } é uma base para uma topologia em M. A topologia gerada por esta base é mais fina que a topologia original de M.

      (0) = q (O ) ∈ B

      Demonstração : Como ξ q , temos que dado q ∈ M existe um elemento ξ q tal que q ∈ ξ q (O ) . Para provar que B é base para uma topologia, resta mostrar que dados ξ q (O ) e ξ q ( ˜ O ) em B e ˆq em ξ q (O ) ∩ ξ q ( ˜ O ) existe um elemento B ∈ B com ˜ ˜ q ∈ B ⊂ ξ ˆ q (O ) ∩ ξ q ( ˜ O ). ˜ Para isto, é suficiente mostrar a seguinte afirmação. m

      

    Afirmação: dado ˆq ∈ ξ q (O ) existe uma vizinhança ˆ O da origem em R tal que

    ξ q ( ˆ O ) ⊂ ξ q (O ) . ˆ q (O ) ∩ ξ q ( ˜ O )

      De fato, uma vez mostrado isso, como ˆq está em ξ ˜ podemos obter ′ ′′ m ′ ′′ vizinhanças ˆ O e ˆ O da origem em R tais que ξ q ( ˆ O ) ⊂ ξ q (O ) e ξ q ( ˆ O ) ⊂ ξ q ( ˜ O ) . ′ ′′ ˆ ˆ ˜ ∩ ˆ Tomando ˆ O = ˆ O O , obtemos o desejado.

      Para mostrar a afirmação, observe que para q ∈ ξ q (O ) suficientemente próximo de q , temos que b ′ ′ ′

      { b V (q ), b 1 V (q ), . . . , b 2 m V (q )} é um conjunto linearmente independente. Assim, podemos considerar, como antes, a aplicação m

      ξ q : → M R t 1 V c t m 1 V c m ′

      ◦ · · · ◦ e (t 1 , t 2 , . . . , t m ) 7→ e (q ).

      Uma vez que ∂ξ q (D ξ q )(1, 0, . . . , 0) = = b V m (q ), ′ m ∂t m t =0 temos que b

      V m (q ) ∈ (D ξ q )(T ) , o qual, por coincide com Π q . Portanto, ′ ′ ′ R b ∈ ξ

      ∈ O V m (q ) ∈ Π q . Agora, como q q (O ) , temos que q = ξ q (x ) para algum x . q Usando novamente e o fato de ξ ser imersão, concluímos que m Π q = Π ξ = (D x ξ q )(T x ) = T ξ ξ q (O ) = T q ξ q (O ). q (x ) R q (x ) t m V b m

      ∈ T Logo, b V m q (ξ q (O ) . Por concluímos que a curva e (ˆ q) está em ξ q (O ) para |t m | suficientemente pequeno. Desta forma, podemos repetir o argumento acima para concluir que t m− 1 m− V b t m 1 m− V b m t 1 m− V b t m 1 V b m

      ◦ e e (ˆ q) = e (e (ˆ q))

      (O ) | | está em ξ q para |t m− 1 , |t m suficientemente pequenos. Continuando esse processo, concluímos que t t 1 m b b e V ◦ · · · ◦ e 1 V m (ˆ q) ⊂ ξ q (O ) n para (t , . . . , t m ) suficientemente próximo de 0 ∈ R . 1 Vamos verificar que a topologia gerada por B é mais fina que a topologia original de M. Como ξ q é diferenciável, então ξ q é contínua na origem quando se considera em

      M a topologia original. Desta forma, dado um aberto V ⊂ M e um ponto q = ξ q (0) em ′ m ′ ⊂ O

      V , temos que existe uma vizinhança O da origem em R tal que ξ q (O ) ⊂ V F .

      Denotaremos por M o conjunto M munido da topologia gerada pela base B des- crita no lema anterior. Mostraremos no próximo lema que as órbitas O q , q ∈ M são F exatamente as componentes conexas de M . F Lema 4.14 Para cada q ∈ M, a órbita O q é aberta, fechada e conexa em M . tf Demonstração : Para mostrar que O q é conexa, mostraremos que a curva t 7→ e q , F

      ∈ f ∈ F é contínua em cada t R, quando vista como uma aplicação de R em M . Se tf f (q) = 0 então e q = 0 e não há nada para mostrar. Suponha então que f(q) 6= 0 e tome V , . . . , V m ∈ (AdP)F tais que 2 span{f (q), V (q), . . . , V (q)} = Π . 2 m q m F

      Considere, como nos lemas anteriores, a aplicação ξ q : → M definida por t f t 1 2 V t m 2 R V m ◦ e ◦ · · · ◦ e

      ξ q (t 1 , . . . , t m ) = e q. Se a correspondente vizinhança O contém algum ponto com a primeira coordenada igual a t , então basta observar que t f t f m 0V 2 0V

      ◦ e ◦ · · · ◦ e tf e q = e q para concluir que e q ∈ ξ q (O ) para todo t em alguma vizinhança U de t . Se O não contém pontos com a primeira coordenada igual a t , tome a ∈ R suficientemente pequeno de tal modo que O contenha algum ponto com primeira coordenada igual a

      1

      at f . Considere o campo g = . Como a t f t a f at g a 1 e = e = e , basta aplicar o argumento acima trocando f por g. Desta forma, as órbitas são conexas por caminhos e, consequentemente, conexas. F

      ∈ M Vamos mostrar que as órbitas são abertas em M . Tome q, q com q ∈ O q . Como as órbitas são classes de equivalência, temos que O q = O q . Pelo Lema ξ q (O ) ⊂ O q . Portanto, o aberto básico ξ q (O ) é tal que q ∈ ξ q (O ) ⊂ O q , mostrando que O q é aberta. Para concluir que cada órbita é fechada, basta observar que o complementar de uma órbita é uma união de órbitas, as quais são abertas pelo que acabamos de provar.

      Finalmente, vamos provar o Teorema da Órbita. Demonstração do Teorema da Órbita:

      1. Para munir O q de uma estrutura de variedade diferenciável, tomamos como vi- 1 zinhanças coordenadas os conjuntos ξ q (O ) , q ∈ O q , e as aplicações ξ como q sistemas de coordenadas locais. Como ξ q são imersões em M, então cada órbita é F uma subvariedade mergulhada de M. Além disso, como O q é conexa em M e essa topologia é mais fina que a topologia de M, segue que O q é conexa em M. m 2. Como T q O q = D ξ q ( ) , o resultado segue do Lema

      R O Teorema da Órbita nos fornece importantes consequências. Primeiramente, lem- bremos que (Vec(M), [ , ]) é uma álgebra de Lie com a operação colchete [ , ], como vimos em

      Sejam F ⊂ Vec(M) uma família de campos de vetores, O q a órbita de F através do ∈ M. ponto q Dado um ponto q ∈ O q e um campo f ∈ F, temos, por definição, que tf e (q) ∈ O q , t ∈

      R. Por obtemos d tf e (q) = f (q) ∈ T q O q . dt t =0

      ∈ F Continuando o raciocínio, dados f −tf −tf tf tf 2 1 , f 2 campos, temos que 1 2 1 e ◦ e ◦ e ◦ e (q) ∈ O q , então d −tf −tf tf tf 2 1 2 1 e ◦ e ◦ e ◦ e (q) = [f , f ](q) ∈ T q O q . 1 2 dt t =0

      Novamente, sejam agora f , f , f ∈ F temos que −t [f ,f ] −tf t [f ,f ] tf 1 2 2 3 3 1 2 3 1 e ◦ e ◦ e ◦ e (q) ∈ O q , e assim, d −t ,f −tf t ,f tf [f 2 3 ] 1 [f 2 3 ] 1

      ◦ e ◦ e ◦ e O e (q) = f 1 , [f 2 , f 3 ] (q) ∈ T q q . dt t =0

      De acordo com podemos escrever ( adf) (q) = f (q) ∈ T q O q ,

      ( )f (q) = [f , f ](q) ∈ T q O q , adf 1 2 1 2 e ( ) ◦ ( )f (q) = f , [f , f ] (q) ∈ T O . adf 1 adf 2 3 1 2 3 q q

      Neste contexto, apresentamos a

      

    Definição 4.15 Sejam O q a órbita da família F ⊂ Vec(M) de campos de vetores, e q ∈ M

      qualquer. O subespaço vetorial denotado por f , [. . . [f k− , f k ] . . . ] ; f i ∈ F, k ∈ ⊂ LieF = span 1 1 N Vec(M) é a Álgebra de Lie de campos de vetores gerada pela família F.

      Denotaremos Lie q F = span{V (q) | V ∈ LieF} ⊂ T q M.

      F Apesar da notação utilizada, não iremos introduzir em Lie q uma estrutura de álgebra de Lie. Veremos tal conjunto apenas como um subespaço vetorial de T q M.

      A álgebra de Lie de campos de vetores gerada pela família F é em geral um espaço de dimensão infinta de Vec(M). Porém, o subespaço tangente Lie q F têm dimensão limitada pela dimensão da órbita O q , ou seja dim F ≤ dim O . 3 Lie q q

      , e F = {X, Y }, onde X e Y são campos de lineares dados

    Exemplo 4.16 Sejam M = R

      respectivamente pelas matrizes     1 0         A = , . e B =

      −1 0 0

      1         0 0 0 −1 0

      O colchete de Lie de A e B é dado por [A, B] = AB − BA, fazendo os cálculos, obtemos   0 1     [A, B] = .

      0 0    

      −1 0 0 Neste caso,

        0 1 ( )

         

      Lie(F) = span 0 0    

      −1 0 0 é formado por matrizes antissimétricas 3 × 3.

      Corolário 4.17 Lie q F ⊂ T q O q ∀q ∈ O q .

      Demonstração : Segue da construção que fizemos anteriormente.

      O Exemplo abaixo mostra que a inclusão acima pode ser estrita. 2 ∂ ∂ 2 , a(x) ,

      

    Exemplo 4.18 Considere M = R e F = para todo z = (x, y) ∈ R onde

      ∂x ∂y

      ∞

      a ∈ C ( R), a 6= 0, tem suporte compacto. A família

      ∂ ∂ F ∪ −F = ± , ±a(x) 2 ∂x ∂y

      é completamente controlável em R . De fato, dados dois pontos quaisquer z = (x , y ), z 2 1 = (x , y ) 1 1 em R podemos a partir de z alcançar z 1 :

      ∂ Primeiro partimos de z pelo campo ± até um ponto z 2 = (x 2 , y ) tal que a(x 2 ) 6= 0,

      ∂x ∂

      = (x , y ) ) = (x , y ), em seguida partimos do ponto z 2 2 pelo campo ±a(x 2 até o ponto z 3 2 1 ∂y

      ∂ 2 e por fim, de z = (x , y ) até z = (x , y ) através do campo ± . Portanto O = . O 3 2 1 1 1 1 (x,y) R ∂x

      Teorema da Órbita nos dá 2 T O = . (x,y) (x ,y ) span{(AdP)F(x, y)} = R Por outro lado,

       

      ∈ 1, x / supp(a) dim Lie F = (x,y)

       2, a(x) 6= 0, ou seja, dim T O ,y 6= dim Lie F = 1, para todo x / ∈ supp(a). (x,y) (x ) (x,y)

      Neste caso, Lie F ⊂ T O ,y (x,y) (x,y) (x ) é uma inclusão estrita.

      

    Definição 4.19 Dizemos que a família F ⊂ Vec(M) é completamente não-holonômica se

    Lie q F = T q M ∀q ∈ M.

      Uma consequência do Teorema da Órbita é o seguinte teorema, que é largamente utilizada em teoria de controle.

      

    Teorema 4.20 (Rashevsky-Chow) Sejam M uma variedade conexa e F ⊂ Vec(M) uma

      família de campos de vetores. Se F é completamente não-holonômica, então O ∈ M. q = M q

      Demonstração : Por hipótese temos Lie q F = T q M ∀q ∈ M,

      e, pelo Corolário temos Lie q F ⊂ T q O q .

      Logo T q M = T q O q ∀q ∈ O q .

      Assim, temos que dim O = dim M. q Como O q é uma subvariedade imersa, existe uma imersão injetora Φ : n → M de uma variedade N de dimensão n em M, tal que Φ(N) = O q . Assim, para qualquer q ∈ O q temos um isomorfismo D p Φ : T p N → T q M, Φ(p) = q.

      Consequentemente, Φ é um difeomorfismo local. Isto mostra que O q é um subcon- junto aberto de M.

      Considere a relação de equivalência definida na Observação tal que M = {O q | q ∈ M }.

      ∼ Como M é conexa, e todas as órbitas são abertas e disjuntas, concluímos que existe uma única órbita. Portanto

      M = O q .

      

    Corolário 4.21 Sejam M uma variedade conexa e F ⊂ Vec(M) uma família simétrica com-

      pletamente não-holonômica. Então A q = M.

      Demonstração : Como F é não-holonômica, temos pelo teorema acima que O q = M, e por F ser simétrica temos, como vimos na Observação que

      A q = O q . Logo

      A q = M.

      A igualdade no Corolário é obtida no caso em que M e F são analíticas, como veremos na próxima seção.

      Como vimos, o espaço Vec(M) munido com o colchete de Lie é uma álgebra de Lie de (M ) campos de vetores. Além disso, este espaço é um C -módulo. Para ver isso, defina o produto de uma função a ∈ C (M ) por um campo V ∈ Vec(M) como o campo aV dado por (aV )(q) = a(q)V (q).

      É imediato verificar que este produto satisfaz as seguintes propriedades: (i) (a + a )V = a V + a V, 1 2 1 2

      (ii) a(V + V ) = aV + aV , 1 2 1 2 (a , V ) = a , a (V ),

      (iii) a 1 2 1 2 (iv) 1V = V, para todo a, a , a ∈ C (M ) , V, V , V ∈ Vec(M). Assim, Vec(M) é um C (M ) -módulo. 1 2 1 2 Uma submódulo V ⊂ Vec(M) é um subgrupo de Vec(M) fechado com respeito a mul- tiplicação de elementos de C (M ) . Se o campo for considerado como uma derivação, definimos o produto de uma função a por um campo V como sendo a derivação ∞ ∞ aV : C (M ) → C (M ) pondo

      (aV )b = a · (V b), b ∈ C (M ). (4.3-8) Precisaremos do seguinte resultado:

      Proposição 4.22 Para todo X, Y ∈ Vec(M), a ∈ C (M ) e P ∈ Diff(M), vale:

      (i) ( adX) (aY ) = (Xa) Y + a (adX) Y (ii) ( AdP ) (aX) = (P a) (AdP )X.

      Demonstração : O item (i) segue da Proposição 5.3, página 27, de [Manfredo]. Para provar (ii), observe que, para qualquer b ∈ C (M ), temos: 1 (( Ad)(aX)) (b) = P ◦ aX ◦ P (b) 1

      = P aX(P

      b) 1 = P a · X(P

      b) 1 = (P a) · P X(P

      b) ( pois P é automorfismo) = (P a) ( AdP X) (b) ( por )

      ∞

    Definição 4.23 Dizemos que um submódulo V ⊂ Vec(M) é finitamente gerado sobre C (M )

      se, existe uma base finita global de campos de vetores, isto é, se existirem V , . . . , V k ∈ V tais 1 que ( ) k

      X V = | a ∈ C i =1 a i V i i (M ) .

      

    Definição 4.24 Dizemos que um submódulo V ⊂ Vec(M) é localmente finitamente gerado

      sobre C (M ) se, para cada ponto q ∈ M existe uma vizinhança aberta O ⊂ M tal que V é O finitamente gerado sobre C (O), ou seja ( ) k

      X V | a ∈ C ∈ V O =1 = a i i V i i (O), V i . O

      ∞

      (M )

      

    Lema 4.25 Sejam V ⊂ Vec(M) um submódulo finitamente gerado sobre C e X ∈

      Vec(M). Se tX [X, V] = ( adX) V = {(adX) V | V ∈ V} ⊂ V, então Ad e V = V, t ∈ R.

      ∈ Demonstração : Por hipótese, existem V 1 , . . . , V k Vec(M) tais que

      ( ) k

      X V = a i =1 i i i V | a ∈ C (M ) .

      Como [X, V] ⊂ V, temos k

      X [X, V i ] = a ij j =1 V j . (4.3-9)

      Queremos mostrar que k tX

      X Ad e V i = b ij j =1 V j tX para cada i = 1, . . . , k. Primeiramente, vale notar que V ⊂ Ad e 0·X tX V pois, ∈

      V V i = Ad e V i Ad e para cada i = 1, . . . , k. Mostraremos agora que tX Ad e V ⊂ V.

      Denotemos tX V i (t) = Ad e V i , t ∈ (4.3-10)

      R, obtendo a E.D.O: d tX tX ˙

      V i (t) = Ad e V i = Ad e [X, V i ] ( pela Proposição ) dt k tX

      X = Ad e a ij k j =1 V j ( pela igualdade )

      X tX = Ad e (a ij j =1 k V j )

      X tX tX = (e a ij ) V j j =1 k Ad e ( pelo item (ii) da Proposição

      X tX = (e a ij )V j (t) ( pela igualdade ). j =1 Em resumo, obtemos para cada i = 1, . . . , k uma E.D.O k

      X tX ˙

      V i (t) = (e a ij )V j (t). (4.3-11) j =1 Fixamos um ponto q ∈ M e definimos a matriz A(t) de ordem k × k: tX A(t) = (a ij (t)) onde (a ij (t)) = (e a ij (q)) i, j = 1, . . . , k.

      Obtemos assim, o sistema de E.D.O’s lineares homogêneas k

      X ˙ V (t) = a (t)V (t). i ij j (4.3-12) j =1

      Para resolvermos, escrevemos o sistema acima na forma de matrizes: ˙

      H = A(t)H, H(0) = Id, e encontramos a matriz fundamental H. Como A(t) depende diferenciavelmente de q, então H depende diferenciavelmente de q. Obtemos,

      H(t) = (b ij (t)) com (b ij (t)) ∈ C (M ) i, j = 1, . . . , k, t ∈ R. Logo, a solução do sistema é: k

      X V (t) = b (t)V (0), i = 1, . . . , k. i ij j j =1 Por temos V j (0) = V j . Portanto, k tX

      X Ad e V i = V i (t) = b ij (t)V j ∈ V, i = 1, . . . , k, j =1 como queríamos demonstrar.

      

    Teorema 4.26 Seja F ⊂ Vec(M) uma família. Suponha que o submódulo LieF é localmente

      finitamente gerado sobre C (M ). Então, O

      F, T q q = Lie q q ∈ O q para qualquer órbita O q , q ∈ M, da família F.

      Demonstração : Pelo Teorema da Órbita e o Corolário temos que Lie q F ⊂ T q O q = span{(AdP) F(q)}, q ∈ O q .

      Assim, resta mostrar que span{(AdP) F(q)} ⊂ Lie q F q ∈ O q .

      Por hipótese, para cada q ∈ M existe uma vizinhança aberta O ⊂ M contendo q, tal que o submódulo LieF é finitamente gerado sobre C (O). Isto é, ( ) k

      X | a ∈ C ∈ LieF = a i f i i (O), f i LieF . i =1 O

      Temos, devido a Definição que ( adf)LieF ⊂ LieF, ∀f ∈ LieF . O

      Como a afirmação acima é válida para todo campo f ∈ LieF temos, pelo Lema O que tf tf ( Ad e ) LieF ⊂ LieF, ∀ e ∈ P.

      Obtemos assim, ( AdP)F ⊂ (AdP)LieF ⊂ LieF.

      Portanto, T q O q ⊂ Lie q

      F, q ∈ O q e a igualdade segue.

      O

      F, Corolário 4.27 Se M e F são analíticas, então T q q = Lie q q ∈ O q .

      Nesta seção vamos estudar algumas propriedades gerais dos conjuntos atingíveis a partir de uma família de campos de vetores F ⊂ Vec(M) completamente não-holonômica, isto é, Lie q F = T q M q ∈ M.

      Teorema 4.28 (Krener) Se F ⊂ Vec(M) é uma família completamente não-holonômica, en-

      tão A q ⊂ int(A q ) ∈ M. para qualquer q

      ∈ M Demonstração : Fixe um ponto q e seja A q o conjunto atingível a partir de q para tempo qualquer da família F. Seja q ∈ A q um ponto qualquer. Vamos mostrar que 1 toda vizinhança de q intersecta o interior de A q , isto é, 1

      ∈ q 1 int(A q ). (4.4-13) (1) Existe um campo de vetores f ∈ F tal que f (q ) 6= 0 . Caso contrário, teríamos que 1 1 1 f (q ) = 0 para todo campo f ∈ F, logo dim Lie q F = 0. 1 1 1 1 Considere a curva em M dada por: s f 1 1 s 7→ e (q ), 0 < s < ε , (4.4-14) 1 1 1 1 cuja imagem é uma subvariedade de dimensão 1 de M para ε s f 1 1 1 > 0 suficientemente pe- queno. Se dim M = 1, então e (q ) ∈ int(A q ) para s > 0 suficientemente pequeno. 1 1 Bem entendido, para qualquer aberto U ⊂ M contendo o ponto q , podemos obter um 1 número s 1 > 0 suficientemente pequeno tal que s f 1 1 e (q ) ∈ int(A q ) 1 e consequentemente, U ∩ int(A q ) 6= ∅.

      Portanto, segue. (2) Suponha que dim M > 1. Podemos encontrar um ponto q 2 sobre a curva de q , isto é, arbitrariamente próximo t f 1 1 1 1 1 q = e (q ), t > 0 suficientemente pequeno, 2 1 1

      ∈ F (q ) e um campo de vetores f 2 tal que f 2 1 não é tangente à curva Repare que um tal campo f existe pois, caso contrário teríamos dim Lie q F = dim T q M = 1. 2 1 1 Considere a aplicação s f s f 1 1 2 2 (s , s ) 7→ e ◦ e (q ) 1 2 1 (4.4-15) onde 1 1 t < s 1 1 < t + ε 1 2 e 0 < s 2 < ε 2 .

      Esta aplicação é uma imersão em uma vizinhança suficientemente pequena da origem 2 em R , logo sua imagem é uma subvariedade de dimensão 2 de M. Se dim M = 2 então s f s f 1 1 2 2 e ◦ e (q ) ⊂ int(A q ) 1 para ε > 0 suficientemente pequeno. Como o ponto q é tomado arbitrariamente 2 2 próximo de q 1 então a inclusão segue. 1 2 (3) Suponha que dim M > 2. Repetimos o processo anterior. Existem t , t > 0 e um 2 2

      ∈ F campo de vetores f 3 tal que f 3 não é tangente à superfície no ponto t f t f 2 1 1 2 2 2 q = e ◦ e (q ). 3 1 Caso contrário, teremos dim M = 2. Desta maneira, a imagem da aplicação s f s f s f 1 1 2 2 3 3 (s , s , s ) 7→ e ◦ e ◦ e (q ), (4.4-16) 1 2 3 1 onde i i t < s i < t + ε 2 2 3 i = 1, 2 e 0 < s 3 < ε 3 ,

      é uma subvariedade de dimensão 3 de M, quando restringimos seu domínio a uma 3 vizinhança suficientemente pequena da origem e R . Se dim M = 3 então a inclusão segue.

      (4) Para dim M = n, obtemos um ponto t f t f n− n− n− 1 1 1 n− 1 1 1 ◦ · · · ◦ e q n− 1 = e (q 1 ) com 1 n− n− i 1 1

      (t , . . . , t ) ∈ , t > 0, n− n− R n− 1 1 1 e campos de vetores f , . . . , f n ∈ F tais que a aplicação 1 s f s f s f 1 1 n− 1 n− 1 n n (s , . . . , s n ) 7→ e ◦ · · · ◦ e ◦ e (q ), (4.4-17) 1 1 onde i i t < s i < t + ε n i = 1, 2, . . . , n − 1 e 0 < s n < ε n , n− n− 1 1

      é uma imersão. A imagem desta imersão é uma subvariedade de dimensão n de M, logo um subconjunto aberto de M. Como este conjunto aberto está contido em A q e pode ser tomado arbitrariamente próximo de q , obtemos que 1 q ∈ q ). 1 int(A

      (F) =

      Corolário 4.29 Seja F ⊂ Vec(M) uma família completamente não-holonômica. Se A q M para algum q , então A q (F) = M.

      Demonstração : Seja q ∈ M um ponto arbitrário e consideremos a família −F = {−f | f ∈ F} não-holonômica. Pelo Teorema temos A q (−F) ⊂ int(A q (−F)), q ∈ M.

      Seja q ∈ int(A q (−F)) e U q o aberto contendo q e contido em A q (−F). Por hipótese, A ∩ A q (F) é denso em M, logo U q q (F) 6= ∅. Ou seja, ′′ A q (F) ∩ A q (−F) 6= ∅.

      Segue que existe q representado em ambos conjuntos por: ′′ t f t f −s g −s g 1 1 k k 1 1 l l q = e ◦ · · · ◦ e (q ) = e ◦ · · · ◦ e (q), assim t f t f s g s g 1 1 k k l l 1 1

      ◦ · · · ◦ e ◦ e ◦ · · · ◦ e q = e (q ). Portanto, q ∈ A q (F), mostrando que M ⊂ A q (F). A inclusão contrária é natural.

      

    CAPÍTULO 5

    STATE E FEEDBACK EQUIVALÊNCIA DE SISTEMAS DE

    CONTROLE

      Neste capítulo discutiremos dois tipos de equivalência entre sistemas de controle: state-equivalência e feedback-equivalência. De modo geral, dois sistemas são state-equivalentes se existe uma transformação no espaço estado que “transforma”um sistema no outro, sem alterar os controles. Esse tipo de equivalência já foi tratado nos Teoremas do Capítulo 3, quando exibimos condições para que um sistema não linear seja equivalente a um sistema linear controlável. Já a feedback-equivalência “transforma”os sistemas alterando os controles. Os detalhes serão vistos na seção 5.2.

      Sejam M, N variedades e f U , g U famílias de campos de vetores sobre M, N respectiva- mente, parametrizadas por um mesmo conjuntos de parâmetros de controle U: f = {f | u ∈ U } ⊂ U u Vec(M), g U = {g u | u ∈ U } ⊂ Vec(N).

      Suponha que essas famílias sejam completamente não-holonômicas, isto é, para quais- quer x ∈ M e y ∈ N temos, Lie x f U = T x M, Lie y g U = T y N.

      ∈

      Definição 5.1 Dizemos que as famílias f U e g U são localmente state-equivalente em x

      M ∈ N e y se existe um difeomorfismo local Φ : O x ⊂ M → O y ⊂ N com Φ(x ) = y , tal que

      Φ ∗ (f u ) = g u , ∀u ∈ U. Notação: (f U , x ) ≃ (g U , y ) e diremos simplesmente que são localmente S-equivalente.

      Vamos procurar condições necessárias para obtermos uma equivalência local dos sistemas f U e g U . Suponha que (f U , x ) ≃ (g U , y ) . Lembramos que o colchete de Lie é invariante por isomorfismos, ou seja,

      Φ ∗ [f u , f u ] = [Φ ∗ f u , Φ ∗ f u ] = [g u , g u ], u , u ∈ U. 1 2 1 2 1 2 1 2 ∈ U

      Definimos os vetores tangentes para um conjunto de controles u 1 , . . . , u k : h i

      ξ u ,...,u = f u , f u , · · · [f u , f u ] · · · (x ) ∈ T x M (5.1-1) 1 k 1 2 k− k 1 h i

      η u ,...,u = g u , g u , · · · [g u , g u ] · · · (y ) ∈ T y N. (5.1-2) 1 k 1 2 k− 1 k Segue que, h i

      · · · [f Φ ∗x (ξ u ,...,u ) = Φ ∗ f u , f u , u , f u ] · · · (x ) 1 k 1 2 k− 1 k h i

      = g u , g u , · · · [g u , g u ] · · · (y ) 1 2 k− k 1 = η u ,...,u . 1 k

      , x ) ≃ (g , y ) Desta forma, obtemos que se (f U U então existe um isomorfismo

      Φ ∗x : T x M → T y N tal que Φ ∗x (ξ u ,...,u ) = η u ,...,u , u i ∈ U, k ∈ 1 k k N. 1 U )

      A recíproca é verdadeira no caso analítico. Chamaremos o par (M, f de analítico quando a variedade M e a família f U são analíticas.

      Teorema 5.2 Sejam (M, f U ) e (N, g U ) analíticos tais que,

      Lie x f U = T x M, Lie y g U = T y N, para quaisquer x ∈ M e y ∈ N. Então (f U , x ) ≃ (g U , y ) se, e somente se, existe um isomorfismo

      Φ ∗x : T x M → T y N tal que Φ ∗x (ξ u ,...,u ) = η u ,...,u , u i ∈ U, k ∈ (5.1-3) 1 k k N. 1 Demonstração : (⇐) Considere a variedade produto definida por M e N: M × N = {(x, y) | x ∈ M e y ∈ N}.

      Dados f ∈ Vec(M), g ∈ Vec(N) definimos o campo de vetores produto f ×g ∈ Vec(M × N ) como a derivação: ∞ ∞

      [ f × g : C (M × N ) → C (M × N ) por:

      ( [ f × g) · a(x, y) = D a(f × g)(x, y) = D a · (f (x), g(y)). (5.1-4) (x,y) (x,y) Repare que a é uma função a : M × N → R. Logo

      D a : T x M × T y N → (x,y) R 7→ D (u, v) a · (u, v). (x,y) Além disso,   f (x)

      ∂ ∂  

      D a · (f (x), g(y)) = a(x, y) a(x, y) · (x,y) ∂x ∂y g(y)

      ∂ ∂ = a(x, y)f (x) + a(x, y)g(y). (5.1-5) 1 2 ∂x ∂y

      Definindo as funções a : M → : N → y R e a x R por 1 2 a (x) = a(x, y) e a (y) = a(x, y), y x temos que ∂ ∂ 1 2 a(x, y) = D x a e a(x, y) = D y a . y x

      ∂x ∂y Assim, a igualdade (5.1-5) fica como: 1 2 D (x,y) a · (f (x), g(y)) = D x a (x)f (x) + D y a (y)g(y) 1 y x 2

      = ( b f a )(x) + ( )(y), (5.1-6) y x bga onde estamos com a notação utilizada ao identificarmos campos de vetores com deri- vações (ver Seção obtemos: 1 2

      ( [ f × g) · a(x, y) = ( b f a )(x) + ( )(y). (5.1-7) y x bga Definimos o produto direto das famílias f U e g U como f U × g U = {f u × g u | u ∈ U } ⊂ Vec(M × N).

      Seja Φ ∗x : T x M → T y N o isomorfismo tal que,

      Φ ∗x (ξ u ,...,u ) = η u ,...,u , u i ∈ U, k ∈ 1 k k N. 1

      Usando (5.1-7) e a fórmula [b V , c W ] = b V ◦ c W − c W ◦ b V , temos que o colchete de Lie sobre a família f U × g U é calculado como [f u × g u , f u × g u ] = [f u , f u ] × [g u , g u ], (5.1-8) 1 1 2 2 1 2 1 2 consequentemente, h i f u × g u , f u × g u , · · · [f u × g u , f u × g u ] · · · (x , y ) = 1 1 2 2 k− k− k k 1 1 h h i i

      · · · [f · · · [g = f u , f u , u , f u ] · · · (x ) × g u , g u , u , g u ] · · · (y ) 1 2 k− 1 k 1 2 k− 1 k

      = ξ u ,...,u × η u ,...,u 1 k k 1 = ξ u ,...,u × Φ ∗x (ξ u ,...,u ), 1 k 1 k

      ∈ U × g para u i , i = 1, . . . , k, e k ∈ N. Assim, o espaço Lie (x ,y ) f U U é gerado por elementos da forma (ξ u ,...,u × Φ ∗x (ξ u ,...,u )). Logo, 1 k k 1 dim Lie ,y f U × g U = n = dim M. (x )

      × g , y ) , Pelo Teorema da Órbita, a órbita da família f U U através do ponto (x , O (x ,y ) é uma subvariedade imersa (localmente subvariedade) conexa de M × N. Como (M × N, f U × g U ) é analítico temos pelo Corolário que

      T O = f U × g U (x ,y ) (x ,y ) Lie (x ,y ) = span(ξ u ,...,u × Φ ∗x (ξ u ,...,u )) 1 k 1 k = span{(v, Φ ∗x v) | v ∈ T x M } ⊂ T x M × T y N.

      Além disso, O × g dim T (x ,y ) (x ,y ) = dim Lie (x ,y ) f U U = n.

      Desta forma, a órbita O ,y é uma subvariedade imersa n-dimensional, e cujo espaço (x ) tangente em (x , y ) é o gráfico do isomorfismo linear Φ ∗x .

      Considere as projeções π 1 e π 2 de M × N em M e N respectivamente: π : M × N → M, π (x, y) = x 1 1 π : M × N → N, π (x, y) = y. 2 2 As restrições

      → M π 1 : O (x ,y )

      π : O ,y → N, 2 (x ) são difeomorfismos locais pois, as diferenciais são dadas por: (π ) ∗ : Lie ,y f U × g U → T x M 1 (x )

      (v, Φ ∗x v) 7→ v (π ) ∗ : Lie ,y f U × g U → T y N 2 (x )

      (v, Φ ∗x v) 7→ Φ ∗x v, que são aplicações injetoras em espaços de mesma dimensão n. Logo, são isomorfis- mos. Seja 1

      Ψ = π ◦ π : π O ,y ⊂ M → π O ,y ⊂ N, 2 1 1 (x ) 2 (x ) que é difeomorfismo local de M em N. Note que o gráfico de Ψ é a órbita, isto é, Graf(Ψ) = O ,y . Finalmente, (x ) 1

      Ψ ∗ (f u (x )) = (π ) ◦ (π ) (f u (x )) 2∗ 1∗ 1 = (π ) π (f (x )) 2∗ u 1∗ = (π ) (f u (x ), Φ ∗x (f u (x ))) 2∗ = Φ ∗x (f u (x )) = g (y ), u ∈ U. u Portanto, (f U , x ) ≃ (g U , y ) .

      (⇒) Esta implicação foi provada na discussão que precede o teorema.

      

    Observação 5.3 A condição do teorema acima pode ser melhorada com argumentos

      conhecidos da álgebra. Como as famílias f U e g U são completamente não-holonômicas, ou seja, Lie x f U = T x M, e Lie y g U = T y N, por podemos escolher uma base para T x M formada por vetores do forma ξ u ,...,u com 1 k u i ∈ U α , . . . , ξ α ∈ T x M e k ∈ N. Sejam ξ n tais que 1 span{ξ α , . . . , ξ α } = T x M (5.1-9) 1 n onde α i = (u 1i , . . . , u ki ) , i = 1, . . . , n. Desta forma, podemos escrever todos os vetores de T x M nesta base, isto é, n

      X i i ξ u ,...,u = c ξ α (5.1-10) 1 k u ,...,u i i =1 1 k onde c são coordenadas do vetor ξ u ,...,u nesta base. u ,...,u k 1 k 1 Se existe um isomorfismo Φ : T x M → T y N com a condição , então

      Φ(ξ α i ) = η α i e o conjunto {η α , . . . , η α } é base para T y N , ou seja, 1 n } = T span{η α , . . . , η α n y N. (5.1-11) 1 Assim, podemos expressar qualquer vetor η u ,...,u nesta base, com as mesmas coordenadas: 1 n k

      X i η u ,...,u = c η α . (5.1-12) 1 k u ,...,u i i =1 1 k

      A recíproca é verdadeira: dadas bases como em e (5.1-11) tais que as decomposições (5.1-10) e (5.1-12) são satisfeitas com as mesmas coordenadas, então existe um isomorfismo T : T x M → T y N . Logo, a condição pode ser reformulada, bastando analisar sua validade nos elementos da base, ou seja,

      Φ ∗x (ξ α ) = η α i = 1, . . . , n. i i

      × R : + +

      Exemplo 5.4 Considere o sistema não linear sobre R

       

      ˙x 1 = x 1 ln(x 2 ) Σ :

      (5.1-13) 

      ˙x = −x ln(x ) + x u, 2 2 1 2 × → com u ∈ R. Introduzindo a S-transformação T : R R R × R definida por: + +

      T (x , x ) = (ln(x ), ln(x )) = (z , z ), 1 2 1 2 1 2 temos ˙x x ln(x ) 1 1 2

      ˙z = = = ln(x ) = z 1 2 2 x x 1 1 ˙x −x ln(x ) + x u 2 2 1 2 ˙z = = = −z + u. 2 1 x x 2 2 Logo, o sistema nas novas coordenadas (z , z ) têm a forma: 1 2

        ˙z = z 1 2

      Σ : 

      ˙z = −z + u 2 1 que é um sistema linear.

      Nesta seção, iremos considerar sistemas de controle da forma ˙q = f (q, u), q ∈ M, u ∈ U. (5.2-14)

      Como em seções anteriores, M é uma variedade diferenciável. Aqui assumiremos que U também é uma variedade diferenciável. Supomos também que para cada u ∈ U fixado, f(q, u) é um campo de vetores diferenciável sobre M e que a aplicação

      (q, u) 7→ f (q, u)

      é diferenciável. Os controles admissíveis serão aplicações mensuráveis localmente li- mitadas t 7→ u(t) ∈ U. Se um tal controle u(t) é substituído no sistema (5.2-14), obtemos uma E.D.O

      ˙q = f (q, u(t)), na qual o lado direito é diferenciável em q e mensurável e localmente limitada em t.

      Para tais E.D.O’s, temos a Teoria de Equações de Carathéodory, que garante existência e unicidade de problemas de Cauchy (veja a Seção 1.2 de para a situação em espa- ços euclidianos e a Seção 2.4.1 de para a demonstração deste fato em variedades diferenciáveis).

      Fixados essas notações e resultados, introduziremos agora o conceito de transfor- mação de feedback, que leva trajetórias de um sistema em trajetórias de outro sistema, mas possivelmente com um novo controle. O espaço dos novos parâmetros de controle

      U será denotado por b , o qual também assumiremos como uma variedade diferenciável.

      

    Definição 5.5 Seja ϕ : M × U → b U uma aplicação diferenciável. Uma transformação da

      forma ˙q = f (q, u) −→ ˙q = f (q, ϕ(q, u)) (5.2-15) é chamada transformação de feedback. Neste caso, chamaremos apenas por F-transformação.

      

    Observação 5.6 Note que uma F-transformação reparametriza os controles u ∈ U dependendo

      do estado q ∈ M. Note também que, se q(t) é uma trajetória admissível para o sistema ˙q = f (q, u) com respeito a um controle u então a mesma trajetória é admissível para o sistema transformado ˙q = f(q, ϕ(q, u)) com respeito ao controle bu = ϕ(q, u). Porém, não há garantia que trajetórias admissíveis do sistema transformado sejam admissíveis para o sistema inicial.

      A fim de obtermos uma F-equivalência, consideramos transformações invertíveis de feedback com U = b U e ϕ q ∈ Diff(U), para cada q ∈ M fixado. Desta forma, a aplicação

      ϕ : M × U → U geram transformações invertíveis de feedback: ˙q = f (q, u) ←→ ˙q = f (q, ϕ(q, u)). (5.2-16) Neste caso dizemos que os sistemas ˙q = f(q, u) e ˙q = f(q, ϕ(q, u)) são F-equivalente.

      Para sistemas de controle afim: k

      X k ˙q = f (q) + u i g i (q), u = (u , . . . , u k ) ∈ , q ∈ M, (5.2-17) i =1 1 R temos as seguintes F-transformações com controle afim: k k

      ϕ = (ϕ , . . . , ϕ k ) : M × → 1 R R onde k

      X ϕ i (q, u) = c i (q) + u j d ij (q) (5.2-18) j =1 com funções c i , d ij : M → R para cada i = 1, . . . , k. Observe que essas transformações levam um sistema de controle afim em outro sistema de controle afim. Para ver isso, considere o caso em que k = 2. O sistema dado pode ser escrito na forma

      ˙q = F (q, u), onde F (q, u) = f (q) + u g (q) + u g (q). 1 1 2 2 Neste caso, temos ϕ(q, u) = (c (q) + u d (q) + u d (q), c (q) + u d (q) + u d (q). 1 1 11 2 12 2 2 21 2 22 A F-transformação correspondente

      F (q, u) 7→ F (q, ϕ(q, u)), leva F (q, u) em f (q) + (c (q) + u d (q) + u d (q))g (q) + (c (q) + u d (q) + u d (q))g (q) = 1 1 11 2 12 1 2 2 21 2 22 2 [f (q) + c 1 (q)g 1 (q) + c 2 (q)g 2 (q)] + [d 11 (q)u 1 + d 12 (q)u 2 ]g 1 (q) + [d 21 (q)u 1 + d 22 (q)u 2 ]g 2 (q).

      Nosso objetivo é simplificar os sistemas de controle afim que são localmente equi- valente à sistemas de controle lineares controláveis com respeito a state e feedback transformações. Assim, começaremos por sistemas de controle lineares.

      Faremos nesta seção uma classificação dos sistemas lineares controláveis para controle escalar e vetorial, isto é, obteremos a sua forma mais simples (ou normal). Considere o n sistema de controle linear controlável em R : k

      X n ˙x = Ax + u i b i , x ∈

      R j n i =1 (5.3-19) span{A b i | j = 1, . . . , n − 1, i = 1, . . . , k} = k n R ∈ onde u = (u 1 , . . . , u k ) ∈ R , b i R , i = 1, . . . , k. Assumiremos que os vetores b i , i = 1, . . . , k são linearmente independentes, ou seja, dim span{b , . . . , b k } = k. 1 Se não for o caso, eliminamos alguns vetores para obter um conjunto linearmente in- dependente. Vamos encontrar a forma normal para os sistemas

      Para os sistemas que preservam a estrutura linear. Desta forma, tomaremos as funções c i como funcionais lineares e as n funções d ij constantes. Usando o fato que todo funcional linear T : R → n R é da forma

      T (x) = hv, xi para algum v ∈ R (Teorema da Representação de Riez), usaremos a notação c i (x) = hc i , xi para indicar o funcional c i . Assim: c i :

      R n

      R x 7→ hc i , xi d ij :

      R n

      R x 7→ d ij (x) = d ij

      (5.3-20) para todo i, j = 1, . . . , k. Desta forma, obtemos ϕ = (ϕ 1 , . . . , ϕ k ) :

      R n ×

      R k

      R k tal que, para cada i = 1, . . . , k, temos ϕ i (x, u) = hc i , xi + k

      X j =1 u j d ij , (5.3-21) para todo x ∈ R n , u ∈ R k .

      Defina o operador linear D : span{b 1 , . . . , b k } → span{b 1 , . . . , b k } (5.3-22) cuja matriz de D na base B = {b 1 , . . . , b k } é (d ij ) , ou seja,

      D(b j ) = k

      X j =1 d ij b i , [D] B = (d ij ). Com estas informações, obtemos a F-transformação: k k

      X X ˙x = Ax + u i b i 7−→ ˙x = Ax + ϕ i (x, u)b i i i =1 =1 k k !

      X X hc = Ax + i , xi + u j d ij b i i =1 j =1 k k

      X X hc i i,j =1 =1 + = Ax + i , xib i u j d ij b i k k !

      X X = Ax + hc + i , xib i u j Db j . i j =1 =1 Em resumo, obtemos k k k !

      X X

      X 7−→ hc ˙x = Ax + u i b i ˙x = Ax + + i , xib i u j Db j . i i j =1 =1 =1

      Como um sistema linear é unicamente determinado fornecendo a matriz A e os vetores b 1 , . . . , b k , indicamos a F-transformação na forma: k !

      X (Ax, b . . . , b k ) −→ Ax + hc i , xib i , Db , . . . , Db k . (5.3-23) 1 i =1 1 Queremos que esta transformação seja invertível, assim, vamos assumir que o opera- dor D em seja invertível. n

      As S-transformações lineares em R são exatamente as transformações lineares in- versíveis. Assim, tais transformações agem em sistemas lineares como segue: 1 n n (Ax, b . . . , b k ) −→ CAC x, Cb , . . . , Cb k , (5.3-24) 1 1 onde C : R → é um operador linear invertível.

      R

      Considere inicialmente um modelo bastante simples de sistema de controle linear, cha- mado sistema escalar de alta ordem: (n) (n−1) (1) u = x + α n− x + · · · + α x + α x ∈ (5.3-25) 1 1 R,

      (k)

      , . . . , α ∈ com α n− 1 R e x indica a derivada de ordem k. Podemos escrever o sistema na forma clássica, considerando a mudança de variáveis (i−1) x i = x , i = 1, . . . , n. (5.3-26) Obtemos assim,

       

      ˙x = x 1 2      

      ˙x = x 2 3      ...

      (5.3-27)  

      ˙x n− 1 = x n     n− 1

       

      X  

      ˙x n = − α i x i + u, +1   i =0 que pode ser escrito na forma ˙x = Ax + bu como

              ˙x 1 1 · · · x 1

                     

      ˙x 1 · · · x  2     2                   

    • =

      u. (5.3-28) ... ... ... ... ... ... ... ...                        

      ˙x · · · 1 x  n− 1     n− 1           

      ˙x n −α −α −α · · · −α n− x n n− 1 1 2 1

      1 X Tomaremos − α i x i +1 + u = i =0 bu como um novo controle. Para isto, basta aplicar a

      F-transformação com k = 1, c i = c = (−α , . . . , −α n− ), e d ij = d = 1. 1 Com isso, a transformação tem a forma n− 1 X ϕ i (x, u) = ϕ(x, u) = − α i x i + u (5.3-29) i =0 +1 onde n− 1 X

      − i =0 α i x i +1 = hc, xi = h(−α , . . . , −α n− 1 ), (x 1 , . . . , x n )i, e k

      X u = u j d ij . j =1

      Obtemos assim,                     

      ˙x 1 = x 2 ˙x 2 = x 3 ...

      ˙x n− 1 = x n ˙x n = bu

      , (5.3-30) que pode ser escrito na forma escalar como: x (n) = ˙x n = bu.

      (5.3-31) Iremos provar na próxima proposição que um sistema de controle linear controlá- vel com controle escalar é S-equivalente ao sistema o qual por sua vez é F- equivalente ao sistema são formas normais de sistemas lineares com controle escalar sob S-transformações e F-transformações, respectivamente.

      Temos o seguinte resultado.

      Proposição 5.7 Todo sistema de controle linear controlável com controle escalar:

      ˙x = Ax + ub, u ∈ R, x ∈ R n span (b, Ab, . . . , A n− 1

      b) = R n

      , (5.3-32)

      é state equivalente ao sistema da forma .

      Demonstração : Vamos mostrar que existe um operador linear invertível C : R n → R n tal que a transformação . Para isso, iremos construir uma base B = {v 1

      , . . . , v n } de R n tal que, o sistema Considere o polinômio característico de A : p(λ) = λ n + α n− 1 λ n− 1 + · · · + α 1 λ + α . Pelo Teorema de Cayley-Hamilton, sabemos que: n n− 1 p(A) = A + α n− A + · · · + α A + α = 0. 1 1 Segue que, n n− 1 A b + α n− A b + · · · + α Ab + α b = 0. (5.3-33) 1 1 Vamos agora extrair da igualdade acima, os vetores v , . . . , v n . Reescrevemos esta igual- 1 dade como, n− n− 1 2 A(A b + α n− A b + · · · + α b ) + α b = 0. 1 1 | {z } v 1 n− 1 n− 2 Note que v 6= 0 , caso contrário teríamos que A b = −α n− A b − · · · − α 1 1 1

      b, con- tradizendo a condição de controlabilidade. Extraímos agora o vetor v 2 de v 1 , de modo análogo, isto é, n− n− 1 2 v 1 = A b + α n− n− 2 n− 1 A b + · · · + α 3 1 b = A(A b + α n− A b + · · · + α b ) + α 1 2 1 b. | {z } v 2

      6= 0 Temos que v 2 pelo mesmo argumento usado para v n− n− 2 3 1 . Novamente, v = A b + α n− A b + · · · α b 2 n− n− 3 1 4 2

      = A(A b + α n− A b + · · · + α b ) + α 1 3 2

      b, | {z } v 3 com v 6= 0 . Repetimos esse procedimento até obtermos: 3 v n− = Ab + α n− b 1 1 v n = b.

      Observe que, podemos escrever esta penúltima igualdade acima como, v n− = Av n + α n− 1 1

      b, v n = b, ou de outra forma − α

      Av n = v n− 1 n− 1

      b. (5.3-34)

      Com isso, podemos recuperar recursivamente de trás para frente todos os vetores v 1 , . . . , v n , definidos anteriormente.

      Em resumo, obtemos os vetores: v 1 = A n− 1 b + α n− 1 A n− 2 b + · · · + α 3 A 2 b + α 2 Ab + α 1 b v 2 = A n− 2 b + α n− 1 A n− 3 b + · · · + α 3 Ab + α 2 b ...

      (5.3-35) v n− 1 = Ab + α n− 1 b v n = b.

      Vendo v i como um vetor coluna, consideramos a matriz B = (v 1 , . . . , v n ). Observe que: B = b Ab · · · A n− 2 b A n− 1 b

      ·           

      α 1 α 2 · · · α n− 1

      1 α 2 α 3 · · ·

      1 ... ... . .. ... ... α n− 1

      1

      1            .

      Temos que B é invertível pois, o determinante de B é o produto do determinante de uma matriz controlável com o determinante de uma matriz triangular. Daí concluímos que (v 1 , . . . , v n ) é uma base de R n . Definimos C = B 1 . Temos que, b = B ·

                 ...

      1           

      ⇒ Cb =            ...

      1            .

      Aplicamos a matriz A na base B, ou seja, AB = A (v 1 · · · v n ) . Vamos proceder apli-

      cando A nas colunas de B. Usando temos Av n = v n− 1 − α n− 1 b = B ·

      Logo, na forma matricial, obtemos: AB = B ·

      1 −α −α 1 −α n− 2 −α n− 1

      · · ·

      ... ... ... · · · ...

                 1 · · ·

      , ou melhor, CAC 1 = B 1 AB =

                

      1 −α −α 1 −α n− 2 −α n− 1

      · · · ... · · ·

      ... ... ...

                 1 · · ·

      −α            .

                 ...

      , e Av 1 = −α b = B ·            ...

      −α 1           

      1 ...

      − α 1 b = B ·           

      Repetimos esse processo até obtermos as primeiras colunas: Av 2 = v 1

                 .

      1 −α n− 2

      , Av n− 1 = v n− 2 − α n− 2 b = B ·            ...

                

      1 −α n− 1

                 .

      Além disso, já obtivemos             Cb = .  ...         

      1 Desta forma, mostramos que existe um operador linear invertível C que transforma o sistema Logo, esses sistemas são S-equivalente. Note tam- bém que a base B construída é única, o que significa que a transformação do sistema em sua forma normal é única. Para finalizarmos esta demonstração, consideremos o novo parâmetro de controle n− 1 X α i x i + u. +1 bu = − i =0

      Pela discussão feita nos parágrafos que antecedem a proposição, temos que o sistema

      Nosso objetivo nesta subseção é encontrar a forma normal de um sistema de controle linear controlável geral via state e feedback equivalência. Tal forma é chamada forma normal de Brunovský . Para tanto, é fundamental os índices de Kronecker do sistema li- near inicial, (ver que são invariantes por state-feedback equivalência. Iniciemos a descrição de alguns desses invariantes.

      Considere o sistema linear controlável com controle vetorial: k

      X k n ˙x = Ax + u i b i , u = (u , . . . , u k ) ∈ , x ∈ , i =1 1 R R j n (5.3-36)

      | j = 1, . . . , n − 1, i = 1, . . . , k} = span{A b i R . Assumiremos que o conjunto {b , . . . , b k } é linearmente independente. Definimos os 1 n

      : seguintes subespaços em R m j D = span{A b i | j = 0, . . . , m − 1; i = 1, . . . , k}, m = 1, . . . , n. (5.3-37) m

      Note que as dimensões dim D são preservadas por S-transformações pois, o m operador C é invertível. Desta forma, dizemos que os números dim D são S-invariantes, isto é, são invariantes por S-transformações Vamos verificar agora que os su- m bespaços D são F-invariantes, isto é, são invariantes por F-transformação. De fato, considere a F-transformação vista em k !

      X −→ hc

      (Ax, b 1 . . . , b k ) Ax + i , xib i , Db i =1 1 , . . . , Db k . Podemos decompor esta transformação em duas: k !

      X (Ax, b . . . , b k ) −→ Ax + hc i , xib i , b , . . . , b k , (5.3-38) 1 i =1 1

      −→ (Ax, b 1 . . . , b k ) (Ax, Db 1 , . . . , Db k ) . (5.3-39)

      A transformação é mais simples uma vez que o operador m− m 1 D : span{b , . . . , b } → span{b , . . . , b } 1 k 1 k é invertível e D ⊂ D , m = 2, . . . , n. Em outras palavras, o operador D muda 1 m m

      ∈ D ⊂ D apenas os vetores b i , i = 1, . . . , k. Portanto, os espaços D são preservadas por esta transformação. m

      Para mostrarmos que os espaços D são preservados pela transformação vamos verificar primeiro a seguinte igualdade: j j j b A x ≡ A x modD , j = 1, . . . , n (5.3-40) onde k

      X b hc

      Ax = Ax + i , xib i . (5.3-41) i =1 De fato, para j = 1 a equação (5.3-41) acima, nos dá k

      X 1 b Ax − Ax = hc , xib ∈ D . i =1 i i

      Para mostrar que a equação (5.3-40) é verdadeira para j > 1 vamos proceder por itera- m− 1 m ⊂ D ção da equação (5.3-41) e usar que D , m = 2, . . . , n, para concluir o desejado. = b Ax

      Por simplicidade, denotaremos x 1 , e obtemos, k ! 2 X b b A x = b A( b Ax) = A Ax + hc i , xib i i =1 k k !

      X X = A Ax + hc , xib + i i hc i , x ib i k k i i =1 =1 1 2 X

      X = A x + + hc i , xiAb i hc i , x ib i , i i =1 =1 1 segue que, k k 2 2 X

      X 2 b i =1 i =1 + A x − A x = hc i , xiAb i hc i , x ib i ∈ D . 1 | {z } | {z } ∈D ∈D 2 1 Sejam x = b Ax e x l = b A(x l− ), l = 2, . . . , n. De maneira geral, temos 1 1 k k k ! n n− n− n− 1 X 2 X 3 X b b

      A A A + x = x + hc i , xiA b i hc i , x iA b i + · · · + hc i , x n− ib i k k k i i i =1 =1 =1 1 2 n n− n−

      X 1 X 2 X hc hc iA hc ib = A x + i , xiA + b i i , x i i i =1 =1 =1 1 b i + · · · + i , x n− 1 i .

      | {z } | {z } | {z } ∈D n ∈D ∈D n− 1 1 Logo, n n n b A x − A x ∈ D , e concluímos que j j j b

      A x ≡ A x modD , j = 1, . . . , n. m Vamos agora mostrar que os espaços D são preservados pela F-transformação, isto é, se m j b

      | j = 0, . . . , m − 1; i = 1, . . . , n} D = span{ b A b i então m m b D = D , m = 1, . . . , n.

      A igualdade implica em j j b j j j +1 j j +1 m A b i = A b i + v i , ∈ D ∈ D ⊂ D com v i . Desta forma, b A b i + D . Como b D é gerado por elementos j m m A b i D ⊂ D . da forma b com 0 ≤ j ≤ m − 1, segue que b Vamos usar indução sobre 1 1 m para mostrar a inclusão oposta. Como D e b D são gerados somente pelos b s , a 1 1 m− 1 m− 1 i

      ⊂ b ⊂ b inclusão D D é trivial para m = 1. Suponha que D D . Observe que m m− m− 1 1 b i | i = 1, . . . , n} obtemos D a partir de D unindo o conjunto {A ao conjunto de m− 1 geradores de D . Pela igualdade temos que m− m− 1 1 b m− m− 1 1 A b i = A b i + v i , com v i ∈ D ⊂ b D . Assim: m− m− 1 1 A b i = (A b i + v i ) − v i m− m m− m. 1 1 b

      − v ∈ b ⊂ b = A b i i D + b D D m m Logo, todos os geradores de D pertencem a b D , de onde segue a inclusão desejada. m m

      Portanto, cada espaço D é F-invariante e, visto que os números dim D , m = 1, . . . , n m , m = 1, . . . , n, são S-invariantes, temos que as dimensões dim D são state-feedback invariantes.

      5.3.2.1 Índices de Kronecker

      Vamos introduzir agora os índices de Kronecker de um sistema linear controlável e mos- trar que tais índices são state-feedback invariante expressando-os através das dimen- m sões de D , m = 1, . . . , n .

      Considere a matriz com entradas em R n formada pelos geradores do subespaço D n :         b 1 b 2 · · · b k

      Ab 1 Ab 2 · · ·

      A n− 1 b 1 A n− 1 b 2 · · · A n− 1 b k         n×k

      . (5.3-42) Repare que D 1 é gerado pela primeira linha, D 2 é gerado pela primeira e segunda linha,..., D n é gerado por todas as linhas. Vamos substituir cada entrada da matriz (5.3-42) acima por circulo (◦) ou estrela (⋆) de acordo com a seguinte regra. Primeiramente, formamos uma lista colocando cada linha da matriz (5.3-42) em sequencia numa mesma linha:

    Ab k ... ... ... ..

      Γ = {b 1 , b 2 , . . . , b k ; Ab 1 , Ab 2 , . . . , Ab k ; . . . ; A n− 1 b 1 , A n− 1 b 2 , . . . , A n− 1 b k }.

      A substituição será feita mediante a seguinte regra: da esquerda para a direita, um vetor de Γ será substituído por (⋆) se este for linearmente independente em relação aos vetores anteriores

      , e por (◦) caso contrário. Este procedimento nos dá uma matriz da forma: Σ =

                

      ⋆ ⋆ ⋆ · · · ⋆ ◦ ⋆ ⋆ · · · ◦ ◦ ⋆ ◦ · · · ◦ ... ... ... ... ...

      ◦ ⋆ ◦ · · · ◦            n×k .

      (5.3-43)

      

    Observação 5.8 (1) O número de estrelas (⋆) é exatamente n, devido a condição de controla-

    bilidade.

      (2) Toda a primeira linha é substituída por (⋆) pois, assumimos que o conjunto {b i | i = 1, . . . , k} é linearmente independente.

      (3) Se um vetor é substituído por (◦) então, na mesma coluna, abaixo deste vetor, todos os vetores serão substituído por (◦). De fato, se um vetor A j b i ∈ Γ é substituído por (◦)

      j

      b então, A i é combinação linear dos vetores anteriores a ele, isto é, j j β A b i ∈ span{A b γ | γ < i} + span{A b γ | β < j, γ = 1, . . . , k}.

      Desta forma, j j +1 j +1 β A · A b i = A b i ∈ span{A b γ | γ < i} + span{A b γ | β < j + 1, γ = 1, . . . , k} n− n− n− β 2 ... 1 1 ∈ span{A | γ < i} + span{A | β < n − 1, γ = 1, . . . , k}. A · A b i = A b i b γ b γ Portanto, cada coluna da matriz Σ é formada por uma coluna de estrelas (⋆) sobre uma coluna de círculos (◦).

      Denote por n a quantidade de estrelas da maior coluna de estrelas de Σ, por n 1 2 a quantidade de estrelas da segunda maior coluna de estrelas de Σ,..., e por fim, de- note por n k a quantidade de estrelas da menor coluna de estrelas de Σ. Naturalmente teremos, k

      X n ≥ n ≥ · · · ≥ n k , e n i = n, 1 2 i =1 pela Observação os números n , n , . . . , n k ∈ 1 2 N encontrados acima. Isto nos dá uma condição de controlabilidade simplificada: n − n − n 1 1 k 1 span{b , Ab , . . . , A b ; . . . ; b k , Ab k , . . . , A b k } = . (5.3-44) 1 1 1 R

      Resta mostrarmos que os índices de Kronecker são state-feedback invariantes. Para isso, mostraremos que podem ser expressados em termos das dimensões dos subespa- m ços D , m = 1, . . . , n. Temos, 1 dim D = k = 2 número de estrelas na primeira linha Σ, dim D = número de estrelas nas duas primeiras linhas de Σ, n ... dim D = n. Defina ∆ : {1, . . . , n} → {1, . . . , k} i i− 1 . 7→ dim D − dim D i

      Observe que ∆(i) é o número de estrelas na i-ésima linha de Σ. Vamos permutar as colunas da matriz Σ, colocando na primeira coluna a coluna com mais estrelas, na se- gunda coluna a próxima coluna com mais estrelas, ..., na k-ésima coluna a que tem menos estrelas. Desta forma, Σ torna-se uma matriz na forma de bloco triangular, que denotaremos por Σ . A partir disso podemos constatar o seguinte: o número de linhas que possuem pelo menos uma estrela é exatamente a altura da maior coluna de estre- las. O número de linhas que possuem pelo menos duas estrelas é a altura da segunda maior coluna de estrelas. Em geral, o número de linhas que possuem pelo menos i estrelas é o índice de Kronecker n i . Além disso, a quantidade de estrelas na j-ésima linha é ∆(j). Portanto, o índice de Kronecker n i é a quantidade de números ∆(j) tais j j− 1

      − dim D que ∆(j) ≥ i. Como ∆(j) = dim D e essas dimensões são invariantes por F-transformações, concluímos que os índices de Kronecker são state-feedback invari- antes. Destacamos esse fato no seguinte teorema:

      Teorema 5.9 Os índices de Kronecker são state-feedback invariantes.

      Para fixar ideias, consideremos um exemplo.

      Exemplo 5.10 Considere o sistema de controle linear controlável ˙x = Ax + Bu com n = 5 e

      k = 3 , onde A é uma matriz n×n constate e B é gerado pelos vetores linearmente independentes b , b , b , dados por: 1 2 3

              0 1 0 0 0                 0 0 1 0 0                        

      A = , b 1 = , b 2 = , b 3 .

      0 0 0 1 0

      1                          0 0 0 0 1     1            0 0 0 0 0 j j 1 2

      1 5 Resta encontrar mais dois vetores para que o span{b , b , b , A b i , A b i } = para alguns 1 2 3 R 1 2 2 j , j = 1, 2, 3, 4 e i , i = 1, 2, 3 . Fazendo os cálculos, obtemos que o conjunto {b , b , b , Ab , A b } 1 2 5 1 2 1 2 3 1 1 é uma base para R , isto é T T T T T 5 span{(0, 0, 1, 0, 0) , (0, 0, 0, 1, 0) , (0, 0, 0, 0, 1) , (0, 1, 0, 0, 0) , (1, 0, 0, 0, 0) } = .

      R A matriz junto com a regra definida para a substituição por estrelas e círculos, fica na forma Σ =

                

      ⋆ ⋆ ⋆ ⋆ ◦ ◦ ⋆ ◦ ◦ ◦ ◦ ◦ ◦ ◦ ◦

                 5×3 .

      Observe que a quantidade de estrelas são 5 = dim R 5 . Para i = 1, 2, 3, temos que os índices de Kronecker são definidos como

      “n i é o número de linhas que possuem pelo menos i estrelas”, obtemos assim n 1 = 3 , n 2 = 1 , e n 3 = 1. E para j = 1, 2, 3 temos que “∆(j) = dim D j

      − dim D j− 1 , ” segue que, ∆(1) = 3, ∆(2) = 1 e ∆(3) = 1. Finalmente, para i = 1, 2, 3, temos que

      “n i é a quantidade de números ∆(j) tais que ∆(j) ≥ i”, portanto, n 1 = 3 , n 2 = 1 , e n 3 = 1, coincidindo com os índices que já obtivemos.

      Vamos encontrar a forma mais simples de um sistema de controle linear controlável com controle vetorial via S-transformação.

      Seja E a matriz linha com entradas em R n formada precisamente pelos vetores do conjunto gerador de R n obtido na igualdade Ou seja, E = b 1

      · · · A n 1 1 b 1 · · · b 2 · · · A n 2 1 b 2

      · · · · · b k · · · A n k 1 b k .

      Temos que E é invertível pela construção feita anteriormente. Seja F = E 1 e escreve- mos F T

      = p 1 p 2 · · · p n , p i ∈

      R n , i = 1, . . . , n. Vamos definir um matriz C da seguinte forma: em F T selecionamos, da esquerda para direta, k vetores cujos índices são da seguinte forma: n 1 , n 1 + n 2 , n 1 + n 2 + n 3 , . . . , n 1 + n 2 + · · · + n k = n, onde n i é o índice de Kronecker. Isto é, os vetores selecionados são: p n 1 , p n 1 +n 2 , . . . , p n 1 +n 2 +···+n k = p n .

      Com esses vetores, definimos a matriz coluna C com entradas em R n : C =

                                               p n 1 p n 1 A ... p n 1 A n 1 1 p n 1 +n 2 p n 1 +n 2 A ... p n 1 +n 2 A n 2 1

      · ... · p n p n A ... p n A n k 1

                                               1 .

      (5.3-45) Note que, a matriz C é formada por k blocos de ordem n i × 1, i = 1, . . . , k.

      O Lema a seguir é técnico e tem o objetivo de simplificar os cálculos que faremos.

      Lema 5.11 Com a notação acima, temos

      p n 1 A n 1 1 b 1 = p n 1 +n 2 A n 2 1 b 2 = · · · = p n A n k 1 b k = 1.

      Demonstração : Segue diretamente da definição, temos F · E = I, isto é, I =

              p 1 p 2 ... p n

             

      · b 1 · · · A n 1 1 b 1

      · · · b 2 · · · A n 2 1 b 2 · · · · · b k · · · A n k 1 b k

      .

      Para fazermos esse cálculo, aplicamos F nas colunas de E, obtendo a matriz de ordem n × n :                        p 1 b 1 p 1 Ab 1 · · · p 1 A n 1 1 b 1 · · · · · p 1 b k p 1 Ab k · · · p 1 A n k 1 b k p 2 b 1 p 2 Ab 1

      · · · p 2 A n 1 1 b 1 · · · · · p 2 b k p 2 Ab k

      · · · p 2 A n k − 1 b k p 3 b 1 p 3 Ab 1 · · · p 3 A n 1 1 b 1 · · · · · p 3 b k p 3 Ab k · · · p 3 A n k 1 b k ... ... ... ... ... ... ... ...

      ... ... ... ... p n k b k p n k Ab k · · · p n k A n k 1 b k p n 1 b 1 p n 1 Ab 1 · · · p n 1 A n 1 1 b 1 · · · · · ... ... ... ... ... ... ... ... p n− 2 b k p n− 2 Ab k

      · · · p n− 2 A n k 1 b k p n− 1 b 1 p n− 1 Ab 1 · · · p n− 1 A n 1 1 b 1 · · · · · p n− 1 b k p n− 1 Ab k · · · p n− 1 A n k 1 b k p n b 1 p n Ab 1 · · · p n A n 1 1 b 1 · · · · · p n b k p n Ab k · · · p n A n k 1 b k

                             .

      Como esta é igual a matriz identidade, temos que todos os elementos da diagonal principal são 1, em particular temos: p n 1 A n 1 1 b 1 = p n 1 +n 2 A n 2 1 b 2 = · · · = p n A n k 1 b k = 1. Enfatizamos que todos elementos fora da diagonal são nulos.

      Vamos mostrar que a matriz C é invertível. Para isso, aplicamos C nas colunas de E obtendo assim uma matriz P invertível. De fato, a matriz P obtida pela aplicação de C nas colunas de E é, em blocos

      C · E = P =        

      P 11 P 12 · · · P 1k

      P 21 P 22 · · · P 2k ... ... ... ...

      P k 1 P k 2 · · · P kk         k×k

      , onde cada bloco P ij têm ordem n i × n j , para i, j = 1, . . . , k. Os blocos P ii têm a seguinte forma: para i = 1,

      P 11 =            p n 1 b 1 p n 1 Ab 1 · · · p n 1 A n 1 1 b 1 p n 1 Ab 1 p n 1 A 2 b 1 · · · p n 1 A n 1 b 1 ... ... . .. ... p n 1 A n 1 2 b 1 p n 1 A n 1 1 b 1 · · · p n 1 A 2n 1 +1 b 1 p n 1 A n 1 1 b 1 p n 1 A n 1 b 1 · · · p n 1 A 2n 1 2 b 1

                 n 1 ×n 1

      , para i = 2, P 22 =

                 p n 1 +n 2 b 2 p n 1 +n 2 Ab 2 · · · p n 1 +n 2 A n 2 1 b 2 p n 1 +n 2 Ab 2 p n 1 +n 2 A 2 b 2 · · · p n 1 +n 2 A n 2 b 2 ... ... . .. ... p n 1 +n 2 A n 2 2 b 2 p n 1 +n 2 A n 2 1 b 2

      · · · p n 1 +n 2 A 2n 2 +1 b 2 p n 1 +n 2 A n 2 1 b 2 p n 1 +n 2 A n 2 b 2 · · · p n 1 +n 2 A 2n 2 2 b 2            n 2 ×n 2

      , por fim, para i = k, P kk =

                 p n b k p n Ab k · · · p n A n k 1 b k p n Ab k p n A 2 b k · · · p n A n k b k ... ... . .. ... p n A n k 2 b k p n A n k 1 b k

      · · · p n A 2n k +1 b 2 p n A n k 1 b k p n A n k b k · · · p n A 2n k 2 b k            n k ×n k .

      Note que, em todos os blocos P ii , temos a anti-diagonal (ou diagonal secundária) for- mada por 1 (um), e 0 (zero) em todas as outras entradas, devido ao Lema Nos blocos restantes, P ij com i 6= j, temos todas as entradas nulas pois, esses blocos não possuem entradas da forma p n 1 A n 1 1 b 1 = p n 1 +n 2 A n 2 1 b 2 = · · · = p n A n k 1 b k . Logo, os

      blocos de P têm as formas:     0 0 · · · 1 0 0 · · ·         0 0 · · · 0 0 0 · · ·         .. ..  .   .  P ii = , P ij = .

      ... ... ... ... ... ...             0 1 · · · 0 0 0 · · ·         1 0 · · · 0 0 0 · · · n ×n n ×n i i (i=j) i j (i6=j)

      Pelo cálculo do determinante det(C) · det(E) = det(C · E) = det(P ) = det(P ) · det(P ) · · · det(P kk ) = 1, 11 22 temos que det(C) 6= 0. Portanto a matriz C é invertível.

      Enunciamos agora o principal resultado desta seção.

      Teorema 5.12 Todo sistema linear controlável com controle vetorial: k n

      ˙x = Ax + Bu, u = (u , . . . , u k ) ∈ , x ∈ , 1 R R j n (5.3-46) span{A b i | j = 1, . . . , n − 1, i = 1, . . . , k} = , R com B na forma matricial

      B = , b b · · · b k 1 2 é S-equivalente a um sistema da forma:

       i i

      ˙x = x  1 2

         i i  

      ˙x = x  2 3

          ...

      (5.3-47)  i i 

      ˙x = x  n − n i 1 i   n n n 1 2 k

       

      X X

      X  i i 1 1 i 2 2 ik k

        + ˙x = α x α x + · · · + α x + u i , n n j j n j j n j j i i i i   j j j =1 =1 =1 para cada i = 1, . . . , k, e state-feedback equivalente a um sistema da forma:

                           x 1(n 1 ) = bu 1 x 2(n 2 ) = bu 2 ... x k− 1(n k− 1 ) = bu n k− 1 x k (n k ) = bu k

      ˙x 5 = P 5 i

      1 0 0 0 0 0 0 1 0 0 0 1

      B =            0 0 0

      γ 1 γ 2 γ 3 γ 4 γ 5            e b

      1 β 1 β 2 β 3 β 4 β 5

      1 α 1 α 2 α 3 α 4 α 5

      A =           

      (5.3-49) que pode ser escrito na forma matricial ˙x = b Ax + b Bu com b

      γ i x i + u 3 ,

      P 5 i β i x i + u 2

      (5.3-48) onde n 1 , . . . , n k são os índices de Kronecker do sistema

      ˙x 3 = x 4 ˙x 4 =

      P 5 i α i x i + u 1

      ˙x 1 = x 2 ˙x 2 =

                          

      , β s e γ s de maneira conveniente. Por fim, escrevemos os sistemas para i = 1, 2, 3 num único sistema. A forma normal para esse sistema fica

      n 1 = 2, n 2 = 2 e n 3 = 1. Para simplificar um pouco a carregada notação do teorema, iremos escrever x 1 1 = x 1 , x 1 2 = x 2 , x 2 1 = x 3 , x 2 2 = x 4 e x 3 1 = x 5 . Também substituiremos os coeficientes α ik n i j por α s

      

    Exemplo 5.13 Tome um sistema linear ˙x = Ax+Bu com n = 5, k = 3 e índices de Kronecker

      Antes de provarmos esse resultado, vamos ver um exemplo que ajudará a compre- ender melhor a notação.

      . A forma em (5.3-48) é chamada forma normal de Brunovský do sistema (5.3-46).

                 . Para a forma normal , mantemos a notação do teorema e obtemos  1

       x ¨ =  1 bu

        2 . x ¨ = 2 bu

         3

       ˙x = 3 bu

      Ax+ b Bu Podemos reescrever o sistema acima na forma ˙x = b introduzindo as seguintes variáveis: 1 1 2 2 3 x = x , x = ˙x , x = x , x = ˙x , x = x . 1 2 3 4 5 Assim o sistema envolvendo derivadas de ordem 2 é escrito como o seguinte sistema envolvendo somente derivadas de ordem 1:

       

      ˙x = x 1 2      

      ˙x =  2 1 bu

        .

      (5.3-50) ˙x = x 3 4

         

      ˙x =  4 2 bu

          

      ˙x = 5 3 bu Comparando , percebemos que a F-transformação é dada por 5 ! ! ! 5 5 1 = α i x i + u

      X 1 , 2 = β i x i + u

      X 2 , 3 = γ i x i + u

      X 3 , bu bu i i i e bu pondo     0 1 0 0 0 0 0 0         0 0 0 0 0 1 0 0             b b

      A = e B = .

      0 0 0 1 0 0 0 0              0 0 0 0 0   0 1 0      0 0 0 0 0 0 0 1

      Obtemos a forma canônica na forma matricial. Ressaltamos que é sempre possível escrever a expressão (mais compacta) na forma matricial, usando mudanças de variáveis como as deste exemplo. Também é possível obter diretamente a forma normal de Brunovský na forma matricial (para detalhes, ver ).

      Demonstração : Vamos mostrar que o sistema

      exibindo uma matriz invertível C satisfazendo isto é, b A = CAC 1 , e b

      B k         1

      · · · · ... · · · p n b 1 p n b 2 · · · p n b k p n Ab 1 p n Ab 2 · · · p n Ab k ... ... · · · ... p n A n k 1 b 1 p n A n k 1 b 2 · · · p n A n k 1 b k

      · ...

      · ... · · · · · p n 1 +n 2 A n 2 1 b 2 · · · ·

      · · · · p n 1 +n 2 Ab 2 · · · ·

      · · · ... p n 1 A n 1 1 b 1 p n 1 A n 1 1 b 2 · · · p n 1 A n 1 1 b k p n 1 +n 2 b 2

      · · · p n 1 Ab k ... ...

                                            p n 1 b 1 p n 1 b 2 · · · p n 1 b k p n 1 Ab 1 p n 1 Ab 2

      Seja C a matriz invertível definida em Primeiramente vamos obter b B . Para isso aplicamos C nas colunas de B. O resultado é a matriz: C · B =

      , onde b A ij têm ordem n i × n j , e b B i têm ordem n i × k, para i, j = 1, . . . , k.

      B 1 b B 2 ... b

      B = CB, onde b A e b B são matrizes nas formas normais. Escrevemos as matrizes b A e b B em blocos, b

              b

      , b B =

      A kk         k×k

      A k 1 b A k 2 · · · b

      A 2k ... ... ... ... b

      A 21 b A 22 · · · b

      · · · b A 1k b

      A 11 b A 12

      A =         b

                                            n×k .

      Pelo Lema esta matriz torna-se: C · B =

                                            0 0 · · ·

      0 0 · · · ... ... ··· ... 1 0 · · · 0 0 · · · 0 0 · · · ... ... ··· ... 0 1 · · · ... ... ··· ...

      ... ... ··· ... 0 0 · · · 0 0 · · ·

      ... ... ··· ... 0 0 · · ·

      1                                       n×k

      = b B.

      (5.3-51)

      Para encontrar b A

      , vamos calcular b A · C = CA

      . Esta igualdade é precisamente,         b

      A 11 b A 12 · · · b

      A 1k b A 21 b

      A 22 · · · b A 2k ... ... ... ... b

      A k 1 b A k 2

      · · · b A kk

              k×k

      ·                                          p n 1 p n 1 A ... p n 1 A n 1 1 p n 1 +n 2 p n 1 +n 2 A ... p n 1 +n 2 A n 2 1

      · ... · p n p n A ... p n A n k 1

                                               1

      =                                          p n 1 p n 1 A ... p n 1 A n 1 1 p n 1 +n 2 p n 1 +n 2 A ... p n 1 +n 2 A n 2 1

      · ... · p n p n A ... p n A n k 1

                                               1

      · A,

      (5.3-52)

      =                                       p n 1 A p n 1 A 2 ... p n 1 A n 1 p n 1 +n 2 A p n 1 +n 2 A 2 ... p n 1 +n 2 A n 2 ...

                                     

      1 α k 1 n k 1 α k 1 n k 2 · · · · · · α k 1 n k n 1 α kk n k 1 α kk n k 2 · · · · · · α kk n k n k

      · · · 1 · · · ... ... ... ... ... ······ ... ... ... ... ... · · · · · ·

      1 · · ·

      · · ·

      ... ... ...

      ...

      α 11 n 1 1 α 11 n 1 2 · · · · · · α 11 n 1 n 1 α 1k n 1 1 α 1k n 1 2 · · · · · · α 1k n 1 n k ...

      1 · · ·

      · · ·

      1 · · · · · · ... ... ... ... ... ······ ... ... ... ... ...

                                      1 · · · · · ·

                                            1 Desenvolvendo os cálculos (multiplicação e soma) na matriz à esquerda e compa- rando cada bloco com o bloco correspondente na matriz à direita, obteremos os coefi- cientes de cada bloco da matriz b A , que são

      ... p n A p n A 2 ... p n A n k

                                            1

    • · · · + b A 1k

      A 21         p n 1 p n 1 A ... p n 1 A n 1 1

      multiplicando os blocos de tamanhos adequados, obtemos:                                       b

      A 11         p n 1 p n 1 A ... p n 1 A n 1 1

             

              p n p n A ... p n A n k 1

              b

             

             

              p n p n A ... p n A n k 1

              ...

    • · · · + b A 2k

      ... b

      A k 1         p n 1 p n 1 A ... p n 1 A n 1 1

             

              p n p n A ... p n A n k 1

    • · · · + b A kk

      onde α ij ∈ b A ij .

      α i 1 n i j x 1 j + n 2 X j =1 α i 2 n i j x 2 j + · · · + n k

      ˙x i n i 1 = x i n i ˙x i n i = bu i

      ˙x i 1 = x i 2 ˙x i 2 = x i 3 ...

                          

      X j =1 α ik n i j x k j + u i , obtemos, para cada i = 1, . . . , k, o sistema

      α i 1 n i j x 1 j + n 2 X j =1 α i 2 n i j x 2 j + · · · + n k

      X j =1 α ik n i j x k j + u i , que está na forma Considerando novos parâmetros de controle: bu i = n 1 X j =1

      ˙x i n i 1 = x i n i ˙x i n i = n 1 X j =1

      Esta forma (5.3-52) é a forma normal para sistemas De fato, para qualquer x = (x 1 1 , . . . , x 1 n 1 , x 2 1 , . . . , x 2 n 2 , . . . . . . . , x k 1 , . . . , x k n k ) ∈

      ˙x i 1 = x i 2 ˙x i 2 = x i 3 ...

                              

      R n k , (5.3-53) e u = (u 1 , . . . , u k ) ∈ R k , temos que b Ax + b Bu é, para cada i = 1, . . . , k

      R n 2 × · · · ×

      R n 1 ×

      R n , ou escrito na forma x = (x 1 , x 2 , . . . , x k ) ∈

      , . i i

      = x Fazendo x , podemos juntar os k sistemas em um só na forma mais compacta 1

       1(n 1 )  x =  1 bu

          2(n ) 2

       x = 2  bu  

      (5.3-54) ...    k− 1(n k− ) 1

       x = u  k− bu 1

          k (n ) k  x = k . bu Logo, o sistema é state-feedback equivalente ao sistema (5.3-54).

      

    CAPÍTULO 6

    LINEARIZAđấO POR STATE-FEEDBACK EQUIVALÊNCIA

      O objetivo principal deste capítulo é introduzir um teorema que nos dá con- dições para a linearizabilidade local via state-feedback equivalência de um sistema de controle afim sobre uma variedade M no caso de controle vetorial. Iremos ape- nas enunciar este resultado na sua forma mais geral, provando-o apenas para sistemas com controle escalar. Para isso, iremos apresentar uma série de definições, incluindo também o Teorema de Fröbenius, visando o nosso objetivo.

      Considere o sistema de controle não linear: k

      X k ˙q = f (q) + u i g i (q), u = (u , . . . , u k ) ∈ , q ∈ M. (6.0-1) i =1 1 R

      Nosso objetivo é verificar quando é possível transformar o sistema acima no sis- tema: k

      X k n ˙x = Ax + u i b i , u = (u , . . . , u k ) ∈ , x ∈ , i =1 1 R R j n (6.0-2)

      | j = 1, . . . , n − 1, i = 1, . . . , k} = span{A b i .

      R Apresentaremos a seguir algumas definições que serão fundamentais para o desen- volvimento deste capitulo.

      

    Definição 6.1 Seja T M o fibrado tangente. Uma distribuição ∆ ⊂ T M sobre uma variedade

      M é uma família de subespaços vetoriais ∆ q ⊂ T q M diferenciável em relação a q ∈ M, com dimensão dim ∆ q constante para todo q.

      

    Observação 6.2 Na definição anterior, o significado de uma distribuição ser diferenciável é

      o seguinte: para cada q ∈ M existem uma vizinhança O de q e campos de vetores diferen- ′ ′ ′ ′ ciáveis X , . . . , X k , tais que X i (q ) ∈ ∆(q ) para todo q ∈ O , i = 1, . . . , k, e ∆(q ) = 1 ′ ′ span{X (q ), . . . , X k (q )} . Em geral pode-se também considerar distribuições que não sejam 1 q diferenciáveis ou tais que dim ∆ dependam de q. As distribuições como as consideradas aqui, com dim ∆ q constantes, são chamadas na literatura de distribuições regulares. Como estamos interessados somente em distribuições regulares e diferenciáveis, continuaremos a usar somente a expressão distribuição, ficando sempre subentendido que são regulares e diferenciáveis.

      

    Definição 6.3 Dizemos que uma distribuição ∆ é integrável se para cada q ∈ M existe uma

      subvariedade imersa W q ⊂ M, q ∈ W q tal que ′ ′ ∈ W T q W q = ∆ q q q . A subvariedade W q é chamada de variedade integral da distribuição ∆ através do ponto q.

      

    Definição 6.4 Dizemos que uma distribuição ∆ é involutiva se para quaisquer campos de

      vetores X, Y ∈ Vec(M) e qualquer q ∈ M tem-se: X(q), Y (q) ∈ ∆ ⇒ [X, Y ](q) ∈ ∆ . q q A implicação acima é também conhecida como condição de Fröbenius.

      Enunciaremos aqui o importante teorema sobre uma distribuição, cuja demonstra- ção pode ser encontrada em Teorema 5.4.

      

    Teorema 6.5 (Fröbenius) Uma distribuição ∆ sobre M é involutiva se, e somente se, é inte-

    grável.

      

    Definição 6.6 Dizemos que o sistema é localmente state-feedback equivalente ao

      sistema linear na vizinhança de um ponto q ∈ M, se existir um difeomorfismo local (S-transformação): n

      Φ : U q ⊂ M → V ⊂ R

      , onde U q é um aberto contendo o ponto q e uma F-transformação: k k ϕ : U q × →

      R R da forma   a (q) 1

         

          a k (q) onde D é o operador invertível análogo ao definido em , ou seja,

      ϕ(q, u) = + D(q)u, (6.0-3) ...

      D(q) : span{g (q), . . . , g k (q)} → span{g (q), . . . , g k (q)}, 1 1 cuja matriz de D(q) na base B = {g (q), . . . , g k (q)} , 1 ∞ k [D(q)] B = (d ij (q)) é invertível com, d ij , a i ∈ C (M ) e u = (u , . . . , u k ) ∈ para todo i, j = 1, . . . , k, que 1 R transformam o sistema restrito a V .

      Observação 6.7 Podemos escrever a F-transformação acima em detalhes:

              ϕ (q, u) a (q) d (q) · · · d (q) u 1 1 11 1k 1

                      ϕ(q, u) = = ...

      ... ... ... ... ...        

    •        

      ϕ k (q, u) a k (q) d k (q) · · · d kk (q) u k 1 ou seja,    

      P k ϕ (q, u) a (q) + d (q)u j 1 1 1j j =1

              = .

      ... ...         k

      P ϕ k (q, u) a k (q) + d kj (q)u j j =1

      Logo, para cada i = 1, . . . , k temos, k

      X ∈ ϕ i (q, u) = a i (q) + d ij (q)u j R. j =1

      Aplicando no sistema obtemos, ˙q = f (q) + k

      X i =1 u i g i (q) −→ ˙q = f (q) + k

      X i =1 ϕ i g i (q)

      = f (q) + k

      X i =1 a i (q) + k

      X j =1 d ij (q)u j ! g i (q)

      = f (q) + k

      X i =1 a i (q)g i (q) + k

      X i,j =1 d ij (q)u j g i (q) = f (q) + k

      X i =1 a i (q)g i (q) !

      X i =1 D(q)g i (q).

    • u i k

      Assim, podemos separar uma F-transformação em dois tipos: (f, g 1 , . . . , g k ) −→ (f + a i g i , g 1 , . . . , g k ) (f, g 1 , . . . , g k ) −→ (f, Dg 1 , . . . , Dg k ) .

      

    Exemplo 6.8 (Pêndulo) Considere um pêndulo consistindo de um comprimento l, massa m e

    com controle de torque u. Veja a figura abaixo.

      Figura 6.1: Pêndulo A evolução do pêndulo é descrita pela equação de Euler-Lagrange com força externa ml 2

      ¨ θ + mgl sin(θ) = u. Reescrevemos a equação acima como ˙θ = ω g u

      ˙ω = − sin(θ) + . 2 l ml 2 := θ := ω

      Denote x 1 , x 2 2 e considere a evolução do pêndulo sobre o espaço R , ou seja, x = (x , x ) ∈ . Obtemos a sistema 1 2 R

       

      ˙x = x 1 2 Σ : g u

       ˙x = − sin(x ) + 2 l ml 1 2 .

      Substituindo o controle u por 2 u = ml 1 ), bu + mlg sin(x que pode ser interpretado como uma transformação no espaço dos parâmetros de controle U com 2 dependência do estado x ∈ R obtemos o sistema de controle linear

       

      ˙x = x 1 2 b Σ :

       ˙x 2 = bu. g

      Para colocar esse exemplo na notação do exemplo anterior, tome q = (x , x ), f (q) = (x , − sin(x )) 1 1 2 2 l 1 e g(q) = (0, ml 2 ) . Assim, o sistema afim fica na forma ˙q = f(q) + ug(q). A F-transformação 2 × aplicada é dada por ϕ : R R → R, 2

      ϕ(x, y) = mlg sin(x ) + ml u, 1 a qual transforma o sistema afim no sistema linear ˙x = Ax + ub, com     1 0

      A =    e b =  .

      0 0

      1 Já definimos anteriormente, para sistemas da forma a família de subespaços m j D = span{A b i | j = 0, . . . , m − 1, i = 1, . . . , k}, m = 1, . . . , n. (6.0-4)

      Esta família têm as seguintes propriedades: m n .

      1. Para cada m = 1, . . . , n temos que dim D é constante para todo x ∈ R Logo, 1 n D , . . . , D são distribuições. m

      2. As distribuições D são integráveis pois, são geradas por campos de vetores constantes. n n 3. Devido a condição de controlabilidade, temos que D = R .

      Podemos generalizar a construção dos subespaços para sistemas não linea- res: para cada m = 1, . . . , n, definimos a família de subespaços m j D = span{(adf) g i (q) | j = 0, . . . , m − 1, i = 1, . . . , k} ⊂ T q M. (6.0-5) q

      Temos naturalmente que 1 2 n D ⊂ D ⊂ · · · ⊂ D . q q q Mais ainda, 1 D = span{g , . . . , g k } 2 1 1 D = span{[f, g ], . . . , [f, g k ]} + D 1 n n− n− ... 1 1 D = span{[f, X] | X ∈ D } + D .

      Assim, m m− 1 m− 1 D = } + D , m = 1, . . . , n. m span{[f, X] | X ∈ D (6.0-6)

      Em geral, dim D é constante numa vizinhança suficientemente pequena do ponto q m q . De fato, podemos extrair uma base do conjunto de vetores geradores de D , sendo q linearmente independentes no ponto q, são também em uma vizinhança do ponto q.

      Porém, não há garantia que tais vetores sejam linearmente independentes globalmente, m m consequentemente, dim D não é constante para cada m. Portanto, D não são distri- q q buições.

      A condição para a linearização de sistemas de controle não linear será dada em m termos da família D . Estas famílias, com uma condição adicional, têm a propriedade q m de serem F-invariantes, isto é, para cada m, D contém as transformações por feedback q de seus elementos. Isto é descrito no lema a seguir. m Lema 6.9 Se as famílias D , m = 1, . . . , n, são involutivas, então elas são F-invariantes.

      Demonstração : Considere a decomposição da F-transformação vista na Observação (f, g , . . . , g k ) −→ (f + a i g i , g , . . . , g k ) , (6.0-7) 1 1

      (f, g , . . . , g k ) −→ (f, Dg , . . . , Dg k ) . (6.0-8) 1 1 A prova será feita por indução sobre m. Para m = 1 temos, 1 D = span{g , . . . , g k }. 1 1 Como a transformação não altera os campos g , . . . , g k , temos que D é inva- 1 1 1 → D riante por esta transformação trivialmente. Como D : D é invertível, então 1 1 Dg i ∈ D , i = 1, . . . , k. Logo, D é também preservado pela transformação e, 1 portanto, D é F-invariante. m− 1 m

      Suponha que D é F-invariante e vamos provar que D também o é. Pela igual- dade temos, m m− m− 1 1 D = } + D , m = 1, . . . , n. m span{[f, X] | X ∈ D 1 m− 1

    • D é preservado por De fato, Dg i ∈ D ⊂ D , i = 1, . . . , k. Logo, m m [f, Dg i ] ∈ D , i = 1, . . . , k. m−
    • 1<
    • D é preservado por De fato, para X ∈ D temos pela regra de Leibniz:

      [f + a i g i , X] = [f, X] + [a i g i , X] = [f, X] − [X, a i g i ] m− 1 m = [f, X] − (Xa i )g i − a i [X, g i ].

      Agora, como X ∈ D temos que [f, X] ∈ D . Uma vez que Xa i é um escalar, 1 m m− 1 )g ∈ D ⊂ D naturalmente (Xa i i . Por fim, como g i e X pertencem a D , segue da involutividade que: m− m 1 [X, g i ] ∈ D ⊂ D .

      [g 1 , g 2 ](x) = 0 ∈ D 1 , para todo x ∈ O . Logo, D 1 é involutiva. Para obter a distribuição D 2 , usamos a fórmula da

                

      ⊂ R 5 contendo a origem. Além disso, temos

      } têm dimensão constante igual a 2 em uma vizinhança suficientemente pequena O

      | {z } g 2 (x,u) u 2 . (6.0-9) Neste sistema, a distribuição D 1 = span{g 1 , g 2

      1           

      1

      1

      | {z } =g 1 (x,u) u 1 +           

                

            cos(x 1 − x 5 )

      | {z } =f (x,u)

      =            x 2 + x 2 2 x 3 − x 1 x 4 + x 4 x 5 x 2 x 4 + x 1 x 5 − x 2 5 x 5 x 2 2

      Logo, [f + a i g i , X] ∈ D m .

      ˙x 5           

      ˙x 3 ˙x 4

      ˙x 1 ˙x 2

      :           

      Exemplo 6.11 Considere o sistema não linear em R 5

      (iii) as distribuições D m são involutivas.

      = T q M, q ∈ M ,

      e somente se, (i) para cada m = 1 . . . , n temos que, D m são distribuições, (ii) D n q

      

    Teorema 6.10 O sistema se,

      Enunciaremos sem demonstrar um resultado geral sobre state-feedback equivalên- cia para sistemas afins. Posteriormente iremos demonstrar um resultado análogo para sistemas com controle escalar (Teorema

      Assim, D m é preservado pelas F-transformações Portanto D m é F- invariante.

    •     
    Proposição no Capitulo 1 para o cálculo de colchetes e obtemos [f, g 1 ] =

                

      Logo, D 2 é involutiva. Finalmente, com cálculos análogos, obtemos a distribuição D 3 = span{g 1 , g 2 , ( adf)g 1 , ( adf)g 2 , ( adf) 2 g 1 , ( adf) 2 g 2 }, que tem dimensão constante igual a 5 para todo x ∈ O e é involutiva. Como D m− 1

      ˙x 1 = u 1 cos(θ) ˙x 2 = u 2 sin(θ)

              

      × S 1 :

      Exemplo 6.12 Considere o sistema não linear sobre R 2

      .

      ⊂ D m para m ≥ 2 e D 3 tem dimensão máxima, temos que D 4 e D 5 são necessariamente involutivas. Portanto, D m , m = 1, . . . , 5, possui dimensão constante em O . Além disso, essas distribuições são involutivas e claramente D 5 = T R 5 . Pelo Teorema é state-feedback equivalente a um sistema linear controlável em O

      [g 1 , [f, g 1 ]] = [g 1 , [f, g 2 ]] = [g 2 , [f, g 1 ]] = [g 2 , [f, g 2 ]] = 0 ∈ D 2 , para todo x ∈ O . Temos também [[f, g 1 ], [f, g 2 ]](x) = sin(x 1 − x 5 )g 1 (x) ∈ D 2 .

      − cos(x 1 − x 5 ) −x 2 sin(x 1 − x 5 )

      } têm dimensão constante igual a 4 em O . Além disso,

      , g 2 , ( adf)g 1 , ( adf)g 2

      Logo D 2 = span{g 1

      −1            .

      −1 −(x 1 − x 5 )

      , [f, g 2 ] =           

                

      ˙θ = u 2 , (6.0-10)

      2 1 , x ), θ) ∈ × S .

      com ((x 1 2 R O sistema acima na forma de matrizes é:      

      ˙x cos(θ) 1            

      = u u , + 1 2 ˙x 2 sin(θ)

                 

      ˙θ

      1 que nos dá     cos(θ)         g = , e g = . 1 sin(θ) 2

              1

      1 A distribuição D = span{g , g } não é involutiva pois, 1 2         0 0 0 cos(θ) 0 0 − sin(θ)                 [g , g ] = − . 1 2 0 0 0 sin(θ) 0 0 cos(θ)

                      0 0 0 0 0

      1 Logo,   sin(θ)   1

        [g , g ] = ∈ D / . 1 2 − cos(θ)    

      Pelo Teorema não é localmente state-feedback equivalente a sistema linear controlável.

      Para provarmos o resultado sobre state-feedback equivalência para controle escalar, precisaremos do seguinte resultado de natureza geral, que diz que variedades integrá- veis podem ser parametrizadas de maneira diferenciável.

      

    Lema 6.13 Sejam M uma variedade de dimensão n e X , . . . , X k ∈ Vec(M), k ≤ n. Se

    1

      ∆ = span{X , . . . , X k } é uma distribuição integrável sobre M, dim ∆ q = k , então para cada 1 ∈ M ⊂ M q existem, uma vizinhança O q contendo q e uma aplicação diferenciável n−k

      ϕ : O q → R tal que:

      (1) dim ϕ ∗q (T q M ) = n − k, q ∈ O q ,

      − 1

      ) (y) (2) para todo y ∈ ϕ(O q , ϕ é uma variedade integral de ∆, ou, equivalentemente, (2’) ker(ϕ ∗q ) = ∆ q , q ∈ O q .

      : Seja q ∈ M um ponto qualquer. Escolha campos de vetores Y , . . . , Y n−k ∈ Demonstração 1 Vec(M) tais que span{X 1 (q ), . . . , X k (q ), Y 1 (q ), . . . , Y n−k (q )} = T q M.

      Da igualdade acima segue que q span{X (q), . . . , X k (q), Y (q), . . . , Y n−k (q)} = T q M, q ∈ U q , 1 1 . onde U é uma vizinhança suficientemente pequena de q Considere a seguinte apli- cação diferenciável: k n−k

      × → M Ψ :

      R R dada por t 1 X t 1 k k X s Y s Y 1 1 n−k n−k (t, s) 7→ e ◦ · · · ◦ e ◦ e ◦ · · · ◦ e (q ), com derivadas parciais na origem dadas por

      ∂ Ψ(t, s) = X i (q ), i = 1, . . . , k

      ∂t i t =s=0 ∂ Ψ(t, s) = Y i (q ), i = 1, . . . , n − k. ∂s i t =s=0

      Logo, k n−k Ψ : × → T q M ∗ (0,0) R R

      é um isomorfismo e portanto, pelo Teorema da Função Inversa, existem abertos O ⊂ k n−k (0,0) × ⊂ U

      R R e O q q tais que Ψ : O → O q (0,0)

      é um difeomorfismo. Seja k n−k n−k π : × → 2 R R R

      7→ (t, s) s a projeção na segunda coordenada. Com isso, definimos a aplicação diferenciável ϕ pondo: − n−k 1 ϕ := π ◦ Ψ : O q → , ϕ(t, s) = s. 2 R Para q ∈ O q , temos: − n−k 1 − − 1 D q ϕ = D ,s π ◦ D q Ψ : T q M → , (t 1 1 ) 1 2 R

      (q) = (t , s ). q Ψ π onde Ψ 1 1 Como D é isomorfismo e D (t ,s ) 1 1 2 é sobrejetora (pois π 2 é submersão), obtemos dim D q ϕ(T q M ) = n − k. Isto mostra o item (1). n−k Seja s = (s , . . . , s ) ∈ fixado. O conjunto 1 n−k R k

      N = {Ψ s (t) | t ∈ } R

      é uma variedade integral de ∆. De fato, fixado s , a aplicação k → M

      Ψ s : R é dada por t 1 X t 1 k k X s Y s Y n−k k 1 1 n−k Ψ s (t) = e ◦ · · · ◦ e (q ) 1 onde q = e ◦ · · · ◦ e (q ) . A diferencial, para t ∈ R qualquer, 1 k ′

      D t Ψ s : → T q M, q = Ψ s (t) s R é injetora. Logo Ψ é uma imersão. Consequentemente a imagem k

      N = Ψ s ( ) R

      é uma subvariedade imersa de dimensão k em M. Como ∆ é integrável, para cada q ∈ N temos que T q N = ∆ q desta forma N é uma variedade integral de M. Observe que, para cada s ∈ ϕ(O q ) 1 temos que ϕ (s) = N. Em resumo, para qualquer ponto q ∈ M podemos construir, usando a aplicação Ψ definida para q, uma variedade integral N q contendo q, e como a distribuição ∆ é integrável, obtemos a igualdade acima. O item (2) segue.

      O sistema com k = 1, isto é, com controle escalar, têm a forma: ˙q = f (q) + ug(q), u ∈ m R, q ∈ M. (6.0-11)

      Os subespaços D ficam definidos por: m j q D = span{(adf) g(q) | j = 0, . . . , m − 1} ⊂ T q M, q ∈ M, m = 1, . . . , n. q

      

    Teorema 6.14 O sistema

      se, e somente se, n (1) D = T q M, q n− 1 (2) a distribuição D é involutiva.

      Demonstração : (⇒) Segue da discussão que precede o Lema (⇐) Reciprocamente, vamos construir coordenadas adequadas que simplificarão o sis- tema para obter a transformação local desejada. n− 1 Seja q ∈ M qualquer. Como a distribuição D é integrável (Teorema de Frö- benius), temos pelo Lema que existem uma vizinhança O q ⊂ M de q e uma aplicação diferenciável n− (n−1)

      ϕ : O q → = 1 R R tal que: (i) D q ϕ (T q M ) = ⇒ D q ϕ 6= 0, 1 R n− 1 1

      (ii) D q ϕ 1 (D ) = 0. q Temos também, n− 1 n− 2

      (iii) D = span{g(q), (adf)g(q) . . . , (adf) g(q)}, q n− n− 1 1 M = , ( g(q)} (iv) T q span{D adf) . q

      Considerando o campo f como derivação, construímos as seguintes funções defi- nidas em O q : ϕ = f ϕ , 2 1 2

      ϕ = f ϕ = f ϕ , 3 2 1 ... n− 1 ϕ n = f ϕ n− = f ϕ . 1 1 Devido ao item (ii) temos, para cada j = 0, . . . , n − 2, j j \ 0 = D q ϕ ( adf) g(q) = ( adf) g(q)ϕ (q). 1 1 Logo, n− 1 n− 1

      \ 0 6= D q ϕ ( adf) g(q) = ( adf) g(q)ϕ (q), 1 1 caso contrário D q ϕ 1 (T q M ) = 0 , violando o item (i).

      Com isso, provaremos que  

      0, j se j + l &lt; n ( adf) gϕ l = n− 1 (6.0-12)

       ±( adf) gϕ 6= 0, se j + l = n, 1 n− 1 onde l = 1, . . . , n e j = 0, . . . , n − 1. Denotamos b = ±(adf) gϕ 6= 0. 1 Vamos provar por indução que a igualdade (6.0-12) é válida para todo l ∈ N. De fato, se l = 1, já vimos anteriormente que n− j 1

      6= 0 ( adf) gϕ 1 e (adf) gϕ 1 = 0, para j = 0, . . . , n − 2. Suponha que (6.0-12) vale para l − 1 e vamos mostrar que é também válido para l. Com efeito, ( adf) j gϕ l = ( adf) j g(f ϕ l− 1 ) = ( adf) j g ◦ f ϕ l− 1

      = ( adf) j g ◦ f − f ◦ ( adf) j g + f ◦ ( adf) j g ϕ l− 1 = [( adf) j

      g, f ] + f ◦ ( adf) j g ϕ l− 1 = −[f, ( adf) j g] + f ◦ ( adf) j g ϕ l− 1

      = −( adf) j +1 g + f ◦ ( adf) j g ϕ l− 1

      = −( adf) j +1 gϕ l− 1 + f ◦ ( adf) j gϕ l− 1 .

      Se (j + 1) + (l − 1) = j + l = n, então j + l − 1 &lt; n. Pela hipótese de indução, temos −( adf) j +1 gϕ l− 1 = −( adf) n− 11 6= 0, e f ◦ (adf) j gϕ l− 1 = 0, e obtemos, (adf) j gϕ l = −( adf) j +1 gϕ l− 1 . Se (j + 1) + (l − 1) = j + l &lt; n, então j + l − 1 &lt; n. Novamente por hipótese, temos

      −( adf) j +1 gϕ l− 1 = f ◦ ( adf) j gϕ l− 1 = 0, e obtemos (adf) j gϕ l = 0.

      Portanto, a igualdade é verdadeira para todo l. Definimos a aplicação

      Φ =     

      ϕ 1 ...

      ϕ n     

      : O q ⊂ M →

      R n . As coordenadas de um ponto q ∈ O q ficam definidas como: x l = ϕ l (q), l = 1, . . . , n.

      Escrevemos agora o sistema com respeito a essas coordenadas: d dt x l = d dt

      ϕ l (q(t)) = D q (t) ϕ l ( ˙q(t)) = ˙q(t)(ϕ l (q(t))) = (f + ug)ϕ l = f ϕ l + ugϕ l , obtemos assim, d dt x l = f ϕ l + ugϕ l l = 1, . . . , n. (6.0-13) Para l &lt; n, a igualdade nos dá, gϕ l = ( adf) gϕ l = 0.

      Consequentemente a equação (6.0-13) acima fica: d dt x l = f ϕ l = ϕ l +1 = x l +1 , l = 1, . . . , n − 1. (6.0-14)

      Para l = n, a igualdade nos dá, gϕ n = ( adf) gϕ n = ±( adf) n− 11 = b 6= 0, e a equação (6.0-13) torna-se, d dt x n = f ϕ n + ugϕ n = f ϕ n ± ub. (6.0-15)

      As equações (6.0-14) e (6.0-15) dão a forma do sistema nas coordenadas x 1 , . . . , x n :               

      ˙x 1 = x 2 ...

      ˙x n− 1 = x n ˙x n = f ϕ n ± ub.

      (6.0-16) Finalmente, considerando a F-transformação: u 7−→ ∓ f ϕ n

      − bu b , obtemos,

      ˙x n = f ϕ n ± ∓ f ϕ n − bu b b = bu.

      Isto transforma no sistema               

      ˙x 1 = x 2 ...

      ˙x n− 1 = x n ˙x n = bu.

      (6.0-17)

      Podemos escrever o sistema linear acima na forma ˙x = Ax + bub com A =

                 0 1 0 · · ·

      0 0 1 · · · ... ... ... ... ... 0 0 0 · · ·

      1 0 0 0 · · ·            e b =

                 ...

      1            .

      Um cálculo direto mostra que A j b = e n−j , onde e i denota o i-ésimo elemento do base canônica de R n . Portanto, o sistema linear obtido é controlável.

      

    Exemplo 6.15 Considere o modelo de um braço mecânico acionado por um motor através de

    uma mola de torção.

      Figura 6.2: Braço mecânico As equações diferenciais para as posições angulares θ 1 e θ 2 do braço e do eixo, respectiva- mente, são dadas por:

        

      I ¨ θ 1 + mgL sin(θ 1 ) + k(θ 1 − θ 2 ) = 0

      J ¨ θ 2 − k(θ 1 − θ 2 ) = u, (6.0-18) onde I e J são momentos de inércia, k é uma constante molar, m é a massa, L é a distancia da junta até o centro de massa do braço, e u é o controle de torque inicial aplicado pelo motor.

      Sejam x 1 := θ 1 , x 2 := ˙θ 1 , x 3 := θ 2 e x 4 := ˙θ 2 . Desta forma, o sistema é considerado no espaço estado R 4 . Por simplicidade escrevemos a := mgL/I, b := k/I, c := k/J, e

      d := 1/J.

      O sistema fica da seguinte forma:  

      ˙x = x  1 2

          

      − x ˙x 2 = −a sin(x 1 ) − b(x 1 3 )

       ˙x = x

       3 4     

      ˙x = c(x − x ) + du, 4 1 3 e escrito na forma estendida      

      ˙x x 1 2            

      ˙x −a sin(x ) − b(x − x )  2   1 1 3   

           

    • = u.

            ˙x 3 x 4

                 

      ˙x c(x − x ) d 4 1 3 | {z } | {z } =f (x,u) =g(x,u)

      Fazendo os cálculos obtemos,      

      −bd             bd             [f, g](x, u) = , [f, [f, g]](x, u) = , [f, [f, [f, g]]](x, u) = .      

      −d cd

                  4 2 3 −cd

      Segue que D = span{g, (adf )g, (adf )

      g, (adf ) g} tem dimensão constante igual a 4, pois os 3 2 = span{g, (adf )g, (adf ) g} vetores obtidos são linearmente independentes. Finalmente, D é uma distribuição involutiva. Pelo Teorema é localmente state-feedback equivalente a um sistema linear controlável. 4

      :

      Exemplo 6.16 Considere o sistema não linear em R

            2 ˙x x − x 1 2 3

                  2

      ˙x x + 2x x 2x  2   3 1 3   3 

            = u. (6.0-19) +

            2  ˙x 3   x   1 1 

            2 ˙x x + x 4 1 3

      | {z } | {z } =f (x,u) =g(x,u) Fazendo os cálculos, obtemos 3 2 T T D = span{g, (adf)g, (adf) g}, 2 2 T onde g = (0, 2x 3 , 1, 0) , ( adf)g = (0, −1, 0, −2x 3 ) e ( adf) g = (1, 0, 0, −2x ) . Porém, 1         0 0 0 0 0 0                 0 0 2x 0 0 2 0 −1 3

                     

      [g, ( adf)g] = −         0 0

      1 0 0 0 0                 0 0 −2 0 0 0 0 0 −2x 3

                = .      

      −2 2 adf)g] é linearmente independente em relação ao conjunto {g, (adf)g, (adf) g} Como [g, ( 3 3 temos que, [g, ( adf)g] / ∈ D . Segue que D não é involutiva. Portanto pelo Teorema o sistema não é state-feedback equivalente a um sistema linear. 3

      :

      Exemplo 6.17 Considere o sistema não linear em R

       

      ˙x = y + yz   

      (6.0-20) ˙y = z

          ˙z = sin(x) + u. 3 Assumimos z 6= −1 e denotaremos por p = (x, y, z) ∈ R . Na forma estendida, temos

            ˙x y + yz

                 

      = u. + ˙y z

                 

      ˙z sin(x)

      1 | {z } | {z } =f (x,u) =g(x,u) Fazendo os cálculos obtemos,    

      −y 1 + z         [f, g] = , [f, [f, g]] = .

      −1         y cos(x) 2 Por cálculos simples podemos mostrar que {g, (adf)g, (adf) g} é um conjunto linearmente 2 2 independente. Logo, dim span{g, (adf)g, (adf) g} = 3. Finalmente, a distribuição D = span{g, (adf )g} é involutiva. De fato, 2 [g, [f, g]] = [[f, g], g] = 0 ∈ D .

      Pelo Teorema é localmente state-feedback equivalente a um sistema 2 linear controlável. Pelo Teorema de Fröbenius, D é uma distribuição integrável, e possui di- mensão constante igual a 2. Para linearizar este sistema, vamos aplicar o Lema para obter uma aplicação diferenciável 3 3−(2)

      ϕ : O p ⊂ → = 2 R R R, 2 tal que ϕ ∗p (D ) = 0. Note que a distribuição D = span{g, (adf )g} pode ser escrita como p 2 ∂ ∂ ∂ D = span , y + .

      ∂z ∂x ∂y 2 Desta forma, obter uma aplicação diferenciável ϕ tal que ϕ ∗p (D ) = 0 equivale a encontrar a p solução das equações diferenciais 

      ∂ϕ   = 0

      ∂z (6.0-21)

      ∂ϕ ∂ϕ  y = 0. 

    • ∂x ∂y y y
    • 2 2 Neste caso, a solução é dada por ϕ(x, y, z) = x − . Pondo ˜x = x − , definimos ˜y e ˜z 2 2 recursivamente como: y = ˜ ˙˜x = ˙x − y ˙y = y + yz − yz = y z = ˜ ˙˜y = ˙y = z.

        : Por fim, defina ˜u = u + sin(x). Com isso, obtemos o sistema linear controlável em O p

         

        ˙˜x = ˜y   

        ˙˜y = ˜z     ˙˜z = ˜u.

        De outra forma, ˙˜p = A(˜p) + b˜u, onde

            0 1 0         A = , b = .

        0 0 1         0 0 0

        1 Com uma simples verificação, obtemos 2 T T T 3 b} = , (0, 1, 0) , (1, 0, 0) } = , span{b, Ab, A span{(0, 0, 1) R satisfazendo a condição de Kalman.

        

      BIBLIOGRAFIA

        [1] A. A. Agrachev and Y. Sachkov. Control theory from the geometric viewpoint, vo- lume 87. Springer Science, 2013.

        [2] P. Brunovsk`y. A classification of linear controllable systems. Kybernetika (Institute of Information Theory and Automation AS CR) , 6(3):173–188, 1970.

        [3] J. A. N. Cossich. Controlabilidade de sistemas de controle lineares (Dissertação de Mes- trado) . Universidade Estadual de Maringá, 2014.

        [4] W. de Melo. Topologia das Variedades. Instituto de Matemática Pura e Aplicada, 2014.

        [5] E. Fernández-Cara and E. Zuazua. Control theory: History, mathematical achieve- ments and perspectives. Boletin SEMA (Sociedad Espanola de Matemática Aplicada), 26(12):79–140, 2003. [6] J. M. Lee. Introduction to Smooth Manifolds. Springer Science Graduate Texts in Mathematics 218, 2002.

        [7] E. L. Lima. Espaços métricos, volume 4. Instituto de Matemática Pura e Aplicada, 1983.

        [8] E. L. Lima. Variedades diferenciáveis. Publicações Matemáticas - Instituto de Mate- mática Pura e Aplicada, 2011.

        [9] F. Manfio. Variedades Diferenciáveis (Notas de Aula). ICMC – USP, 2011.

        [10] J. Neukirch. Algebraic number theory. Springer Science, 1999. [11] B. A. Rodrigues. Classificação topológica de sistemas de controle lineares (Dissertação de Mestrado) . Universidade Estadual de Maringá, 2014.

        [12] L. A. San Martin. Grupos de Lie. Editora da Unicamp, 2015. [13] J. Sotomayor. Lições de equações diferenciais ordinárias, volume 11. Instituto de Ma- temática Pura e Aplicada, CNPq, 1979.

        [14] F. W. Warner. Foundations of differentiable manifolds and Lie groups, volume 94. Sprin- ger Science &amp; Business Media, 2013.

Novo documento

Tags

Documento similar

UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS DEPARTAMENTO DE MATEMÁTICA PROGRAMA DE PÓS-GRADUAÇÃO EM MATEMÁTICA EM REDE NACIONAL
0
0
39
CENTRO DE CIÊNCIAS EXATAS E DE TECNOLOGIA PROGRAMA DE PÓS-GRADUAÇÃO EM MATEMÁTICA
0
0
67
UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS DEPARTAMENTO DE MATEMÁTICA PROGRAMA DE PÓS-GRADUAÇÃO EM MATEMÁTICA EM REDE NACIONAL
0
0
62
CENTRO DE CIÊNCIAS EXATAS E DE TECNOLOGIA PROGRAMA DE PÓS-GRADUAÇÃO EM MATEMÁTICA
0
0
91
UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS DEPARTAMENTO DE MATEMÁTICA PROGRAMA DE PÓS-GRADUAÇÃO EM MATEMÁTICA ELANE MARIA MOREIRA NOGUEIRA
0
0
36
UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE CIÊNCIAS EXATAS E DE TECNOLOGIA PROGRAMA DE PÓS-GRADUAÇÃO EM MATEMÁTICA
0
0
83
UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS DEPARTAMENTO DE MATEMÁTICA PROGRAMA DE PÓS-GRADUAÇÃO EM MATEMÁTICA EM REDE NACIONAL FRANCISCO JOSÉ SANTOS UCHÔA
0
1
48
UNIVERSIDADE FEDERAL DO CEARÁ CENTRO DE CIÊNCIAS DEPARTAMENTO DE MATEMÁTICA PROGRAMA DE PÓS-GRADUAÇÃO EM MATEMÁTICA EM REDE NACIONAL STEVE UCHÔA PASSOS
0
0
64
CENTRO DE CIÊNCIAS EXATAS E DE TECNOLOGIA PROGRAMA DE PÓS-GRADUAÇÃO EM MATEMÁTICA
0
0
110
CENTRO DE CIÊNCIAS EXATAS E DE TECNOLOGIA PROGRAMA DE PÓS-GRADUAÇÃO EM MATEMÁTICA
0
0
70
CENTRO DE CIÊNCIAS EXATAS E DE TECNOLOGIA PROGRAMA DE PÓS-GRADUAÇÃO EM MATEMÁTICA
0
0
39
UNIVERSIDADE FEDERAL DE SÃO CARLOS CENTRO DE CIÊNCIAS EXATAS E DE TECNOLOGIA DEPARTAMENTO DE MATEMÁTICA PROGRAMA DE PÓS GRADUAÇÃO EM MATEMÁTICA
0
0
124
UNIVERSIDADE FEDERAL DE SÃO CARLOS PROGRAMA DE PÓS-GRADUAÇÃO EM ENSINO DE CIÊNCIAS EXATAS DEPARTAMENTO DE MATEMÁTICA HENRIQUE OLIVEIRA
0
0
75
CENTRO DE CIÊNCIAS EXATAS E DE TECNOLOGIA PROGRAMA DE PÓS-GRADUAÇÃO EM MATEMÁTICA
0
0
103
UNIVERSIDADE ESTADUAL DE MARINGÁ CENTRO DE CIÊNCIAS DA SAÚDE DEPARTAMENTO DE ENFERMAGEM PROGRAMA DE PÓS-GRADUAÇÃO EM ENFERMAGEM
0
21
237
Show more