André Queirós Gonçalves Locomoção...

122
André Queirós Gonçalves Locomoção Bípede André Queirós Gonçalves Dezembro de 2011 UMinho | 2011 Locomoção Bípede Universidade do Minho Escola de Engenharia

Transcript of André Queirós Gonçalves Locomoção...

Page 1: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

André Queirós Gonçalves

Locomoção Bípede

Andr

é Qu

eirós

Gon

çalve

s

Dezembro de 2011UMin

ho |

201

1Lo

com

oção

Bíp

ede

Universidade do MinhoEscola de Engenharia

Page 2: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

Dezembro de 2011

Dissertação de MestradoCiclo de Estudos Integrados Conducentes ao Grau deMestre em Engenharia Electrónica Industrial e Computadores

Trabalho efectuado sob a orientação daProfessora Doutora Cristina Manuela Peixoto dos Santos

André Queirós Gonçalves

Locomoção Bípede

Universidade do MinhoEscola de Engenharia

Page 3: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

“O valor de todo o conhecimento está no seu vínculo com

as nossas necessidades, aspirações e acções; de outra forma,

o conhecimento torna-se um simples lastro de memória, capaz

apenas - como um navio que navega com demasiado peso - de

diminuir a oscilação da vida quotidiana.”

V. O. Kliutchevski

iii

Page 4: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver
Page 5: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

Agradecimentos

Gostaria de agradecer à minha orientadora Professora Cristina Santos, pela possibilidadeque me deu de integrar o grupo ASBG, pelo tempo disponibilizado, pelo incentivo e portodas as suas críticas e sugestões que se demonstraram fundamentais na realização destetrabalho.

Gostaria de agradecer também ao aluno de doutoramento Vítor Matos por toda a ajuda,pela sua supervisão continua e oportuna dando atenção aos detalhes e dando importantesconcelhos sobre a dissertação.

Gostaria de realçar o excelente ambiente do laboratório ASBG, o bom tempo que lápassei e gostaria de realçar o espírito de entre ajuda lá encontrado.

Gostaria de agradecer aos meus pais e aos meus irmão que sempre me ajudaram e in-centivaram nos estudos e me deram todas as condições para que eu pudesse concluir comsucesso o meu percurso académico.

Gostaria de agradecer também à minha namorada Margarida pelo seu amor, apoio, dedi-cação e paciência durante este tempo de escrita da tese.

Por fim, não queria deixar de agradecer a todos os meus amigos que contribuíram para omeu sucesso académico.

v

Page 6: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver
Page 7: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

Resumo

O estudo da locomoção em robôs bípedes tem sido uma área da robótica muito activa,resultado do grande progresso tecnológico dos últimos anos. Os robôs bípedes têm vanta-gens sobre os robôs com rodas, nomeadamente na navegação em terrenos irregulares e nacapacidade de ultrapassar obstáculos e buracos. Apesar disso, a locomoção de robôs bípedesainda está longe de atingir os movimentos graciosos e a destreza observada nos humanos. Ageração de uma locomoção robusta é ainda um problema difícil de resolver nomeadamentedevido ao grande número de graus de liberdade que compõem os robôs e principalmente àgrande instabilidade da locomoção com duas pernas.

Este projecto foca-se na locomoção de robôs bípedes. Este tipo de robôs levanta muitosproblemas, porque a sua estabilidade não é um problema trivial. Pretende-se desenvolver umcontrolador capaz de controlar este sistema, produzindo uma locomoção robusta e estável.O controlador proposto usa o centro de pressão para detectar a fase da dinâmica do robô. Ocentro de pressão é calculado através de sensores de força colocados nas solas dos pés dorobô. Estes sensores de força fornecem informação sobre a posição do centro de pressão dorobô em cada instante. Depois de detectada a fase da dinâmica do robô um oscilador aco-plado sincroniza padrões periódicos gerados pelo controlador com a dinâmica do robô. Ocontrolador apresenta características dos Geradores de Padrões Centrais (CPGs) em que cadajunta do robô é modelada por um oscilador específico sincronizado com os outros oscilado-res. Assim é possível sincronizar os movimentos das juntas do robô com a fase da dinâmicado robô. Para além disto foi feito um estudo da estabilidade da locomoção do robô. Para esteestudo foi calculada e avaliada a posição de diferentes medidas de estabilidade, entre elas oCentro de Massa (COM), o Centro de Pressão (COP), o Ponto de Momento Zero (ZMP) e oIndicador de Rotação do Pé (FRI). Por fim foi incluído o movimento dos braços e avaliada aestabilidade do robô perante este acréscimo.

As simulações foram realizadas no simulador Webots sendo o algoritmo de controlo dalocomoção desenvolvido em C/C++. O algoritmo de controlo foi capaz de gerar uma loco-moção estável tanto para o robô HOAP-2 como para o robô NAO. As medidas de estabilidadeforam calculadas com sucesso no robô HOAP-2, sendo assim possível fazer uma pequenaavaliação da sua estabilidade. O movimento dos braços foi incluído, mas são ainda necessá-rios alguns testes para se poder inferir sobre o melhoramento da estabilidade com a inclusãodos mesmos.

Palavras-chave: Robô Bípede; Estabilidade; Centro de Massa; Locomoção

vii

Page 8: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver
Page 9: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

Abstract

The study of locomotion in biped robots has been a very active area in robotics, as a resultof the great technological progress in recent years. Biped robots present some advantagesover wheeled robots, specially in uneven terrains navigation and the ability to overcomeobstacles and holes. Nevertheless, the robots biped locomotion is still far from achievinggraceful movements and the dexterity observed in humans. The generation of a robust loco-motion is still a difficult problem to solve in particular due to the large number of degrees offreedom that make up the robots and specially the big instability of walking with two legs.

This project focus on locomotion of biped robots. This type of robots presents manyproblems, because their stability is not a trivial problem. It is intended to develop a controllercapable of control this system, producing a robust and stable locomotion. The proposedcontroller uses the center of pressure to detect the phase of the robot dynamics. The centerof pressure is calculated using force sensors placed on the soles of the robot feet. These forcesensors provide information about the position of the robot center of pressure at each instant.After the detection of the phase of the robot dynamic, a coupled oscillator synchronizesperiodic patterns generated by the controller with the robot dynamics. The controller hasCentral Pattern Generators (CPGs) features in which each joint of the robot is modeled by aspecific oscillator synchronized with the other oscillators. So it is possible to synchronize themovements of the robot joints with the phase of the robot dynamics. In addition, it was donea study of the stability of the robot locomotion. To this study was calculated and evaluatedthe position of different stability measures, including the Center of Mass (COM), the Centerof Pressure (COP), the Zero Moment Point (ZMP) and the Foot Rotation Indicator (FRI).Finally, it was included the movement of the arms and evaluated the stability of the robot inrelation to this addition.

The simulations were performed in the Webots simulator, and the locomotion controlalgorithm was developed in C/C++. The control algorithm was able to generate a stablelocomotion for HOAP-2 robot and for the NAO robot. The stability measures were suc-cessfully calculated in the HOAP-2 robot, and its stability was evaluated accordingly. Themovement of the arms was included, but there is still a need to perform some tests in orderto infer about the improvement of stability with their inclusion.

Keywords: Biped Robot; Stability; Center of Mass; Locomotion

ix

Page 10: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver
Page 11: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

Conteúdo

1 Introdução 11.1 Motivação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.2 Objectivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21.3 Estrutura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2 Métodos de Controlo para Robôs Bípedes 52.1 Métodos Tradicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

2.1.1 Ponto de Momento Zero (ZMP) . . . . . . . . . . . . . . . . . . . 62.1.2 Controlo por Modelo Virtual (VMC) . . . . . . . . . . . . . . . . . 62.1.3 Exemplos de Projectos que usam Métodos Tradicionais . . . . . . . 7

2.2 Métodos Biologicamente Inspirados . . . . . . . . . . . . . . . . . . . . . 132.2.1 Exploração da Dinâmica Intrínseca . . . . . . . . . . . . . . . . . 132.2.2 Exploração da Elasticidade . . . . . . . . . . . . . . . . . . . . . . 162.2.3 Controlo baseado em Redes Neuronais, Reflexos e Osciladores . . . 18

3 Osciladores de Fase 233.1 Osciladores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233.2 Oscilador Acoplado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 243.3 Dinâmica do Sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253.4 Pontos Fixos e Sua Estabilidade . . . . . . . . . . . . . . . . . . . . . . . 253.5 Parametrização do Sistema . . . . . . . . . . . . . . . . . . . . . . . . . . 283.6 Efeitos do Acoplamento . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

4 Geração da Locomoção 334.1 Aplicação do Modelo do Oscilador Acoplado . . . . . . . . . . . . . . . . 334.2 Cálculo da Fase do Robô . . . . . . . . . . . . . . . . . . . . . . . . . . . 344.3 Sincronização de Fase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 364.4 Geração dos Movimento Bípedes . . . . . . . . . . . . . . . . . . . . . . . 39

4.4.1 Movimento de Balanço . . . . . . . . . . . . . . . . . . . . . . . . 394.4.2 Movimento de Stepping . . . . . . . . . . . . . . . . . . . . . . . 41

xi

Page 12: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

4.4.3 Movimento de Locomoção Bípede . . . . . . . . . . . . . . . . . . 43

5 Simulação da Locomoção 475.1 Implementação no Simulador Webots . . . . . . . . . . . . . . . . . . . . 47

5.1.1 Webots . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 475.1.2 Sensores de Pressão . . . . . . . . . . . . . . . . . . . . . . . . . 485.1.3 Detecção do Centro de Pressão (COP) . . . . . . . . . . . . . . . . 485.1.4 Postura Inicial e de Descanso . . . . . . . . . . . . . . . . . . . . 50

5.2 Parâmetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 505.3 Simulação do HOAP-2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

5.3.1 Movimento de Balanço . . . . . . . . . . . . . . . . . . . . . . . . 515.3.2 Movimento de Locomoção Bípede . . . . . . . . . . . . . . . . . . 52

5.4 Simulação do NAO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 545.4.1 Movimento de Balanço . . . . . . . . . . . . . . . . . . . . . . . . 555.4.2 Movimento de Locomoção Bípede . . . . . . . . . . . . . . . . . . 56

6 Estabilidade 596.1 Área de Suporte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 596.2 Medidas de Estabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

6.2.1 Centro de Massa (COM) . . . . . . . . . . . . . . . . . . . . . . . 616.2.2 Centro de Pressão (COP) . . . . . . . . . . . . . . . . . . . . . . . 626.2.3 Ponto de Momento Zero (ZMP) . . . . . . . . . . . . . . . . . . . 636.2.4 Indicador de Rotação do Pé (FRI) . . . . . . . . . . . . . . . . . . 65

6.3 Quantificação da Estabilidade . . . . . . . . . . . . . . . . . . . . . . . . . 68

7 Avaliação da Locomoção 697.1 Movimento de Locomoção Bípede . . . . . . . . . . . . . . . . . . . . . . 697.2 Movimento dos Braços . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

8 Conclusão 778.1 Discussão dos Resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . 788.2 Trabalho Futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

Bibliografia 79

Apêndices

A HOAP-2 89

B NAO 99

xii

Page 13: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

Lista de Figuras

2.1 Robô Spring Turkey de [1]. . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.2 Robô H7 de [2]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.3 Robô HRP-2 de [3]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

2.4 Robô Wabian-2R de [4]. . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.5 Robô Asimo de [5]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.6 Robô KHR-3 de [6]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.7 Robô Spring Flamingo de [7]. . . . . . . . . . . . . . . . . . . . . . . . . 14

2.8 Robô Lucy de [8]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

2.9 Robô HOAP-3 de [9]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

2.10 Robô QRIO de [10]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3.1 Modelo, adaptado de [11], do oscilador acoplado onde φR e φC represen-tam as posições dos amigos na pista, e ωR e ωC são proporcionais às suasvelocidades de corrida. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

3.2 Comportamento sinusoidal da dinâmica do sistema para valores de ωC = 4,ωR = 2, KC = 1 e KR = 2 e para um intervalo de valores de −π a π. Nestecaso (ωC−ωR) = 4−2 = 2 é o ponto médio da onda observada e (KC +KR) =

1 + 2 = 3 é a amplitude da mesma. . . . . . . . . . . . . . . . . . . . . . . 26

3.3 Pontos fixos de acordo com a varição dos parâmetros (KC + KR) e (ωC − ωR). 27

3.4 Sistema desacoplado onde (KC + KR) 0 (ωC − ωR). . . . . . . . . . . . . . 29

3.5 Sistema acoplado onde (KC + KR) > (ωC − ωR). . . . . . . . . . . . . . . . 29

3.6 Convergência do sistema até à frequência de compromisso ω∗ de 2,5 rad/s. . 30

3.7 Variação de φC, φR e Ψ de acordo com a variação da constante de acopla-mento KC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

3.8 Variação do sin(φC) e sin(φR) de acordo com a variação da constante de aco-plamento KC. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

xiii

Page 14: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

4.1 Aproximação entre os comportamentos do pêndulo invertido e do robô. Naposição (A) o robô encontra-se com o pé esquerdo levantado e o COP temvalor -1. Na posição (B) o robô encontra-se com ambos os pés pousados nosolo fazendo com que o COP tenha valor 0. Na posição (C) o robô encontra-se com o pé direito levantado e o COP tem valor 1. . . . . . . . . . . . . . 34

4.2 Gráfico da fase do robô, onde x varia entre -1 e 1 e x tem uma variaçãodependente da velocidade máxima de oscilação do robô. Quando a posiçãodo COP (x) é -1 (A) a velocidade do COP (x) é nula, uma vez que a variaçãodo COP inverte o seu sentido. Em (B) a velocidade do COP (x) é maxima eé positiva ou negativa de acordo com o sentido em que essa variação ocorre,se de (A) para (C) ou se de (C) para (A). Em (C) a velocidade do COP (x)também é zero já que a variação do COP inverte o seu movimento. . . . . . 35

4.3 Controladores de fase da perna direita e da perna esquerda numa perspectivafrontal ao robô. Para a perna direita é usado o controlador de fase 1 (φ1

C) e 2(φ2

C). Para a perna esquerda é usado o controlador de fase 3 (φ3C) e 4 (φ4

C). . 37

4.4 Comparação entre o COP (x), a sua velocidade de variação ( dxdt = x) e a fase

do robô (φR). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

4.5 Controladores de fase (φ1C, φ2

C, φ3C e φ4

C). O robô começa na posição (A) como COP igual a -1, passa por uma fase intermédia em que o COP passa porzero, na posição (B) e depois passa para a posição (C) em que o COP é iguala 1. Quando a posição do COP (x) pára na borda externa do pé, a fase dorobô detectada faz a fase do controlador abrandar. . . . . . . . . . . . . . . 38

4.6 Perspectiva frontal e juntas envolvidas no movimento de balanço (θhipR e θankleR). 40

4.7 Valores das juntas gerados no movimento de balanço (θhipR e θankleR). θhipR

encontra-se desfasado π2 de θankleR . Como existe acoplamento a frequência

dos movimentos das juntas é a mesma que a frequência do COP (x). . . . . 40

4.8 Valores das juntas gerados no movimento de balanço (θhipR e θankleR) parao sistema desacoplado. θhipR encontra-se desfasado π

2 de θankleR . Como nãoexiste acoplamento a frequência dos movimentos das juntas é diferente dafrequência do COP (x). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

4.9 Juntas envolvidas no movimento de stepping (θhipR , θankleR , θhipP , θkneeP e θankleP). 42

4.10 Valores das juntas gerados no movimento de stepping da perna direita (θhipR ,θankleR , θhipP , θkneeP e θankleP). θhipP , θkneeP e θankleP encontram-se em fase. Comoexiste acoplamento a frequência dos movimentos das juntas é a mesma quea frequência do COP (x). . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

xiv

Page 15: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

4.11 Valores das juntas gerados no movimento de stepping da perna direita (θhipR ,θankleR , θhipP , θkneeP e θankleP) para o sistema desacoplado. θhipP , θkneeP e θankleP

encontram-se em fase. Como não existe acoplamento a frequência dos mo-vimentos das juntas é diferente da frequência do COP (x). . . . . . . . . . . 44

4.12 Valores das juntas gerados no movimento de locomoção bípede da perna di-reita (θhipR , θankleR , θhipP ,θkneeP e θankleP). Como existe acoplamento a frequên-cia dos movimentos das juntas é a mesma que a frequência do COP (x). . . 45

4.13 Valores das juntas gerados no movimento de locomoção bípede da pernadireita (θhipR , θankleR , θhipP ,θkneeP e θankleP) para o sistema desacoplado. Comonão existe acoplamento a frequência dos movimentos das juntas é diferenteda frequência do COP (x). . . . . . . . . . . . . . . . . . . . . . . . . . . 46

5.1 Esquemático da sola dos pés do HOAP-2 com os quatro sensores de forçaem cada pé. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

5.2 Peso do robô HOAP-2 no pé direito durante a locomoção, onde se podeconfirmar o peso de 7,2 kg do HOAP-2. . . . . . . . . . . . . . . . . . . . 49

5.3 Movimento de balanço do robô HOAP-2. . . . . . . . . . . . . . . . . . . 51

5.4 Resultados obtidos de x, x e φR no movimento de balanço do HOAP-2. Ocomportamento observado é o esperado já que o robô ao balançar transfereo seu COP de uma perna para a outra, mas sem nunca levantar uma delas.A fase do robô varia dentro dos parâmetros esperados embora seja muitoinconstante. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

5.5 Resultados obtidos das juntas θhipR e θankleR no movimento de balanço doHOAP-2. Como existe acoplamento a frequência dos movimentos das juntasé a mesma que a frequência do COP, este ajuste de frequência das ondas dasjuntas de modo a que se encontrem sincronizadas com o COP pode provocarpequenas deformações nas mesmas. . . . . . . . . . . . . . . . . . . . . . 52

5.6 Movimento de locomoção bípede do robô HOAP-2. . . . . . . . . . . . . . 53

5.7 Resultados obtidos de x, x e φR no movimento de locomoção bípede doHOAP-2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

5.8 Resultados obtidos de φR e φ1C, φ2

C, φ3C e φ4

C no movimento de locomoçãobípede do HOAP-2. Os controladores de fase têm uma ondulação com amesma frequência da fase do robô e têm um desfasamento de π

2 entre si. . . 54

5.9 Resultados obtidos das juntas θhipR , θankleR , θhipP , θkneeP e θankleP no movimentode locomoção bípede do HOAP-2. . . . . . . . . . . . . . . . . . . . . . . 54

5.10 Movimento de balanço do robô NAO. . . . . . . . . . . . . . . . . . . . . 55

xv

Page 16: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

5.11 Resultados obtidos de x, x e φR no movimento de balanço do NAO. O com-portamento observado é o esperado já que o robô ao balançar transfere o seuCOP de uma perna para a outra, mas sem nunca levantar uma delas. A fasedo robô varia dentro dos parâmetros esperados embora seja muito inconstante. 55

5.12 Resultados obtidos das juntas θhipR e θankleR no movimento de balanço doNAO. Como existe acoplamento a frequência dos movimentos das juntas éa mesma que a frequência do COP, este ajuste de frequência das ondas dasjuntas de modo a que se encontrem sincronizadas com o COP pode provocarpequenas deformações nas mesmas. . . . . . . . . . . . . . . . . . . . . . 56

5.13 Movimento de balanço do robô NAO. . . . . . . . . . . . . . . . . . . . . 56

5.14 Resultados obtidos de x, x e φR no movimento de locomoção bípede do NAO. 57

5.15 Resultados obtidos de φR e φ1C, φ2

C, φ3C e φ4

C no movimento de locomoçãobípede do NAO. Os controladores de fase têm uma ondulação com a mesmafrequência da fase do robô e têm um desfasamento de π

2 entre si. . . . . . . 58

5.16 Resultados obtidos das juntas θhipR , θankleR , θhipP , θkneeP e θankleP no movimentode locomoção bípede do NAO. . . . . . . . . . . . . . . . . . . . . . . . . 58

6.1 Representação da Foot Support Area onde mais à esquerda da figura ambosos pés estão totalmente apoiados, no centro o pé direito apenas tem a pontada frente apoiada e à direita o pé esquerdo é o único em contacto com o solo. 60

6.2 Esquemático do robô HOAP-2 com os eixos de coordenadas na posição ini-cial de partido do robô. À medida que o robô se vai movendo vai-se afas-tando gradualmente do centro do referencial. . . . . . . . . . . . . . . . . . 60

6.3 Esquemático da sola dos pés do HOAP-2 com os quatro sensores de forçaem cada pé. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

6.4 Diferenças entre o ZMP e o COP de [12]. À esquerda o ZMP coincide como COP. Ao centro existe apenas um ZMP fictício (FZMP) provocado por ummovimento dinâmico instável, do qual a distância do FZMP à ponta do péé proporcional à magnitude da perturbação. Na figura mais à direita o ZMPcoincide com o COP. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

6.5 Diferença entre o FRI, o PCOM e o COP de [13]. À esquerda o pé encontra-se num equilíbrio estático e o PCOM (C) encontra-se fora da área de suporte,mas o COP (P) e o FRI (F) encontram-se dentro desta. Já no caso do ladodireito, o pé começa a rodar uma vez que o FRI (F) se encontra fora da áreade suporte, embora o PCOM (C) se encontre dentro desta e o COP (P) naponta sobre a qual o pé roda. . . . . . . . . . . . . . . . . . . . . . . . . . 66

6.6 Medidas de estabilidade simuladas no robô HOAP-2. . . . . . . . . . . . . 67

xvi

Page 17: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

7.1 Força exercida nos sensores de pressão em Newtons. Em cima o pé esquerdoe em baixo o pé direito. Durante o seu ciclo de suporte o pé começa por fazerpressão no sensor que se encontra mais atrás e no lado interior do pé (A).É notado de seguida um grande pico no sensor frontal do lado exterior dopé. Após isso o robô mantém-se sobre ambos os sensores da frente (B). Deseguida sobre os sensores de trás (C) e quando se prepara para levantar o péa última parte a deixar o solo é a da frente com predominância nos seus doissensores (D). Observa-se assim que o robô começa por pousar o calcanharquando coloca o pé no solo e quando o levanta do solo é também o calcanharo primeiro a começar a levantar. . . . . . . . . . . . . . . . . . . . . . . . 70

7.2 FRI, ZMP, COP, PCOM e COM em relação ao centro do mundo. Existe umaenorme semelhança (quase sobreposição) entre o FRI e o ZMP. O COP seguea mesma tendência dos anteriores, mas devido ao facto de que para o cálculodo COP apenas são usados quatro sensores em cada pé, este mantém-se numaposição mais interior do polígono de suporte. O FRI normalmente tendea passar pelas bordas exteriores do pé o que é provocado pelas oscilaçõesque ocorrem durante a locomoção. O COM apresenta um comportamentooscilatório nos três planos de projecção, com predominância para o plano x,y devido às transições entre o pé de suporte do robô. O FRI, o ZMP, o COPe o PCOM encontram-se sempre dentro do polígono de suporte. . . . . . . 71

7.3 FRI, ZMP, COP, PCOM e COM ao longo do tempo. As medidas de estabi-lidade apresentam uma tendência oscilatória em que a posição ao longo dotempo em y tem metade da frequência da posição ao longo do tempo em x.Salientam-se as semelhanças entre o FRI e o ZMP e a tendência do COP emacompanhar os dois. A variação brusca do FRI, do ZMP e do COP, em y, deum valor negativo para um positivo, e vice-versa, é mais uma indicação darápida transição entre o pé de suporte do robô. O pico nas medidas de esta-bilidade logo após esta transição indica a maior instabilidade do robô nessemomento. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

7.4 Percentagem de tempo em que o FRI se encontra encostado a qualquer umdos limites externos do pé, ao fim de cada ciclo de suporte, considerandouma margem de erro de 8 mm. Durante a locomoção do robô entre 55%a 74% do tempo de suporte o FRI encontra-se encostado a um dos limitesexternos do pé de suporte. . . . . . . . . . . . . . . . . . . . . . . . . . . 73

xvii

Page 18: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

7.5 Distância do ZMP e do COP ao centro do polígono de suporte. A distânciado ZMP ao centro do polígono de suporte apresenta um máximo de 6 cm,enquanto a distância do COP ao polígono de suporte apresenta um máximode 2,6 cm. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

7.6 Resultados obtidos das juntas θshoulderP e θelbowP no movimento dos braços dorobô Hoap2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

7.7 Percentagem de tempo em que o FRI se encontra encostado a qualquer umdos limites externos do pé, ao fim de cada ciclo de suporte, considerandouma margem de erro de 8 mm e incluindo o movimento dos braços do robô.Durante a locomoção do robô entre 63% a 79% do tempo de suporte o FRIencontra-se encostado a um dos limites externos do pé de suporte. . . . . . 75

7.8 Distância do ZMP e do COP ao centro do polígono de suporte, com a in-clusão do movimento dos braços do robô. A distância do ZMP ao centro dopolígono de suporte têm no máximo 4,7 cm, enquanto a distância do COP aopolígono de suporte tem no máximo 2,6 cm. . . . . . . . . . . . . . . . . . 76

xviii

Page 19: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

Lista de Tabelas

5.1 Ângulos de offset para cada junta do robô. . . . . . . . . . . . . . . . . . . 505.2 Parâmetros de simulação dos robôs. . . . . . . . . . . . . . . . . . . . . . 51

xix

Page 20: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver
Page 21: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

Lista de Acrónimos

COM Center of Mass (Centro de Massa), 3, 9, 34, 59,61, 63, 64, 66, 67, 70, 71

COP Center of Pressure (Centro de Pressão), 3, 5, 6,21, 34–41, 43–45, 47–49, 51–53, 55–57, 59, 61,62, 64–66, 68, 70, 71, 73, 75, 76

CPG Central Pattern Generators (Geradores de Pa-drões Centrais), 1, 2, 18, 20, 21

FRI Foot Rotation Indicator (Indicador de Rotação doPé), vii, ix, 3, 6, 59, 65–68, 70–73, 75

FZMP Fictitious Zero Moment Point (Ponto de Mo-mento Zero Fictício), 64, 65, 67

PCOM Projection of Center of Mass (Projecção do Cen-tro de Massa), 61, 62, 65–67, 70, 71

VMC Virtual Model Control (Controlo por Modelo Vir-tual), 5, 6, 14, 17

ZMP Zero Moment Point (Ponto de Momento Zero), 3,5–12, 16, 18, 19, 59, 62–65, 67, 68, 70, 71, 73,75, 76

xxi

Page 22: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver
Page 23: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

Capítulo 1

Introdução

Esta tese apresenta o trabalho desenvolvido durante um ano sobre a locomoção bípede noASBG (Adaptive System Behaviour Group) do Departamento de Electrónica Industrial daUniversidade do Minho. Foi proposto no âmbito do 5o ano do Mestrado Integrado em En-genharia Electrónica Industrial e Computadores. O objectivo principal deste trabalho foi odesenvolvimento de um controlador robusto de locomoção bípede baseado numa locomoçãobio-inspirada usando sistemas dinâmicos como ferramenta. Assim, neste trabalho é propostauma arquitectura de controlador bio-inspirada para a locomoção bípede baseada no conceitode Geradores de Padrões Centrais (CPGs, do inglês Central Pattern Generators) que sãoredes neuronais centrais que produzem padrões rítmicos que actuam no sistema de controlomotor das pessoas. Assim, este trabalho apresenta uma tentativa de aproximação da locomo-ção dos robôs à locomoção humana usando conceitos biológicos e sistemas dinâmicos.

1.1 Motivação

Durante muitos séculos, o homem sempre sonhou em criar um servente artificial como as-sistente na sua vida diária ou um trabalhador para os trabalhos mais pesados. Antes do apa-recimento da robótica industrial, estas máquinas construídas de matérias inanimadas sempreforam imaginadas com semelhanças ao homem, trabalhando em ambientes humanos. Foiassim que o desenvolvimento de robôs semelhantes aos humanos despertou o interesse dacomunidade científica, nomeadamente a sua forma de locomoção que deve ser o mais pa-recida possível com a humana. Assim, muitos grupos de investigação têm vindo a estudarabordagens para o controlo da locomoção em robôs bípedes. A motivação deste interessepelos robôs bípedes é principalmente devido ao seu aspecto muito parecido com os humanose a sua capacidade de, como são robôs de pernas, se poderem mover em terrenos bastanteirregulares. Devido ao facto dos robôs com pernas poderem seleccionar os pontos no soloque pisam, torna-se mais fácil com este tipo de máquinas evitar obstáculos, buracos, degraus,

1

Page 24: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

2 CAPÍTULO 1. INTRODUÇÃO

valas, entre outros. As articulações dos seus membros também fornecem aos robôs de pernasuma locomoção mais ágil, estável e suave em terrenos irregulares assim como uma rápidaadaptação a irregularidades, em comparação com outros tipos de robôs.

Apesar de quatro décadas de investigação, o problema da locomoção bípede mecânicaainda está longe de estar resolvido. A sua locomoção ainda está longe de atingir os movi-mentos graciosos e a destreza observada nos humanos. Comparando com os movimentos delocomoção elegantes e eficientes dos humanos, mesmo os robôs bípedes mais sofisticadosparecem lentos e desajeitados. O controlador de um robô com pernas deve ter a capacidadede lidar com constantes mudanças na dinâmica do corpo durante a locomoção, e dinâmicaimprevisível durante o contacto dos pés com o solo. Este controlador também deve ter a ca-pacidade de adaptar os movimentos das pernas de modo a suportar o peso do próprio corpo,mantendo o equilíbrio para não se deixar cair. Um caminho possível de melhoramento dodesempenho das máquinas de duas pernas pode passar pela transferência de ideias da bi-ologia, não apenas quanto à configuração mecânica, mas também quanto aos conceitos decontrolo. Considerando a capacidade humana de locomoção com duas pernas, é normal queos investigadores tentem transferir estes conceitos de controlo para os robôs bípedes. Istoporque os humanos têm capacidades inatas de adaptar os movimentos de locomoção a al-terações no ambiente, possuem bastantes reflexos correctivos e são bons exploradores emterrenos acidentados.

1.2 Objectivos

O objectivo principal desta tese de mestrado passa pelo estudo do controlo da locomoçãobípede para um robô humanoide. Isto implica projectar um controlador para que o robôpossa andar. O controlador tem de ser robusto contra perturbações, isto é, não deve cair seo solo não for plano, ou se alguém o puxar ligeiramente. A abordagem para desenhar estescontroladores será baseada em controladores CPG.

De forma a se conseguir este trabalho é necessário alcançar uma série de objectivos quepassam por:

1) Fazer uma revisão da literatura sobre a locomoção bípede, começando pelo levanta-mento do estado da arte versando os controladores passivos e os controladores activos de-senvolvidos. Mostrar laboratórios de investigação e até robôs bípedes desenvolvidos, assimcomo os métodos de controlo usados na sua locomoção.

2) Ler, modelar e implementar o oscilador de Morimoto [14].

3) Fazer uma descrição do modelo de locomoção usado. Nomeadamente determinar arelação de fase entre os ângulos das juntas de locomoção e as relações necessárias de simetriae anti-fase entre as juntas do robô. Compreender a dinâmica do robô e implementar o modelo

Page 25: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

1.3. ESTRUTURA 3

matemático de controlo dos seus movimentos.4) Apresentar medidas de estabilidade, que permitam quantificar a estabilidade do robô

e implementá-las.5) Sincronização dos braços. Definir quais são as juntas dos braços a sincronizar. De-

terminar a diferença de fase entre os dois braços e a frequência, nominal ou múltipla do seumovimento. Medir os melhoramentos da sua inclusão na locomoção em termos de estabili-dade da dinâmica do robô.

6) Usar o modelo do HOAP-2 e do NAO do Webots. Integrar no modelo simulado dosrobôs sensores adicionais se necessário, nomeadamente sensores de força nas solas dos pésdos robôs. Verificar a necessidade de adicionar um plugin de física para aquisição de dados,nomeadamente para o cálculo do Centro de Massa (COM, do inglês Center of Mass), Centrode Pressão (COP, do inglês Center of Pressure), Ponto de Momento Zero (ZMP, do inglêsZero Moment Point) e o Indicador de Rotação do Pé (FRI, do inglês Foot Rotation Indicator)dos robôs. Modelar características especiais do ambiente, por exemplo factores de desliza-mento, factores de inclinação, entre outros. Projectar experiências, descrever o cenário eidentificar os seus propósitos. Incluir a possibilidade de adicionar novos sensores e escolhera sua localização, incluindo sensores de toque.

7) Avaliação do projecto final em Webots e análise de dados. O objectivo é a análisede robustez. Delinear experiências e cenários de validação dos modelos propostos. Sugeriralterações à arquitectura de controlo com base nas experiências.

1.3 Estrutura

Esta tese está estruturada da seguinte forma: No capítulo 2 é apresentada uma visão globaldos métodos de controlo da locomoção bípede existentes e respectivos robôs. No capítulo3 é descrito o oscilador de fase usado no controlo da locomoção bípede, são calculados ospontos fixos do sistema e a sua estabilidade. No capítulo 4 é feito um estudo do compor-tamento oscilatório do sistema através da implementação do oscilador acoplado em Matlab.No capítulo 5 são apresentadas as simulações do modelo do oscilador acoplado nos doisrobôs bípedes HOAP-2 e NAO. No capítulo 6 é introduzido o conceito de estabilidade e sãoapresentadas as medidas de estabilidade usadas para avaliar a estabilidade da locomoção dorobô. No capítulo 7 é avaliada a estabilidade da locomoção do robô HOAP-2 sem a inclusãodo movimento dos braços e com a inclusão do movimento dos braços. Por fim no capítulo 8são apresentadas algumas conclusões dos resultados obtidos e são sugeridos alguns aspectosa considerar num trabalho futuro.

Page 26: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver
Page 27: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

Capítulo 2

Métodos de Controlo para Robôs Bípedes

Olhando para os métodos de controlo para robôs de duas pernas existem duas abordagensfundamentais, uma abordagem que usa métodos tradicionais e uma abordagem que usa mé-todos biologicamente inspirados. O uso de métodos tradicionais é entendido como a classede métodos maioritariamente baseados em ideias de robótica industrial e engenharia mecâ-nica. Baseiam-se em conceitos matemáticos como dinâmica multi-corpo e teorias de con-trolo linear e não linear. A abordagem bio-inspirada tenta transferir resultados da análisedo movimento humano, biomecânica, ou investigação neurocientífica para sistemas técni-cos. Aprova o uso de recursos matemáticos e de engenharia, mas foca-se mais em novosmateriais e sistemas de actuação mecânica inteligente e sobretudo em adoptar conceitos decontrolo encontrados na natureza.

2.1 Métodos Tradicionais

A natureza não foi a primeira escolha quando os engenheiros de robôs bípedes procuraraminspiração no controla da locomoção em máquinas de duas pernas. Em vez disso estabe-leceram métodos que recorrem unicamente à engenharia electrónica e mecânica e a teoriasde controlo clássicas. Estes métodos serviram de base para o desenvolvimento dos sistemasde controlo actuais. Assim, esta secção está dividida em três partes. Nas duas primeirassão apresentados os principais conceitos associados aos métodos tradicionais de controlo derobôs bípedes, o ZMP e o Controlo por Modelo Virtual (VMC, do inglês Virtual Model Con-

trol), sendo que a maior parte dos sistemas de controlo são baseados na abordagem do ZMP.Na última parte são apresentados exemplos de instituições de investigação em todo o mundoque têm vindo a desenvolver robôs bípedes usando estes métodos.

5

Page 28: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

6 CAPÍTULO 2. MÉTODOS DE CONTROLO PARA ROBÔS BÍPEDES

2.1.1 Ponto de Momento Zero (ZMP)

A maior parte dos sistemas de controlo para a locomoção de robôs bípedes baseiam-se naabordagem do ZMP de [12] e numa derivada desta que usa o COP [15].

O ZMP é um critério da estabilidade dinâmica da locomoção bípede, amplamente usado.Este foi originalmente definido por Vukobratovic [16] em 1972. Vukobratovic (2004) [12]afirmou: “O ZMP é definido como o ponto no solo no qual o momento gerado pelos movi-mentos do robô é zero, isto é, onde a força de inércia é zero.”

O COP é definido como o ponto no solo onde a resultante das forças de reacção do soloactua.

No capitulo 6.2 estes conceitos são definidos com maior pormenor e são comparadasentre si.

O ZMP pode ser usados para a tarefa de sintetizar a locomoção offline ou como umindicador chave para um controlo da locomoção online. O seu valor pode ser aproximado porsensores de força na sola do pé do robô. Uma extensão do ZMP e COP pode ser encontradono FRI [13]. É idêntico ao COP quando localizado dentro da área de suporte, mas fora dáinformação sobre o grau e direcção da instabilidade postural do robô. A maior parte dosbípedes usam o ZMP como parte do seu sistema de controlo.

2.1.2 Controlo por Modelo Virtual (VMC)

Outra metodologia para o controlo dos robôs bípedes é o VMC desenvolvido por Jerry Pratt[17, 18]. O objectivo desta abordagem é manter os algoritmos de controlo fáceis de entendere intuitivos.

A ideia do VMC é aplicar forças no robô usando componentes virtuais anexados dentrodeste ou entre este e o ambiente externo. Os torques e forças que actuam nas juntas criam omesmo efeito que a força do componente virtual iria criar. Estes componentes, que têm decriar uma força baseada no seu estado, podem incluir molas, amortecedores, massas, campospotenciais, entre outros. A localização dos componentes diz respeito ao designer e requerintuição física. Não é necessário um modelo dinâmico completo do robô.

Entre os robôs controlados por VMC inclui-se um hexapode simulado [19]. O robôcom 18 graus de liberdade pode andar em qualquer direcção, virar, e equilibrar um pênduloinvertido nas suas costas. Inclui-se também o robô bípede Spring Turkey, da figura 2.1, quepode andar ao longo do plano sagital [1].

Cada perna tem um grau de liberdade activo no seu joelho e anca, mas não no tornozelo.O robô é suportado e equilibrado por um andarilho virtual composto por duas molas e umamortecedor. O controlo da velocidade durante a fase de suporte duplo é realizada por umamortecedor virtual ligado a uma trajectória pré-definida. Uma máquina de estados selecci-

Page 29: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

2.1. MÉTODOS TRADICIONAIS 7

Figura 2.1: Robô Spring Turkey de [1].

ona os componentes durante as diferentes fases da locomoção. O Spring Turkey anda de umaforma não muito robusta a uma velocidade de até 0,5 m/s. O robô Spring Flamingo [7] étambém parcialmente controlado pelo VMC, no capitulo 2.2.1 é falado com mais pormenordeste robô.

2.1.3 Exemplos de Projectos que usam Métodos Tradicionais

Já há quatro décadas que institutos de investigação em todo o mundo têm vindo a desenvolverrobôs bípedes. Apesar da sua aparência antropomórfica, a maior parte dos esforços segueuma abordagem mais industrial no seu design e controlo das suas máquinas e aplicam oreferido cálculo do ZMP para a geração de trajectórias das juntas. Este tipo de robôs sãomostrados a seguir, com dois deles descritos mais detalhadamente.

Robô H7 pelo Laboratório JSK

O laboratório Jouhou System Kougaku (JSK) da Universidade de Tóquio tem uma longa tra-dição na construção de robôs bípedes, entre eles o H5, H6 e H7. O objectivo do seu trabalhoé desenvolver uma plataforma de investigação experimental para a locomoção, comporta-mento autónomo e interacção humana. O modelo do seu último robô H7, da figura 2.2,focou-se no uso adicional de graus de liberdade (resultando em 30), extra torque nas jun-tas, alto poder de processamento, suporte em tempo real, autonomia energética, geração detrajectórias dinâmicas de locomoção, movimentos de todo o corpo, e um apoio de visão a 3dimensões.

Tendo 1,5 m de altura e pesando 57 Kg, o robô tem 7 de graus de liberdade em cadaperna incluindo uma junta activa nos dedos dos pés. Um computador de processamento em

Page 30: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

8 CAPÍTULO 2. MÉTODOS DE CONTROLO PARA ROBÔS BÍPEDES

Figura 2.2: Robô H7 de [2].

tempo real, quatro baterias de ácido chumbo, rede wireless, duas câmaras de alta resolução,sensores de força e uma unidade de medição de inércia completam o equipamento do robô[20, 21, 2].

O sistema de controlo de locomoção online do H7 permite gerar trajectórias de locomo-ção que satisfazem uma dada translação e rotação do robô, assim como uma postura arbitráriada parte superior do corpo. É composto por várias camadas hierárquicas em que cada ca-mada representa um ciclo de controlo diferente e passa os seus resultados processados paraa próxima camada mais baixa que usualmente corre a uma frequência mais alta.

A camada gait decision escolhe o tipo de marcha e calcula as localizações dos passos dorobô. O algoritmo proposto pelos autores determina a localização do próximo passo da pernade balanço relativamente ao pé de suporte. Para além disto, são consideradas as condiçõesgeométricas de colisão do pé com o solo.

Gerar uma trajectória de locomoção dinamicamente estável na próxima camada é base-ado em considerações que usam o ZMP. Além de derivar analiticamente a trajectória do ZMPdo movimento do robô, os autores sugerem um método em que as trajectórias de locomoçãoseguem uma trajectória do ZMP definida inicialmente através da deslocação do tronco dorobô.

Uma trajectória de locomoção é depois calculada online para cada passo e é verificadose cada trajectória gerada permanece dentro dos limites de ângulo e velocidade.

Na última camada antes da camada dos motores, as trajectórias de locomoção criadassão modificadas baseando-se no feedback de sensores. O objectivo deste passo é compensardistúrbios, modelar erros ou mudanças no ambiente externo. Três controladores são usados

Page 31: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

2.1. MÉTODOS TRADICIONAIS 9

para fazer isto: a posição do tronco é deslocada de acordo com a diferença entre o ZMPmedido e desejado; a deflexão de roll da parte superior do corpo é compensada de acordocom a informação de um giroscópio; e o ganho dos servos é diminuído antes do contacto dospés com o solo, de modo a diminuir o impacto das forças de reacção do solo.

Níveis mais altos do sistema de controlo do H7 lidam com o planeamento da posição dopé em ambientes que contêm obstáculos, com manipulação de objectos, ou com um planea-mento de movimentos na totalidade do corpo. Para além disto, o comportamento autónomo émelhorado usando o sistema visual por tracking de objectos ou reconstrução 3D do ambienteexterno.

Projecto Humanoid Robotics Project (HRP) pelo AIST

O National Institute of Advanced Industrial Science and Technology em Tsukuba, Japão e asindustrias Kawada desenvolvem os robôs HRP desde 1998. Entre os últimos modelos desteprojecto de investigação incluem-se o HRP-2LR, o HRP-2P, o HRP-2, o HRP-3P e o HRP-3.O robô HRP-2, da figura 2.3, com 35 graus de liberdade é capaz de caminhar, deitar-se nochão e levantar-se [3]. O sistema de controlo da locomoção é também baseado no cálculo doZMP [22, 23].

Figura 2.3: Robô HRP-2 de [3].

Esta abordagem usa um modelo dinâmico simplificado do robô. Este modelo simplifi-cado é baseado na dinâmica do pêndulo invertido. Neste modelo simplificado, substituindoa posição do pêndulo invertido pela posição do COM do robô é possível calcular a posiçãodo ZMP do robô. Mas gerar um padrão de locomoção é o problema inverso, isto é, o mo-vimento do pêndulo invertido (COM do robô) deve ser calculado a partir de uma trajectóriadefinida do ZMP. Trajectória essa determinada pelos pontos de apoio do robô e período de

Page 32: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

10 CAPÍTULO 2. MÉTODOS DE CONTROLO PARA ROBÔS BÍPEDES

passada. É proposto então um método de controlo em malha fechada que calcula o COM dorobô partindo de um ZMP definido com um certo período.

Vários melhoramentos a este algoritmo de locomoção foram já propostos. Através daadição de um controlo adicional do ZMP, baseado no feedback de sensores e deslocamentotemporal da trajectória do ZMP de referência. A locomoção em terreno irregular pode serconseguida com o robô HRP-2 em simulação [24]. Melhorias adicionais à locomoção podemser alcançadas adicionando uma junta passiva nos dedos dos pés [25]. Maiores velocidadesde locomoção e passos mais longos são possíveis através da adição de uma fase sub-actuadadurante a fase de suporte simples antes do calcanhar bater no solo e através da adaptaçãoda trajectória de referência do ZMP. Recentemente, novas habilidades como sentar-se numacadeira ou abrir e passar por uma porta foram mostradas [26, 27].

Além dos robôs HRP totalmente articulados, módulos avançados sem uma parte supe-rior do corpo foram desenvolvidos para investigar formas mais sofisticadas de locomoção.Usando os robôs HRP-2L, HRP-2LR e HRP-2LT o movimento de corrida pode ser alcançadousando estratégias de controlo baseadas no pêndulo invertido [28, 29, 30]. A elasticidade ne-cessária para correr é simulada pelo controlo activo dos motores DC em vez de explorar aelasticidade mecânica passiva. Adicionar uma mola nas pontas dos pés aumenta a velocidadede corrida até 3 km/h em simulação [31]. Actualmente, uma versão da série de robôs HRP, àprova de pó e de água, está a ser desenvolvida [32, 33]. Estes podem manter uma postura deequilíbrio enquanto manuseiam ferramentas como uma chave de fendas eléctrica.

Projectos que usam Métodos Tradicionais

A Universidade de Waseda desenvolve robôs bípedes desde 1966. O mais recente é o robôWabian-2R, da figura 2.4, com um total de 41 graus de liberdade [4].

Com base no cálculo do ZMP, pode ser alcançada uma locomoção mais parecida coma dos humanos, através dos joelhos esticados e com o movimento dos dedos dos pés [34].Esta abordagem gera trajectórias para os pés usando cinemática inversa e cálculos dinâmicosdo método de Newton-Euler. A trajectória do joelho é pré-determinada usando equaçõespolinomiais de terceira ordem em vez de explorar a dinâmica natural do sistema. Movimen-tos compensatório da cintura mantém o equilíbrio do robô de acordo com a trajectória doZMP. Um algoritmo genético iterativo optimiza a trajectória calculada de modo a minimizara rotação da cintura, a junta de pitch da anca e a junta de pitch do tornozelo.

Em 1984 a empresa Honda começou a trabalhar em robôs bípedes. O robô P2 foi apre-sentado em 1996 e é capaz de desenvolver uma locomoção estática em qualquer direcçãoassim como subir escadas. As suas pernas com seis graus de liberdade têm como carac-terística o amortecimento para reduzir o impacto das juntas enquanto caminha. O sistemade controlo usa um modelo detalhado do robô e do seu ambiente externo e calcula trajectó-

Page 33: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

2.1. MÉTODOS TRADICIONAIS 11

Figura 2.4: Robô Wabian-2R de [4].

rias estáveis com a ajuda do ZMP [35]. O novo robô da Honda, da figura 2.5, Asimo, estáequipado com 28 graus de liberdade e tem a altura de uma criança [5].

Figura 2.5: Robô Asimo de [5].

Enquanto a investigação mais recente se foca nas suas capacidades cognitivas e interac-ção com humanos [36], o robô possui um sistema de locomoção elaborado. Com a aborda-gem de locomoção baseada no ZMP já a correr bastante solidamente, mais trabalho está feitopor exemplo no planeamento do sítio de colocação do pé [37]. Com um modelo especial doAsimo, movimentos de corrida de até 10 km/h podem ser alcançados [38].

O robô Johnnie foi desenvolvido na Universidade de Munique começando no final de1990 com o objectivo de alcançar movimentos de corrida [39, 40]. Está equipado com 17

Page 34: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

12 CAPÍTULO 2. MÉTODOS DE CONTROLO PARA ROBÔS BÍPEDES

juntas e um conjunto sofisticado de sensores. Usando acelerómetros e giroscópios, a posturado tronco é calculada incluindo compensação da aceleração para equilibrar o robô no ciclode locomoção. Trajectórias cartesianas do centro de gravidade, a rotação da parte superiordo corpo e a colocação do pé são derivados como polinómios de quinta ordem em modelosdinâmicos reduzidos. O método de cálculo do torque usado para a modelação permite consi-derar toda a dinâmica do sistema para o controlo do robõ. Este controlo baseado em modeloscoloca altas exigências no desempenho computacional, na largura de banda da comunicação,e na frequência dos dados dos sensores. Assim, um movimento de corrida não pode ser al-cançado. Este objectivo espera-se que seja alcançado com o sucessor Lola que reduz o seupeso, introduz novos sistemas de sensores e revê o conceito de controlo usado[41, 42].

Outros robôs de design e abordagem de controlo semelhante são os KHR-2 e KHR-3(também conhecido como Hubo), da figura 2.6 [43, 6], o BHR-2 da Universidade de Ciênciae Engenharia de Beijing [44], os Toyota Partner Robots [45], ou o robô desenvolvido pelaINRIA (Institut National de Recherche en Informatique et en Automatique)no projecto [46].

Figura 2.6: Robô KHR-3 de [6].

Para além do método do ZMP existem outros sistemas técnicos de controlo usando cal-culo de trajectórias baseados num modelo dinâmico. Um exemplo desta abordagem podeser encontrado no controlo do robô Rabbit desenvolvido como um projecto conjunto pelaINRIA. O projecto tem como objectivo a investigação de diferentes conceitos de controlo delocomoção e corrida, estabilidade da postura ou robustez contra forças externas [47, 48].

Page 35: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

2.2. MÉTODOS BIOLOGICAMENTE INSPIRADOS 13

2.2 Métodos Biologicamente Inspirados

Considerando a capacidade humana de locomoção com duas pernas, não é surpreendenteque os investigadores de robótica tentem transferir os conceitos no controlo para os robôsbípedes. Esta secção mostra o esforço dos investigadores nesse sentido. Esta secção estádividida em três partes. Em duas delas são discutidas as actividades dos investigadores rela-tivas aos aspectos de controlo natural ligadas à dinâmica interna e elasticidade, o chamadocontrolo passivo. A última parte é focada nos conceitos de controlo activo usando reflexos ouosciladores. No caso de trabalhos de investigação que incluem várias destas características,são listados na secção em que é essa característica é mais importante.

2.2.1 Exploração da Dinâmica Intrínseca

Um dos aspectos importantes da locomoção nos sistemas biológicos é a exploração da di-nâmica natural. Isto é feito de várias formas, distribuição inteligente da massa, movimentosque seguem a inércia dos segmentos do corpo, ou armazenamento de energia e auto esta-bilização por elementos elásticos. Infelizmente, a maioria dos bípedes não pode beneficiardestes efeitos devido à grande fricção e rigidez das suas juntas.

Começando em 1990, investigadores tentaram construir máquinas que confiavam com-pletamente na dinâmica intrínseca do corpo. Estes chamados de walkers de dinâmica passivanão tem actuadores e por conseguinte podem ter uma muito baixa fricção das juntas. Ne-nhum controlo activo ocorre, em vez disso estas máquinas confiam em mecanismos bemequilibrados e na gravidade.

McGeer foi um dos primeiros a investigar as leis do movimento por trás dos walkers

de dinâmica passiva [49, 50]. Ele construiu uma máquina que consegue descer uma rampa,usando apenas a energia potencial ganha para compensar a energia perdida. Consegue assimser mostrado que ciclos auto estabilizáveis existem para estes sistemas, isto é, dentro depequenas margens eles vão manter-se dentro de trajectórias estáveis.

Mais investigação neste tópico leva a uma extensão a três dimensões, adicionando umjoelho passivo para implementar a folga da perna de balanço, comparando o movimento doswalkers passivos à locomoção humana. Isto levou também à investigação do consumo deenergia, comprimento dos passos, e problemas de estabilidade [51, 52, 53, 54].

Apesar da elegância destes movimentos e simplicidade do controlo, o princípio da lo-comoção por dinâmica passiva tem alguns inconvenientes e limitações. Como a máquina épuramente passiva, ela depende da energia potencial ganha enquanto desce a rampa. Alémdisso, o design do robô deve ser cuidadosamente escolhido e sintonizado para ele ser capazsequer de andar. E como não há feedback, a máquina não pode reagir a distúrbios, mas ape-nas andar num chão nivelado sem forças externas. Não é possível andar fora do plano sagital

Page 36: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

14 CAPÍTULO 2. MÉTODOS DE CONTROLO PARA ROBÔS BÍPEDES

e está em falta um mecanismo activo de mudança de direcção.

A necessidade de energia adicional pode ser resolvida substituindo a energia ganha en-quanto desce a rampa por actuadores simples [55]. Os robôs Mike e Denise desenvolvidosna Delft University of Technology são alimentados por dois actuadores pneumáticos na anca[56]. Uma actuação eléctrica com uma série de elementos elásticos é usada para actuaçãona anca e no tornozelo do robô Meta (Delft University of Technology). Apenas actuação dostornozelos é usada para o robô Cornell Biped tendo um consumo de energia comparável àlocomoção humana, enquanto que o Honda Asimo usa pelo menos dez vezes a energia dalocomoção humana [55].

Outro trabalho que explora o controlo da dinâmica natural da locomoção é a abordagemde controlo de Jerry Pratt para o robô Spring Flamingo, da figura 2.7. Ele afirma que alocomoção bípede é um problema difícil apenas se visto como uma solução de um sistemadinâmico, mas simples se visto como um mecanismo específico [7].

Figura 2.7: Robô Spring Flamingo de [7].

Começando por simples modelos de locomoção de duas pernas, leis intuitivas de controlosão derivadas para ter a certeza que cinco condições são encontradas: estabilização da altura,do pitch, e de velocidade; movimento de balanço da perna, e transição de tempo apropriadade uma perna de suporte para a outra. Para cada perna, uma máquina de estados finita alternaentre estes controladores. Alguns dos controladores fazem uso do VMC como descrito an-teriormente no capítulo . Esta abordagem é apresentada para trabalhar no robô planar com 6graus de liberdade Spring Flamingo assim como para a máquina com 12 graus de liberdadeYobotics-IHMC [57]. Ambos os robôs têm como características actuadores elásticos combaixa fricção para permitir que a dinâmica passiva tenha efeito e para a implementação docontrolo de torque das juntas [58, 59].

Page 37: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

2.2. MÉTODOS BIOLOGICAMENTE INSPIRADOS 15

O maior conquista do trabalho de Pratt é combinar com sucesso o controlo de feedback

com a exploração da dinâmica passiva. Uma locomoção muito natural e eficiente em ter-mos energéticos é produzida e o sistema permanece estável contra pequenas perturbaçõese mudanças no declive. Mas enquanto os princípios de exploração como a robustez e di-nâmica natural parecem ser universais, o algoritmo sugerido e os seus parâmetros tem deser significativamente mudados para um robô com diferente distribuição de massa, tamanhoou forma. Para além disto não é possível com facilidade estender o controlo a diferentesmodos de locomoção ou adaptar características como a altura dos passos. E para uma con-siderável quantidade de controladores a modelação é necessária, como calcular o jacobianoda cinemática directa para um componente virtual ou parte dele.

Roa et al. desenvolveu robôs simples usando uma metodologia de design baseada emmodelos de locomoção passiva [60]. Uma simulação dinâmica do design mecânico prelimi-nar, incluindo actuações, foi depois usada para refinar a construção. Os três robôs UNROCAoriginários deste trabalho usam servomotores para acompanhar um padrão de locomoção ob-tido em simulação. Enquanto esta abordagem usa a dinâmica do sistema durante o processode design, os verdadeiros robôs não a exploram devido aos seus rígidos actuadores.

O controlo da trajectt’roria dos robops segue um padrão de locomoção obtido através desimulação.

Uma abordagem diferente que combina os benefícios de uma dinâmica de sistema natu-ral e juntas actuadas é proposto por Mombaur et al. [61]. A ideia principal é usar trajectóriasperiódicas de controlo feed-forward que irão gerar soluções em malha aberta cíclicas e es-táveis. Estas trajectórias são geradas usando técnicas de optimização numérica e controloóptimo. Para esta abordagem um modelo rígido do sistema dinâmico do robô e a sua inte-racção com o ambiente exterior tem de ser estabelecido e restrições periódicas têm de serformuladas. O problema de controlo óptimo resultante pode ser eficientemente resolvidopor técnicas de optimização usando multiple shooting [62, 63]. Esta técnica envolve discre-tização dos estados e variáveis de controlo transformando o problema do controlo óptimonum problema de programação não linear com simulações simultâneas para a avaliação defunções e restrições. A abordagem não só permite calcular uma solução de controlo óptima,mas também optimizar parâmetros mecânicos em relação à sua funcionalidade. Soluçõesestáveis em malha aberta podem ser mostradas para a locomoção [64], corrida [65] e saltosmortais [66].

Como a estabilidade pode ser incluída como parte do objectivo durante o processo de op-timização, auto-estabilização, pode ser alcançado um comportamento natural. No entanto,esta abordagem carece de qualquer feedback, assim não pode ser realizada uma locomoçãorobusta sobre um terreno desconhecido. Além disso, a abordagem depende de um modelomatemático completo do robô, do seu ambiente externo e as trajectórias resultantes só fun-

Page 38: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

16 CAPÍTULO 2. MÉTODOS DE CONTROLO PARA ROBÔS BÍPEDES

cionam para esta representação. Isso torna difícil transferi-lo para um robô real, como oprocesso de optimização trabalha numa simulação simultânea que não pode ser facilmentesubstituída por uma máquina real.

2.2.2 Exploração da Elasticidade

Uma exploração dos resultados da elasticidade tem vários benefícios na locomoção natural.Alexander sugere três aplicações diferentes de molas em pernas robótica [67]. As Pogo-

like springs podem armazenar energia durante o impacto que pode ser reutilizada para apropulsão; as Return springs que podem economizar energia durante a mudança da direcçãona perna de balanço e as Elastic foot pads que podem reduzir os impactos e proporcionaruma melhor aderência em terreno irregular. Já na década de 80 Raibert fez um grande usode Pogo-like springs nas suas máquinas de corrida e saltos [68].

Apenas alguns projectos de investigação abrangem o uso de elasticidade durante a loco-moção bípede. O robô Lucy, da figura 2.8, de 6 graus de liberdade usa músculos artificiaispneumáticos como actuação que permitem controlar a rigidez das juntas [69, 70, 8, 71].

Figura 2.8: Robô Lucy de [8].

O objectivo do projecto é combinar a versatilidade dos robôs controlados por métodostécnicos com a exploração da dinâmica natural e assim reduzir o consumo de energia. Astrajectórias das juntas são pré-geradas usando um modelo dinâmico do robô e dos músculospneumáticos. Cálculos do ZMP são aplicados como critério de estabilidade. Um seguidorde trajectória controla depois a pressão dentro dos músculos para seguir o movimento dese-jado. Desta forma velocidades de locomoção de até 0,15 m/s podem ser alcançadas. Mudara rigidez das juntas durante o seguimento da trajectória, dependendo da dinâmica natural do

Page 39: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

2.2. MÉTODOS BIOLOGICAMENTE INSPIRADOS 17

sistema, pode até reduzir o gasto de energia. Esta abordagem até agora apenas foi testadanuma estrutura de pêndulo actuada pelos músculos artificiais. Enquanto este trabalho de in-vestigação tenta incluir dinâmica passiva no controlo, ainda depende de um modelo dinâmicodo robô e do seu ambiente externo.

Outro projecto do mesmo grupo que combina locomoção dinâmica passiva e actuaçãoelástica é o robô Veronica [72]. É alimentado por seis actuadores MECCEPA (MechanicallyAdjustable Compliance and Controllable Equilibrium Position Actuator) na anca, joelho etornozelo. Este actuador rotacional possui controlo de rigidez e uma posição de equilíbrioatravés da combinação de dois motores servos e uma mola mecânica. O robô planar tem 1 m.de altura, pesa 5,6 kg e é controlado através de um conceito chamado de Controlled Passive

Walking (locomoção passiva controlada): os actuadores de compliance mudam a frequêncianatural do sistema mecânico para permitir uma locomoção dinâmica passiva a diferentesvelocidades. O controlador fundamental divide o ciclo de locomoção em seis fases. Paracada fase, um conjunto de parâmetros de controlo das juntas é determinado para as juntasda anca, joelho e tornozelo. Por exemplo, a posição de equilíbrio da junta da anca tantopode ser definida como flexionada ou extendida, e o controlador é definido para ser rígido ousuave. Suportado por um operador humano, vários passos podem ser alcançados. Enquanto oactuador tem propriedades interessantes ele não consegue produzir alta rigidez ou alto torquedevido ao seu design. O conceito de controlo carece de mecanismos de feedback para reagira perturbações ou condições imprevisíveis do solo.

No laboratório de locomoção em Jena, Seyfarth e os seus colegas também investigam opapel dos actuadores de compliance na locomoção e corrida bípede [73, 74, 75]. No âmbitodesta investigação, vários robôs planares básicos com apenas poucos graus de liberdade ac-tivos são construídos para verificar os modelos provenientes de análise biomecânica. O robôsub-actuado Jena Walker II é usado para examinar a função do sistema elástico músculo-tendão durante a locomoção [76]. Ele possui duas juntas actuadas na anca e juntas do joelhoe tornozelo passivas. Quatro grandes grupos músculo-tendão são representados por sistemasde cabos e molas, três deles abrangendo duas juntas. Uma locomoção com as pontas dos pésestável e suportada pode ser demonstrada a diferentes velocidades de até 0,6 m/s, mostrandocompliance nas perna através da junta do tornozelo, mesmo durante o movimento de suportecom uma perna esticada.

Desde o trabalho pioneiro de Kato em 1969, vários projectos usam músculos pneumá-ticos artificiais como actuação para bípedes, por exemplo o bípede da companhia Shadow,mas apenas algumas máquinas são realmente capazes de andar, deixando de lado o uso depropriedades elásticas. Kerscher et al. estão a desenhar um robô bípede 3D com compli-

ance. A abordagem combina actuação eléctrica na junta da anca, do joelho e do tornozelocom músculos pneumáticos produzidos pela empresa Festo. O conceito de controlo com-

Page 40: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

18 CAPÍTULO 2. MÉTODOS DE CONTROLO PARA ROBÔS BÍPEDES

bina o VMC descrito no capítulo 2.2.1 com adaptação da rigidez. Um modelo detalhadodo músculo pneumático foi desenvolvido usando por exemplo uma experiência de libertaçãorápida para deduzir propriedades dinâmicas [77]. Baseado na simulação dinâmica do robô emodelo do músculo, os primeiros passos puderam ser alcançados.

Hosoda et al. construíram vários robôs para locomoção e saltos, actuados pelos mús-culos pneumáticos artificiais de McKibben [78, 79]. O robô Pneumat-BR é capaz de saltarassim como caminhar no plano sagital. O maior foco deste trabalho assenta sobre a ajustabi-lidade da compliance das juntas dependendo do modo de locomoção. O sistema de controloconsiste num simples mecanismo de feed-forward abrindo ou fechando as válvulas numasequência fixa para um tempo determinado experimentalmente. Embora possa ser alcançadauma locomoção passiva, o robô carece de um sistema de feedback e pode apenas andar emterreno liso sem perturbações.

2.2.3 Controlo baseado em Redes Neuronais, Reflexos e Osciladores

Vários projectos de investigação desenvolvendo abordagens de controlo de locomoção bí-pede baseados em descobertas neurocientíficas podem ser encontrados na literatura. Pos-síveis características a ser consideradas são as funcionalidades dos neurónios, os reflexose CPGs que são redes neuronais centrais que produzem padrões rítmicos como output semfeedback de sensores.

Paul [80] demonstrou, em simulação, que uma rede neuronal puramente reactiva podeproduzir uma locomoção estável para a parte inferior de um bípede com 8 graus de liber-dade. Em vez de depender de um CPG, redes neuronais simples ligam directamente entradasde sensores, como orientação da cintura ou informação dos contactos, aos sinais de controlodo actuador. Um algoritmo genético é usado para desenvolver os controladores, resultandonum comportamento rítmico e cíclico da marcha. Enquanto os resultados sublinham a impor-tância dos reflexos e a possibilidade de mudança reactiva das fases de locomoção, permanecepor ver se esta abordagem simples de controlo ainda funciona numa máquina mais complexae num ambiente sujeito a perturbações.

Zair et al. investigou a combinação de reflexos com um CPG [9, 81]. No pequenohumanóide HOAP-3, da figura 2.9, eles implementaram um gerador de padrões linearesliner pattern generator usando informação de giroscópios para estabilização durante a fasede suporte simples.

Uma rede neuronal recorrente é activada por sensores de movimento para reconhecer aperturbação e iniciar o movimento reflexo. O movimento pode ser adaptado com base eminformação dos sensores: no caso dos passos do robô num obstáculo, a sua posição na solado pé é calculada usando quatro sensores de força no pé. Depois um movimento de roll oupitch do tornozelo tenta aumentar o tamanho do polígono de suporte, de modo a recolocar o

Page 41: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

2.2. MÉTODOS BIOLOGICAMENTE INSPIRADOS 19

Figura 2.9: Robô HOAP-3 de [9].

ZMP numa posição estável. Esta abordagem combina trajectórias geradas com reflexos. Ogerador de padrões claramente beneficia das grandes placas dos pés e do pequeno peso dorobô.

Geng et al. implementaram uma rede neuronal reflexiva para um pequeno walker pla-nar [82, 83]. Eles mostraram que uma locomoção rápida é possível sem planeamento dastrajectórias, mas antes pelo uso de reflexos locais e pela exploração da dinâmica passiva dosistema mecânico. O robô RunBot tem 23 cm. de altura, pés curvados e é actuado na anca ejoelhos por 4 servomotores modificados. Um servomotor adicional pode mover um pequenopeso na parte superior do corpo para simular uma inclinação para a frente e para trás. Outrossensores incluem um acelerómetro e um sensor de infravermelhos que aponta para o solopara distinguir entre solo preto uniforme e solo branco inclinado. Redes neuronais simplescontrolam localmente a perna e o movimento da parte superior do corpo, criando reflexos,como acções, dependendo dos ângulos das juntas, contacto com o solo ou aceleração. Porexemplo, quando a perna de balanço chega à posição anterior extrema, a junta do joelho éestendida para se preparar para a aterragem do pé e aceitação do peso. Uma rede neuronaladaptativa adicional modifica a rede neuronal local baseada na informação dos infraverme-lhos para alcançar uma mudança de locomoção preditiva nas rampas. Como resultado, umalocomoção estável e planar em terreno liso e inclinado pode ser gerada, o que combina a ex-ploração da dinâmica passiva e controlo neuronal activo. Escalonada pelo comprimento daperna, a velocidade de locomoção é uma das mais rápidas observada em bípedes e é compa-rável à locomoção humana rápida. No entanto, ainda tem que ser mostrado se a simplicidadeda abordagem de controlo adapta-se a máquinas maiores e com mais graus de liberdade.

Uma combinação de padrões feed-forward e reflexos é usada para a abordagem de con-

Page 42: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

20 CAPÍTULO 2. MÉTODOS DE CONTROLO PARA ROBÔS BÍPEDES

trolo desenvolvida por Huang et al. [84]. As trajectórias feed-forward dos ângulos das juntassão pré-calculadas offline como polinómios de terceira ordem e usam o ZMP como critériode estabilidade. Aqui, é assumido que a dinâmica do robô e o seu ambiente externo são co-nhecidos. Três reflexos adicionam offsets aos ângulos das juntas para as trajectórias rítmicasem caso de detecção de perturbações. O reflexo do ZMP vai mover as juntas do tornozelo seo ZMP actual se mover muito perto das bordas do pé. Ao considerar o offset entre o tempoestimado e efectivo do pousar do pé, o reflexo da fase de aterragem altera o comprimentoda perna de suporte, assim compensando modificações da velocidade. Finalmente o reflexoda postura do corpo vai adaptar as juntas da anca se a inclinação do corpo medida variarda trajectória calculada. A abordagem de controlo é demonstrada em simulação e usando opequeno bípede do Nakamura Lab. Enquanto uma combinação de controlo feed-forward efeedback parece promissora, o conceito de Huang et al. ainda requer um modelo dinâmicocompleto para os cálculos do ZMP quer online quer offline. Para além disto, o uso dos ângu-los das juntas como variáveis de controlo e a rigidez do mecanismo proíbe o uso de dinâmicapassiva.

Taga foi um dos primeiros a controlar a locomoção bípede através de osciladores neuro-nais [85, 86, 87]. Num bípede planar simulado de 5 e 8 links, geradores rítmicos similaresaos propostos por Matsuoka controlam cada anca, joelho e tornozelo [88]. Como a dinâ-mica passiva está permitida a actuar, também osciladores mecânicos, como os movimentosdo pêndulo dos membros, são incluídos. Os ângulos das juntas, velocidades das juntas, e ainformação de contacto do pé com o solo são usados nos termos de feedback dos oscilado-res. É alcançada uma locomoção estável em terreno uniforme e superfícies inclinadas sobreperturbações externas. Um resultado importante do trabalho de Taga é demonstrar controloincorporado de um bípede com padrões de locomoção rítmicos. Ainda não é claro se a abor-dagem permanece válida com modelos mais complexos. Também tem de ser decidido paracada oscilador quais os sistemas de sensores que vão ser usados como feedback. Projectossimilares continuaram as ideias de Taga incluindo mais graus de liberdade ou um modelomais sofisticado do sistema neuromuscular [89, 90]. Katayama et al. estudou a teoria deosciladores neuronais para o uso no controlo da locomoção bípede e mostrou soluções paraa estabilidade de equações diferenciais não lineares e aplicações possíveis para a geração depadrões de locomoção [91].

Sistemas de controlo de locomoção baseados em osciladores neuronais não se adaptambem com o aumento de graus de liberdade dado que os seus parâmetros não têm interpreta-ção física e por conseguinte são difíceis de sintonizar e de aprender. Shan et all. aborda oproblema da complexidade usando um sistema hierárquico de sub-circuitos de CPGs [92].Cada um desses circuitos é implementado como uma rede neuronal recorrente e representaum certo programa motor para a locomoção. Representado por diferentes equações de ordens

Page 43: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

2.2. MÉTODOS BIOLOGICAMENTE INSPIRADOS 21

diferentes, os sub-circuitos do oscilador criam um movimento lateral de roll, levantamentoda perna de balanço, e movimento para a frente ou para trás. O espaço de parâmetros é redu-zido por cálculos da cinemática inversa. O sistema de controlo foi testado no pequeno robôHOAP-1 que contem 20 graus de liberdade, medidores de força nos pés, e um giroscópio tri-dimensional. Caminhar e simples subida de escadas pode ser alcançada. No entanto, comoas trajectórias das posições das juntas de padrões sinusoidais são forçadas nas juntas do robô,nenhuma dinâmica inerente pode ser explorada e apenas parâmetros altamente sintonizadospermitem ao sistema caminhar num ambiente sem perturbações.

Aoi e os seu colegas também controlam um robô HOAP-1 por uma rede de osciladoresnão lineares [93, 94]. Um oscilador para cada pé, cada perna, e o tronco é coordenadopor um inter-oscilador. Juntas estas unidades formam o gerador de ritmo do sistema decontrolo. As suas fases codificam as trajectórias das juntas para os membros. Novamente,a cinemática inversa é usada para calcular a posição das mãos e pés nas fases de suporte ebalanço. A estabilidade é determinada pela análise de mapas de Poincaré das equações demovimento. As medidas dos contactos do solo dentro dos pés fornecem feedback sensorialque é usado para fazer reset ao oscilador e modificar as trajectórias por exemplo baseadas naposição do pé e pousar do mesmo. Experiências usando o robô e o ambiente de simulaçãomostraram que o ciclo de locomoção volta aos seus movimentos cíclicos com perturbaçõesmuito baixas, mas não consegue lidar com perturbações maiores. Enquanto esta abordagememprega osciladores no centro do sistema de controlo, baseia-se ainda em muitos métodosusados em bípedes controlados tecnicamente.

A aplicação de osciladores neuronais é também examinada por Endo, Morimoto et al.

para um walker básico planar e para um pequeno, totalmente actuado bípede [95, 10]. Osistema de controlo baseado nos osciladores de Matsuoka está configurado em analogia como trabalho de Kimura em robôs quadrupeds [96]. Enquanto o oscilador do walker planarcontrola directamente os torques das juntas, o do controle dos humanóides pequenos actuanas posições dos pés. Esta abordagem reduz o número de neurónios e parâmetros, faz oscálculos necessários da cinemática inversa e exclui a possibilidade de explorar sistemas di-nâmicos. O movimento vertical das pernas é modulado por dois reflexos posturas. Outrotermo de feedback sincroniza o movimento horizontal da perna com o oscilação do corpo. Aabordagem é testada em simulação e usando o robô da Sony, da figura 2.10, QRIO.

É alcançada uma locomoção lenta, sobre pequenas perturbações e com um comprimentode passada de aproximadamente o comprimento do pé. Ao fazê-lo os efeitos da dinâmicadurante a locomoção desempenham um papel menor e a estabilidade postural é fácil de obter.

Na nossa abordagem optou-se por implementar o controlador de locomoção bípede ori-ginalmente desenvolvido por Morimoto et al. no artigo [14]. Neste controlador a localizaçãodo COP do robô é usado para detectar a fase da dinâmica do robô. Esta fase é usada para

Page 44: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

22 CAPÍTULO 2. MÉTODOS DE CONTROLO PARA ROBÔS BÍPEDES

Figura 2.10: Robô QRIO de [10].

modular as trajectórias desejadas das juntas. A abordagem de controlo usa o modelo de umoscilador de fase acoplado para modular padrões sinusoidais simples. O modelo do osciladorde fase acoplado sincroniza padrões periódicos gerados pelo controlador com a dinâmica dorobô. O controlador apresenta características dos CPGs em que cada junta do robô é mo-delada por um oscilador específico sincronizado com os outros osciladores. O modelo foibaseado na observação da locomoção humana e permite uma sintonização para obtenção doefeito desejado. Este trabalho apresenta uma tentativa de aproximação da locomoção dosrobôs à locomoção humana usando conceitos biológicos. Como consequência da simplici-dade do modelo futuras modificações ao controlador são bastante fáceis. Os parâmetros desintonização do controlador são simples envolvendo apenas amplitudes e frequências, e ametodologia de elaboração do controlador é relativamente simples.

Esta pesquisa de literatura apresenta uma visão global de abordagens bio inspiradas derobôs bípedes. Pretende fornecer uma visão sólida dos projectos de investigação sobre estetópico.

Page 45: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

Capítulo 3

Osciladores de Fase

Neste capítulo é feita uma pequena introdução aos osciladores de fase, onde se define oconceito de oscilador e suas aplicações. É também apresentado o oscilador de fase usadono controlo da locomoção bípede, os seus pontos fixos e estabilidade. O mesmo osciladorfoi usado por Morimoto et al. no artigo [14] para implementação da locomoção num robotbípede de tamanho humano desenvolvido por eles e no robô de pequeno tamanho Qrio daSony. Christian Lathion em [97] aplicou também o mesmo oscilador para a locomoçãobípede no robot HOAP-2.

3.1 Osciladores

Como definido no livro de S. H. Strogatz [11] um oscilador é algo que funciona de acordocom os princípios da oscilação. A oscilação é a variação repetitiva, geralmente no tempo, dealguma medida sobre um valor central (geralmente um ponto de equilíbrio), ou entre dois oumais estados diferentes. Exemplos comuns incluem um pêndulo e a alimentação AC.

O acoplamento entre dois osciladores é um fenómeno básico da natureza. Por exemplo,dois relógios de pêndulo (osciladores), dispostos próximos um do outro e na mesma parede,entram em sincronismo (ficam acoplados) através de uma pequena força de acoplamento.Neste caso a força de acoplamento é a vibração da parede onde os relógios estão fixos.

Os osciladores de fase, como o nome indica, são osciladores que têm como resultado umafase de oscilação. A vantagem dos osciladores de fase é que proporcionam robustez devidoà existência de atractores estáveis, isto porque o sistema rapidamente retorna ao seu compor-tamento rítmico após perturbações transitórias. A capacidade de acoplamento/sincronizaçãodos osciladores de fase juntamente com a sua estabilidade a pequenas perturbações, faz comque seja possível a integração do feedback de sensores de modo a criar acoplamento entreestes e o sistema mecânico.

23

Page 46: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

24 CAPÍTULO 3. OSCILADORES DE FASE

3.2 Oscilador Acoplado

No caso específico do controlador utilizado por Morimoto et al. [14], a componente rítmicada marcha é descrita por um sistema de osciladores acoplados φC e φR e o seu comportamentotemporal segue um sistema de equações diferenciais (equações 3.1 e 3.2).

φC = ωC + KC sin(φR − φC) (3.1)

φR = ωR + KR sin(φC − φR) (3.2)

Onde ωC > 0 e ωR > 0 são positivos já que são as frequências naturais da dinâmica dosistema e KC e KR são constantes de acoplamento positivas.

No livro de S. H. Strogatz [11] é mostrada uma forma intuitiva de pensar no modelo dooscilador acoplado (equações 3.1 e 3.2). Basta imaginar dois amigos a correr em círculonuma pista, como demonstrado pela figura 3.1.

Figura 3.1: Modelo, adaptado de [11], do oscilador acoplado onde φR e φC representam as posiçõesdos amigos na pista, e ωR e ωC são proporcionais às suas velocidades de corrida.

Aqui φR e φC representam as suas posições na pista, e ωR e ωC são proporcionais àssuas velocidades de corrida. Se eles estivessem desacoplados, cada um iria correr na suavelocidade e o mais rápido iria periodicamente ultrapassar o mais lento. Mas estes queremcorrer à mesma velocidade, sem que um ultrapasse o outro. Para isto acontecer têm deencontrar uma velocidade comum para os dois, uma velocidade de compromisso. Neste casodiz-se que eles estão acoplados.

Se as suas velocidades forem muito diferentes, o acoplamento vai ser impossível, já quevai ser impossível alcançar uma velocidade de compromisso entre os dois.

Page 47: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

3.3. DINÂMICA DO SISTEMA 25

3.3 Dinâmica do Sistema

O objectivo do modelo do oscilador acoplado é atingir o acoplamento entre os osciladoresφC e φR, partindo de uma qualquer situação inicial. Ambos os osciladores começam nassuas frequências naturais ωR e ωC, e quando acoplados convergem para uma frequência decompromisso ω∗ (compromise frequency), neste caso quando acoplados a diferença de fase(Ψ) entre φR e φC vai ser constante e dada pela equação 3.3.

Ψ = φC − φR (3.3)

Partindo da equação 3.3 obtém-se equação 3.4, derivando em ordem ao tempo.

Ψ = φC − φR (3.4)

Substituindo na equação 3.4 as equações 3.1 e 3.2 obtém-se a equação da dinâmica dosistema (equação 3.5).

Ψ = ωC − ωR − (KC + KR) sin(Ψ) (3.5)

Para analisar a equação 3.5 é assumido por conveniência dos cálculos que (ωC−ωR) > 0,já que os resultados para (ωC − ωR) < 0 são similares. De qualquer das formas ωC e ωR

são positivos já que são frequências da dinâmica do sistema. Assume-se também que (KC +

KR) 1 0, uma vez que são constantes de acoplamento positivas. Para se poder estabeleceruma relação entre os valores das constantes de acoplamento e as frequências da dinâmicado sistema com os pontos fixos do sistema procedeu-se à simulação em Matlab do gráficode fase da equação 3.5. Para a simulação do gráfico em Matlab definiram-se os seguintesparâmetros: ωC = 4, ωR = 2, KC = 1 e KR = 2. Os valores do gráfico variam entre −π eπ, já que se trata de uma equação periódica e por isso os seus valores repetem-se fora desteintervalo. De notar o facto de (ωC − ωR) = 4 − 2 = 2 ser o ponto médio da onda observada e(KC + KR) = 1 + 2 = 3 ser a amplitude da mesma onda. Verifica-se assim que a dinâmica dosistema tem um comportamento sinusoidal.

3.4 Pontos Fixos e Sua Estabilidade

Conhecido o oscilador acoplado procedeu-se de seguida à determinação dos seus pontosfixos e à estabilidade dos mesmos. Isto pode ser feito partindo-se do gráfico da dinâmica dosistema (figura 3.2). Sendo os pontos fixos dados pelos zeros da equação da dinâmica dosistema, ao variar os parâmetros (KC + KR) e (ωC − ωR) obtêm-se diferentes quantidades dezeros (pontos fixos), como se pode ver na figura 3.3. Assim quando (KC + KR) < (ωC − ωR)

Page 48: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

26 CAPÍTULO 3. OSCILADORES DE FASE

−4 −3 −2 −1 0 1 2 3 4−1

0

1

2

3

4

5

Ψ

Ψ

Figura 3.2: Comportamento sinusoidal da dinâmica do sistema para valores de ωC = 4, ωR = 2,KC = 1 e KR = 2 e para um intervalo de valores de −π a π. Neste caso (ωC − ωR) = 4 − 2 = 2 é oponto médio da onda observada e (KC + KR) = 1 + 2 = 3 é a amplitude da mesma.

não existem pontos fixos uma vez que não existem zeros na função (figura 3.3(a)). Quando(KC +KR) = (ωC−ωR) nasce um ponto fixo meio-estável (figura 3.3(b)). Quando (KC +KR) >(ωC − ωR) o ponto fixo meio-estável divide-se em dois pontos fixos, um estável e outroinstável (figura 3.3(c)). Assim é necessário parametrizar os valores de (KC + KR) e (ωC−ωR)do sistema de modo que (KC + KR) > (ωC − ωR) e assim o sistema possua um ponto fixoestável.

No caso da figura 3.3(c) falta saber qual dos pontos fixos é estável e qual é instável, paraisto é usado o declive da equação da dinâmica do sistema, em cada instante. O declive vai darinformação sobre a velocidade do fluxo e a partir disto podemos inferir sobre a estabilidadedos pontos fixos.

Continuando na figura 3.3(c) o ponto fixo A será um ponto fixo com declive positivo, oque o torna num ponto fixo instável (repulsor). Isto porque, a taxa de variação de Ψ (dΨ

dt = Ψ)é positiva para um valor à direita do ponto fixo, o que implica que o valor de Ψ aumenta epor conseguinte afasta-se do valor do ponto fixo. Já para um valor de Ψ à esquerda, a taxade variação é negativa o que implica um crescimento negativo para Ψ, assim o valor de Ψ

diminui afastando-se do valor ponto fixo.

O ponto fixo B será um ponto fixo com declive negativo, o que o torna num ponto fixoestável (atractor). Isto porque, a taxa de variação de Ψ (dΨ

dt = Ψ) é negativa para um valor àdireita do ponto fixo, o que implica que o valor de Ψ diminui e por conseguinte aproxima-sedo valor do ponto fixo. Já para um valor de Ψ à esquerda, a taxa de variação é positiva oque implica um crescimento positivo para Ψ, assim o valor de Ψ aumenta aproximando-sedo valor do ponto fixo.

O estudo dos pontos fixos e da sua estabilidade pode ser feita de forma analítica. Para

Page 49: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

3.4. PONTOS FIXOS E SUA ESTABILIDADE 27

−4 −3 −2 −1 0 1 2 3 4−2

−1

0

1

2

3

4

5

6

Ψ

Ψ

(a) Valores de (KC + KR) < (ωC − ωR) onde nãoexistem pontos fixos uma vez que não existem zerosna função.

−4 −3 −2 −1 0 1 2 3 4−2

−1

0

1

2

3

4

5

6

Ψ

Ψ

(b) Valores de (KC + KR) = (ωC − ωR) onde existeum ponto fixo meio-estável.

−4 −3 −2 −1 0 1 2 3 4−2

−1

0

1

2

3

4

5

6

Ψ

Ψ

B A

(c) Valores de (KC + KR) > (ωC −ωR) onde o ponto fixo meio-estável se divide em dois pontos fixos, um estável e outro ins-tável.

Figura 3.3: Pontos fixos de acordo com a varição dos parâmetros (KC + KR) e (ωC − ωR).

isso, resolve-se a equação 3.6 que resulta na equação 3.7.

Ψ|Ψ=ΨPF = 0 (3.6)

sin(ΨPF) =ωC − ωR

KC + KR(3.7)

Simplificando a equação 3.7, os pontos fixos são dados pela equação 3.8.

ΨPF = arcsin(ωC − ωR

KC + KR

)+ K 2π (3.8)

A equação 3.7 pode-se também transformar na equação 3.9.

Page 50: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

28 CAPÍTULO 3. OSCILADORES DE FASE

cos(ΨPF) = ±

√1 −

(ωC − ωR

KC + KR

)2

(3.9)

A determinação da estabilidade dos pontos fixos é feita a partir da equação 3.10 queresolvendo resulta na equação 3.11.

˙Ψ =d [ωC − ωR − (KC + KR) sin(Ψ)]

dΨ(3.10)

˙Ψ = −(KC + KR) cos(Ψ) (3.11)

Em seguida substituiu-se na equação 3.11 a equação 3.9 e obteve-se a equação 3.12,sendo esta a equação que fornece informação quanto à estabilidade dos pontos fixos.

˙Ψ|Ψ=ΨPF = ±(KC + KR)

√1 −

(ωC − ωR

KC + KR

)2

(3.12)

O ponto fixo com cos(ΨPF) > 0 é um ponto fixo estável uma vez que ˙Ψ < 0. Estecorresponde ao ponto fixo B da figura 3.3(c) que tem um valor compreendido entre 0 e π

2 ,porque o coseno deste intervalo de valores é positivo.

O ponto fixo com cos(ΨPF) < 0 é um ponto fixo instável uma vez que ˙Ψ > 0. Estecorresponde ao ponto fixo A da figura 3.3(c) que tem um valor compreendido entre π

2 e π,porque o coseno deste intervalo de valores é negativo.

3.5 Parametrização do Sistema

Pode-se concluir que o sistema para funcionar como desejado (existir acoplamento) precisade possuir no mínimo um ponto fixo estável para onde a diferença de fase entre φC e φR, Ψ,irá convergir (equação 3.3). Isto só acontece quando (KC + KR) > (ωC − ωR), que é o casoda figura 3.3(c), onde existe um ponto fixo estável e um ponto fixo instável. Seguidamenteestas equações foram simuladas em Matlab.

Considerou-se as condições iniciais φC(0) = 0 e φR(0) = 2 e para (KC + KR) = (2+2) = 4e (ωC − ωR) = (6, 5 − 2) = 4, 5 rad/s, resulta no caso em (KC + KR) 0 (ωC − ωR), isto é,o sistema não possui um ponto fixo estável. Pode-se ver na figura 3.4 a não existência deacoplamento já que φC e φR começam a afastar-se gradualmente. Esta divergência vai levara um valor de Ψ variável. Isto confirma o que foi dito anteriormente, já que neste caso nãoexiste um ponto fixo estável para onde a diferença de fase entre φC e φR, Ψ possa convergir.Assim, φC e φR estão a aumentar a sua diferença de fase (Ψ), e consequentemente as suasfrequências (ωC e ωR) não convergem para um valor comum.

Page 51: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

3.5. PARAMETRIZAÇÃO DO SISTEMA 29

0 1 2 3 4 5 60

5

10

15

20

25

30

35

tempo (s)

Ra

d

φC

φR

(a) Divergência entre o φC e o φR.

0 1 2 3 4 5 6−2

0

2

4

6

8

10

tempo (s)

Rad

Ψ

(b) Divergência entre o φC e o φR que se traduz numΨ variável.

Figura 3.4: Sistema desacoplado onde (KC + KR) 0 (ωC − ωR).

Partindo das mesmas condições iniciais φC(0) = 0 e φR(0) = 2, mas desta vez para (KC +

KR) = (2 + 2) = 4 e (ωC−ωR) = (3−2) = 1 rad/s, resulta no caso em (KC + KR) > (ωC−ωR),isto é, o sistema possui um ponto fixo estável. Pode-se ver na figura 3.5 a existência deacoplamento já que φC e φR, após um tempo de convergência, mantêm a sua diferença defase (Ψ) constante. O tempo de convergência é o tempo que o sistema demora até que φC eφR estejam acoplados. A convergência vai levar a um valor de Ψ constante. Isto confirmatambém o que foi dito anteriormente, já que neste caso existe um ponto fixo estável paraonde a diferença de fase entre φC e φR, Ψ converge.

0 1 2 3 4 5 60

2

4

6

8

10

12

14

16

18

X: 3.000Y: 8.624

tempo (s)

Ra

d

X: 5.000Y: 13.62

X: 3.000Y: 8.371

X: 5.000Y: 13.37

φC

φR

(a) Convergência entre o φC e o φR, depois de umtempo de convergência inicial.

0 1 2 3 4 5 6−2

−1.5

−1

−0.5

0

0.5

X: 5.000Y: 0.2527

tempo (s)

Rad

X: 3.000Y: 0.2527

Ψ

(b) Convergência entre o φC e o φR que se traduz numΨ constante, depois um tempo inicial de convergênciainicial.

Figura 3.5: Sistema acoplado onde (KC + KR) > (ωC − ωR).

Pode-se calcular os valores dos pontos fixos para este caso (equação 3.13).

ΨPF = arcsin(3 − 22 + 2

)+ K 2π ≈ 0, 25 + K 2π ∧ 2, 89 + K 2π (3.13)

Page 52: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

30 CAPÍTULO 3. OSCILADORES DE FASE

Como foi visto anteriormente o ponto fixo B (menor valor de Ψ) é um ponto fixo estável,neste caso ΨPF ≈ 0, 25 rad e o ponto fixo A (maior valor de Ψ) é um ponto fixo instável,neste caso ΨPF ≈ 2, 89 rad. Assim sendo, como a diferença de fase (Ψ) converge, parao ponto fixo estável ΨPF ≈ 0, 25 rad, a diferença de fase entre φC e φR será neste casoaproximadamente 0,25 rad. Ao olhar para a figura 3.5 consegue-se constatar isto, aplicando aequação da diferença de fase (equação 3.3) para um valor de tempo em que o sistema já estejaestabilizado. Assim aos 3 segundos, φC ≈ 8, 624 rad e φR ≈ 8, 371 rad e consequentementeΨ ≈ 8, 624 − 8, 371 ≈ 0, 25 rad. Aos 5 segundos, verifica-se o mesmo, já que φC ≈ 13, 62rad e φR ≈ 13, 37 rad e consequentemente Ψ ≈ 13, 62 − 13, 37 ≈ 0, 25 rad.

Como foi dito anteriormente ambos os osciladores começam nas suas frequências na-turais ωC e ωR, e quando acoplados convergem para uma frequência de compromisso ω∗

(compromise frequency). Assim quando o sistema se encontrar estabilizado ambos os osci-ladores vão ter a mesma frequência (frequência de compromisso) constante que assim sendopode ser expressa pela equação 3.14. A frequência de compromisso é dada pelo declive deφC e de φR podendo assim ser igualada às suas derivadas.

ω∗ = φC = φR = ωR + KR sin(Ψ) (3.14)

Na figura 3.6 pode-se observar a evolução da frequência de compromisso do sistema.

0 1 2 3 4 5 60

0.5

1

1.5

2

2.5

X: 4.000Y: 2.5

tempo (s)

Ra

d/s

ω*

Figura 3.6: Convergência do sistema até à frequência de compromisso ω∗ de 2,5 rad/s.

Usando a equação dos pontos fixos (equação 3.7) e substituindo-a na equação 3.14 chega-se à equação final da frequência de compromisso (equação 3.15).

ω∗ =KCωR + KRωC

KR + KC(3.15)

Assim a frequência de compromisso depende de KC, KR, ωC e ωR e para este caso espe-cífico vai ter o valor dado pela equação 3.16.

Page 53: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

3.6. EFEITOS DO ACOPLAMENTO 31

ω∗ =2 ∗ 2 + 2 ∗ 3

2 + 2= 2, 5 rad/s (3.16)

Olhando para a figura 3.5 pode-se obter o declive da recta φC ou φR através de 13,62−8,6245−3 ≈

2, 5 rad/s ou de 13,37−8,3715−3) ≈ 2, 5 rad/s que corresponde ao valor de ω∗.

Assim, só existe acoplamento do sistema se a condição (KC+KR) > (ωC−ωR) se verificar.

3.6 Efeitos do Acoplamento

Como foi dito anteriormente o objectivo do modelo do oscilador acoplado é atingir o aco-plamento entre φC e φR, partindo de uma qualquer situação inicial. Ambos os osciladorescomeçam nas suas frequências naturais ωR e ωC respectivamente, e quando acoplados con-vergem para uma frequência de compromisso ω∗, com uma diferença de fase Ψ.

Para avaliar o acoplamento, procedeu-se à sua simulação em Matlab onde se partiu dascondições iniciais φC(0) = 0 e φR(0) = 1 e se definiu ωR = 2π rad/s e ωC = π

2 rad/s. Nesteexemplo, φR está desacoplado, isto é, KR = 0. Este não é o caso desejado já que as fasesnão se encontram acopladas. De seguida observou-se a evolução de φR e de ωR variandoa constante de acoplamento KC. Assim, na figura 3.7 e 3.8 pode-se ver o comportamentodo acoplamento de fase do modelo do oscilador acoplado. Na figura 3.7 o acoplamentoacontece quando o declive de φC e de φR é o mesmo, ou seja quando o Ψ converge para umvalor constante. Na figura 3.8 acontece quando o sin(φC) tem a mesma frequência do sin(φR).

0 1 2 3 4 5 60

5

10

15

20

25

30

35

40

tempo (s)

Ra

d

φR

φC

(KC

= 0)

φC

(KC

= 2)

φC

(KC

= 4)

φC

(KC

= 6)

φC

(KC

= 9)

(a)

0 1000 2000 3000 4000 5000 6000−30

−25

−20

−15

−10

−5

0

tempo (s)

Rad

Ψ (KC

= 0)

Ψ (KC

= 2)

Ψ (KC

= 4)

Ψ (KC

= 6)

Ψ (KC

= 9)

(b)

Figura 3.7: Variação de φC, φR e Ψ de acordo com a variação da constante de acoplamento KC.

Assim, se o acoplamento for muito fraco (KC = 2, 0), a frequência de φC mantém-sequase inalterada em relação ao seu valor inicial de π

2 . À medida que o KC aumenta, a frequên-cia de φC começa a adaptar-se à frequência desejada, e finalmente chega lá quando KC = 6, 0.Mas a diferença de fase Ψ continua a ser importante e ao aumentar a constante de acopla-

Page 54: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

32 CAPÍTULO 3. OSCILADORES DE FASE

mento para KC = 9, 0 o φC aproxima-se mais da dinâmica do φR fazendo com que o valor dadiferença de fase (Ψ) seja mais pequeno.

0 1 2 3 4 5 6−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

tempo (s)

Rad

sin(φR)

sin(φC) (K

C = 2)

(a) KC = 2

0 1 2 3 4 5 6−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

tempo (s)

Rad

sin(φR)

sin(φC) (K

C = 4)

(b) KC = 4

0 1 2 3 4 5 6−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

tempo (s)

Rad

sin(φR)

sin(φC) (K

C = 6)

(c) KC = 6

0 1 2 3 4 5 6−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

tempo (s)

Rad

sin(φR)

sin(φC) (K

C = 9)

(d) KC = 9

Figura 3.8: Variação do sin(φC) e sin(φR) de acordo com a variação da constante de acoplamento KC.

Estes resultados indicam que um valor forte de acoplamento é necessário para obter oefeito desejado. Infelizmente, um valor alto de acoplamento levanta outras questões. Comose pode ver na equação 3.15 um valor alto de KC dá menos importância à frequência docontrolador ωC, visto que KR = 0.

Page 55: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

Capítulo 4

Geração da Locomoção

Neste capítulo é explicada a abordagem para o controlo da locomoção bípede que usa o osci-lador acoplado apresentado no capítulo 3.2. Este oscilador é utilizado para modular padrõessinusoidais que vão gerar trajectórias adequadas ao estado actual do andar do robô. Assim,o objectivo de usar o modelo do oscilador de fase acoplado é sincronizar padrões periódicosgerados pelo controlador com a dinâmica do robô. Aqui é explicado o cálculo da fase dorobô e o modo como se procede à sincronização dos padrões periódicos do controlador coma mesma.

4.1 Aplicação do Modelo do Oscilador Acoplado

Para descrever a componente rítmica da marcha do robot é usado o sistema de osciladoresdo capítulo 3.2 composto pelas equações 4.1 e 4.2 que modelam a fase do controlador φC, ea fase do robô φR.

φC = ωC + KC sin(φR − φC) (4.1)

φR = ωR + KR sin(φC − φR) (4.2)

Onde ωC é a frequência natural da dinâmica do controlador e ωR a frequência naturalda dinâmica do robot. KC e KR são as constantes de acoplamento do controlador e do robôrespectivamente.

Como explicado no capítulo 3.2 o objectivo é acoplar φC com φR, isto é, a dinâmica docontrolador com a dinâmica do robô. O problema é que não se conseguem obter valoresexactos da dinâmica do robô, nomeadamente a sua frequência natural (ωR) e a sua constantede acoplamento (KR), uma vez que estas dependem da dinâmica do robô, da dinâmica doambiente externo e da interacção entre ambos. Contudo, é possível medir-se a fase do robô,

33

Page 56: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

34 CAPÍTULO 4. GERAÇÃO DA LOCOMOÇÃO

de forma a se poder calcular este valor optou-se então por medir directamente a fase dorobô (φR), conforme descrito a seguir. Assim, sabendo a fase do robô (φR) pode-se aplicar aequação 3.1 para sincronizar a fase do controlador (φC) com a do robô. É então necessáriocalcular a fase do robõ.

4.2 Cálculo da Fase do Robô

Pode-se definir a fase do robô através de uma observação mais atenta do comportamento dorobô. O robô exibe um movimento oscilatório ao andar que pode ser aproximado ao movi-mento oscilatório de um pêndulo invertido. A informação de fase do movimento oscilatórioexibido pelo ângulo do pêndulo pode ser então utilizada para o cálculo da fase do robô.

O robô possui um COM e um COP. O COM é a localização média de toda a massa dosistema. O COP é o ponto, no solo, onde a resultante das forças de reacção do solo actua.Assim, ao olhar para a figura 4.1 pode-se ver a variação da posição do COP (x) do robô, du-rante o seu movimento de locomoção, e estabelecer uma aproximação com o comportamentodo pêndulo invertido. Aqui verifica-se que a posição do COP (x) varia de forma idêntica nocaso do robô e no caso do pêndulo invertido. O pêndulo invertido considerado tem um es-paço de estados definido por X = (x, x, ψR, ψR), onde ψR é o ângulo que o pêndulo faz coma vertical, x é a posição do carrinho (corresponde também ao COP do robô) e ψR e x são assuas velocidades de variação, respectivamente.

Figura 4.1: Aproximação entre os comportamentos do pêndulo invertido e do robô. Na posição (A) orobô encontra-se com o pé esquerdo levantado e o COP tem valor -1. Na posição (B) o robô encontra-se com ambos os pés pousados no solo fazendo com que o COP tenha valor 0. Na posição (C) o robôencontra-se com o pé direito levantado e o COP tem valor 1.

Assim, o robô começa com o valor de posição do COP (x) igual a zero, na posição (B).De seguida começa a transitar para a posição (A) em que se encontra com o pé esquerdolevantado e com a posição do COP (x) no pé direito, isto é, com valor -1. Passa então outra

Page 57: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

4.2. CÁLCULO DA FASE DO ROBÔ 35

vez para a posição (B) e depois para a posição (C), sempre assim num ciclo de locomoçãoem que o COP segue o seguinte padrão de posições (B)(A)(B)(C)(B)(A)(B)...

Olhando com mais pormenor para o comportamento oscilatório do robô e do pênduloinvertido pode-se concluir que quando a posição do COP (x) é -1 (A) a velocidade do COP(x) é nula, uma vez que a variação do COP inverte o seu sentido. Em (B) a velocidade doCOP (x) é maxima e é positiva ou negativa de acordo com o sentido em que essa variaçãoocorre, se de (A) para (C) ou se de (C) para (A). Em (C) a velocidade do COP (x) também ézero já que a variação do COP inverte o seu movimento. Partindo destas deduções pode-setraçar o gráfico da variação da posição do COP (x) em função da velocidade do COP (x) eobtém-se o traçado de uma elipse, da qual o seu formato vai depender da velocidade máximade oscilação do robô (figura 4.2).

Figura 4.2: Gráfico da fase do robô, onde x varia entre -1 e 1 e x tem uma variação dependente davelocidade máxima de oscilação do robô. Quando a posição do COP (x) é -1 (A) a velocidade doCOP (x) é nula, uma vez que a variação do COP inverte o seu sentido. Em (B) a velocidade do COP(x) é maxima e é positiva ou negativa de acordo com o sentido em que essa variação ocorre, se de (A)para (C) ou se de (C) para (A). Em (C) a velocidade do COP (x) também é zero já que a variação doCOP inverte o seu movimento.

A fase do robô (φR) vai ser dada pelo ângulo de fase do gráfico da figura 4.2 faz com asua origem, em cada instante, isto é, a fase do movimento oscilatório do pêndulo e do robot.Este varia no sentido horário e segue a mesma sequência de movimentos da figura 4.1. Para

Page 58: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

36 CAPÍTULO 4. GERAÇÃO DA LOCOMOÇÃO

determinar a fase do robô (φR) analiticamente, basta transformar as coordenadas cartesianasdadas por x e x em coordenadas polares, em que φR é dado pela equação 4.3.

φR = −atan2(x, x) (4.3)

Na equação 4.3 é usado o atan2 porque só assim é possível calcular o arco-tangente paraos quatro quadrantes do gráfico. O tradicional arctan apenas calcula o arco-tangente paradois quadrantes.

4.3 Sincronização de Fase

De forma similar ao trabalho de Morimoto et al. [14], a sincronização entre a fase do robô(φR) e a fase do controlador (φC) é obtida através da utilização de quatro controladores defase (φ1

C, φ2C, φ3

C e φ4C), desfasados π

2 entre si (equação 4.4).

φiC = ωC + KC sin

(φR − φ

iC + αi −

π

3

)αi =

{0,π

2, π,

3π2

}i = {1, 2, 3, 4} (4.4)

O ωC é a frequência natural do controlador, KC é a constante de acoplamento, φC é a faseda dinâmica do controlador e φR é a fase da dinâmica do robô, obtida através da equação 4.3.

Estes controladores de fase são baseados no modelo do oscilador acoplado visto anteri-ormente, introduzindo pequenas alterações à equação teórica 3.1. Uma alteração reside nofacto de adicionarmos um desfazamento de −π3 , que foi sintonizado manualmente de acordocom o comportamento das pernas do robô em relação à variação do COP. A outra altera-ção resulta na obtenção das quatro diferenças de fase, sincronizadas e simétricas, que serãoutilizadas para gerar as trajectórias das juntas das pernas do robô.

A equação de acoplamento (equação 4.4) é matematicamente simples e a sua integra-ção numérica foi feita usando o método de Euler. Este método é relativamente simples enão requer muito esforço computacional. Assim a equação 4.5 é o resultado da integraçãonumérica do oscilador acoplado.

φiC(t + dt) = φi

C(t) +

[ωC + KC sin

(φR(t) − φi

C(t) + αi −π

3

)]dt (4.5)

A única restrição quanto ao uso do método de Euler é o facto de se ter um pequenopasso de integração dt para a obtenção de resultados mais precisos e um bom desempenhosensorial. Caso contrário, nos sensores de pressão, o atraso entre a medição actual e a medi-ção anterior pode ser um problema, uma vez que se pretendem transições suaves e naturais.Assim definiu-se o tempo entre cada iteração da simulação a um milisegundo.

Page 59: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

4.3. SINCRONIZAÇÃO DE FASE 37

Obtêm-se os seguintes quatro controladores de fase, de acordo com a figura 4.3, quecomo em [14] serão usados:

• φ1C e φ2

C para controlar o movimento da perna direita

• φ3C e φ4

C para controlar o movimento da perna esquerda

Figura 4.3: Controladores de fase da perna direita e da perna esquerda numa perspectiva frontal aorobô. Para a perna direita é usado o controlador de fase 1 (φ1

C) e 2 (φ2C). Para a perna esquerda é usado

o controlador de fase 3 (φ3C) e 4 (φ4

C).

De modo a estudar o comportamento oscilatório do sistema e o seu acoplamento foramfeitos testes em Matlab em que a fase do robô (φR) foi imposta. Assim, nestas simulações,os movimentos das juntas do robô não vão influenciar a posição do COP do robô, uma vezque este é imposto por uma onda criada para o efeito. Isto vai permitir fazer uma melhoranálise entre a variação do COP e as ondas geradas para cada junta do robô. Os valores deamplitudes e offset usados foram os de [97]. A posição do COP foi imposta por uma ondaperiódica que varia entre -1 e 1, obtendo-se o gráfico da sua posição (x), velocidade (x) efase do robô (φR) que se encontram na figura 4.4.

A fase do robô (φR) é calculada de acordo com a equação 4.3, em que esta vai indicarem que fase do movimento de locomoção bípede o robô se encontra, para daí se obterem asfases do controlador sincronizadas com esta. A figura 4.4 segue o mesmo padrão de com-portamentos da figura 4.1. O robô começa por pousar a perna direita e levantar a esquerda(posição A), depois pousa a perna esquerda, ficando ambas as pernas no chão (posição B)e por fim mantém a perna esquerda no chão e levanta a direita (posição C), sempre nestasequência.

Assim, para o φR simulado na figura 4.4 e para valores de ωC = 3, 6 rad/s e KC = 9, 4,na figura 4.5 pode-se observar o comportamento dos controladores de fase (φ1

C, φ2C, φ3

C e φ4C).

Page 60: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

38 CAPÍTULO 4. GERAÇÃO DA LOCOMOÇÃO

0 1 2 3 4 5 6

−20

−10

0

10

20

tempo (s)

x

dx/dt

0 1 2 3 4 5 6−4

−2

0

2

tempo (s)

x

φR

A B C B A B C B A B C

Figura 4.4: Comparação entre o COP (x), a sua velocidade de variação ( dxdt = x) e a fase do robô

(φR).

Como se pode ver o robô começa na posição (A) com o COP igual a -1, passa por uma faseintermédia em que o COP passa por zero, na posição (B) e depois passa para a posição (C)em que o COP é igual a 1 e segue a mesma sequência de movimentos vista anteriormente.Quando a posição do COP (x) pára na borda externa do pé, a fase do robô detectada faz afase do controlador abrandar. Este fenómeno faz com que a fase de apoio seja mais longa etorna assim a locomoção bípede possível.

0 1 2 3 4 5 6−10

−5

0

5

10

x

dx/dt

A B C B A B C B A B C

0 1 2 3 4 5 6−5

0

5

10

15

20

tempo (s)

Gra

us

φc1

φc2

φc3

φc4

φR

Figura 4.5: Controladores de fase (φ1C, φ2

C, φ3C e φ4

C). O robô começa na posição (A) com o COPigual a -1, passa por uma fase intermédia em que o COP passa por zero, na posição (B) e depois passapara a posição (C) em que o COP é igual a 1. Quando a posição do COP (x) pára na borda externa dopé, a fase do robô detectada faz a fase do controlador abrandar.

Embora o modelo dos osciladores acoplados descreva a componente rítmica da marcha,não dá nenhuma indicação sobre os ângulos desejados para as articulações das pernas. Entãoo próximo passo é gerar as trajectórias de cada uma das articulações partindo dos quatro

Page 61: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

4.4. GERAÇÃO DOS MOVIMENTO BÍPEDES 39

diferentes controladores de fase. Cada perna do robô segue uma trajectória específica, que égerada através de funções sinusoidais simples.

4.4 Geração dos Movimento Bípedes

Para que o robô comece o seu processo de locomoção é necessário que este comece a fa-zer pequenas movimentações intermédias (balanço, stepping e locomoção bípede) que maistarde, em simultâneo irão fazer com que este comece a andar. Segundo [14] para que o robôconsiga andar é necessário que comece por movimentos graduais, em que primeiro transfereo seu COP de uma perna para a outra (balanço). De seguida levantar uma das pernas alter-nadamente enquanto balança (stepping). Por fim a perna de suporte tem de se mover paratrás de modo a empurrar o robô para a frente, enquanto a perna de balanço se move para afrente (locomoção bípede). Assim, nesta secção é descrita a geração destes três movimentosnecessárias à locomoção bípede do robô.

4.4.1 Movimento de Balanço

O movimento de balanço será o primeiro a ser descrito, no qual o robô começa a balançardo lado esquerdo para o lado direito e vice-versa, transferindo o COP periodicamente deuma perna para a outra, mas sem nunca levantar as pernas. O robô começa com o COPpositivo quando está inclinado para o lado direito, depois passa por uma fase de transiçãoem que o COP é zero e quando está inclinado para o lado esquerdo o COP é negativo,sendo este movimento periódico. De notar que o COP neste caso pode não chegar ao seumáximo negativo/positivo -1 e 1, respectivamente, uma vez que o robô não chega a levantaros pés do chão. Este movimento pode ser visto na figura 4.6 em que se vizualizam as juntasenvolvidas, numa perspectiva frontal ao robô. Este movimento modela o comportamento dopêndulo invertido do corpo do robô, no plano frontal.

Neste movimento está envolvida a junta de roll da anca (θhipR) e a junta de roll do torno-zelo (θankleR) do robô. As equações de balanço que são geradas para as juntas da perna direitae esquerda neste movimento são as mesmas, e são dadas pelas equações 4.6 e 4.7.

θhipR(φC) = AhipR sin(φ1C) (4.6)

θankleR(φC) = AankleR sin(φ1

C −π

2

)(4.7)

Onde AhipR e AankleR indicam a amplitude máxima dos movimentos e φ1C é o primeiro

controlador de fase. De notar que a equação 4.7 é ligeiramente diferente da equação usadano artigo de Morimoto et al. [14], uma vez que foi adicionado um desfasamento de −π2 . Isto

Page 62: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

40 CAPÍTULO 4. GERAÇÃO DA LOCOMOÇÃO

Figura 4.6: Perspectiva frontal e juntas envolvidas no movimento de balanço (θhipR e θankleR).

foi feito porque não se conseguiu obter um movimento de balanço estável com as equaçõesoriginais e assim foi feita uma sintonização manual das mesmas.

Assim, utilizando o COP imposto anteriormente e para valores de AhipR = 3, 0 e AankleR =

7, 5 pode-se observar os valores gerados para as juntas θhipR e θankleR , no movimento de ba-lanço (figura 4.7). Como existe acoplamento a frequência dos movimentos das juntas é amesma que a frequência do COP. Observa-se também que θhipR encontra-se desfasado π

2 deθankleR .

0 1 2 3 4 5 6−10

−5

0

5

10

x

dx/dt

A B C B A B C B A B C

0 1 2 3 4 5 6−8

−6

−4

−2

0

2

4

6

8

tempo (s)

Gra

us

θhip

R

θankle

R

Figura 4.7: Valores das juntas gerados no movimento de balanço (θhipR e θankleR). θhipR encontra-sedesfasado π

2 de θankleR . Como existe acoplamento a frequência dos movimentos das juntas é a mesmaque a frequência do COP (x).

No caso de desacoplar o sistema, isto é, KC = 0 os valores enviados para as juntas

Page 63: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

4.4. GERAÇÃO DOS MOVIMENTO BÍPEDES 41

seriam os que se encontram na figura 4.8. Como não existe acoplamento a frequência dosmovimentos das juntas é diferente da frequência do COP. Observa-se também que emboranão haja acoplamento, θhipR encontra-se desfasado π

2 de θankleR .

0 1 2 3 4 5 6−10

−5

0

5

10

x

dx/dt

A B C B A B C B A B C

0 1 2 3 4 5 6−8

−6

−4

−2

0

2

4

6

8

tempo (s)

Gra

us

θhip

R

θankle

R

Figura 4.8: Valores das juntas gerados no movimento de balanço (θhipR e θankleR) para o sistemadesacoplado. θhipR encontra-se desfasado π

2 de θankleR . Como não existe acoplamento a frequência dosmovimentos das juntas é diferente da frequência do COP (x).

De notar o facto de que quando o sistema está desacoplado a frequência da trajectóriadesejada das juntas é diferente da frequência de variação do COP. Já quando existe acopla-mento a frequência da trajectória desejada das juntas tem tendência a adaptar-se à frequênciado COP, isto é, a trajectória desejada das juntas é modulada pelo acoplamento com a fase dadinâmica do robô (φR). Esta trajectória modulada torna o movimento de balanço possível.

Tem de ser ter em atenção que as fases do controlador vão ser aplicadas nos movimentosdas juntas. Os movimentos das juntas por sua vez vão influenciar a posição do COP. Estasequência encadeada de acontecimentos não se verifica aqui já que o COP é fixo e imposto enão é influenciado pelas juntas do robô.

4.4.2 Movimento de Stepping

O movimento de stepping em adição ao movimento de balanço vai fazer com que o robôpara além de balançar, flexione uma das pernas levantando-a no ar. Neste movimento orobô permanece no mesmo sítio, apenas levanta uma das pernas alternadamente enquantobalança. Este movimento pode ser visto na figura 4.9(a) em que se vêem as juntas adicionaisenvolvidas neste movimento, numa perspectiva lateral ao robô. Na figura 4.9(b) pode-se vero movimento de stepping efectuado pelo robô numa perspectiva frontal a este.

Neste movimento, para além das juntas de balanço descritas anteriormente, está envol-vida a junta de pitch da anca (θhipP), a junta de pitch do joelho (θkneeP) e a junta de pitch do

Page 64: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

42 CAPÍTULO 4. GERAÇÃO DA LOCOMOÇÃO

(a) Perspectiva lateral (b) Perspectiva frontal

Figura 4.9: Juntas envolvidas no movimento de stepping (θhipR , θankleR , θhipP , θkneeP e θankleP).

tornozelo (θankleP) do robô. Neste caso as equações que são geradas para as juntas do robôsão as equações de balanço mais as equações de stepping, descritas a seguir. As equações destepping para a perna direita e para a perna esquerda vão ser mesmas, com a única diferençaa residir no facto de que para a perna direita é usado o primeiro controlador de fase (φ1

C) epara a perna esquerda é usado o terceiro controlador de fase (φ3

C) como em [14]. Isto porqueo robô levanta as duas pernas alternadamente, logo a perna direita vai estar em anti-fase coma perna esquerda levando ao uso de de dois controladores de fase desfasados π entre si.

Assim para a perna direita são usadas as equações 4.8, 4.9 e 4.10 com o controlador defase φ1

C.

θhipP(φC) = AP sin(φ1C) + θres

hipP(4.8)

θkneeP(φC) = −2AP sin(φ1C) + θres

kneeP(4.9)

θankleP(φC) = AP sin(φ1C) + θres

ankleP(4.10)

Já para a perna esquerda são usadas as mesmas equações, mas com o controlador defase φ3

C em vez do φ1C. Onde AP é a amplitude máxima dos movimentos, φ1

C é o primeirocontrolador de fase (perna direita) e φ3

C é o terceiro controlador de fase (perna esquerda).Assim neste movimento a perna direita e a perna esquerda vão ter um desfasamento de π,uma da outra, fazendo com que quando uma perna estiver no ar a outra esteja no solo. θres

hipP,

Page 65: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

4.4. GERAÇÃO DOS MOVIMENTO BÍPEDES 43

θreskneeP

e θresankleP

são as posições de descanso (posições das juntas que fazem com que o robôfique de pé parado) da junta de pitch da anca, da junta de pitch do joelho e da junta de pitch

do tornozelo, respectivamente.

Continuando a sequência de simulações efectuadas anteriormente para valores de Ap =

3, 5, θreshipP

= −21◦, θreskneeP

= 40◦ e θresankleP

= −19◦ na figura 4.10 podemos observar os valoresenviados para as juntas da perna direita (θhipR , θankleR , θhipP ,θkneeP e θankleP), no movimento destepping. Como existe acoplamento a frequência dos movimentos das juntas é a mesma quea frequência do COP. Observa-se também que θhipP , θkneeP e θankleP encontram-se em fase.

0 1 2 3 4 5 6−10

−5

0

5

10

x

dx/dt

A B C B A B C B A B C

0 1 2 3 4 5 6−30

−20

−10

0

10

20

30

40

50

tempo (s)

Gra

us

θhip

R

θankle

R

θhip

P

θknee

P

θankle

P

Figura 4.10: Valores das juntas gerados no movimento de stepping da perna direita (θhipR , θankleR ,θhipP , θkneeP e θankleP). θhipP , θkneeP e θankleP encontram-se em fase. Como existe acoplamento a frequên-cia dos movimentos das juntas é a mesma que a frequência do COP (x).

No caso de desacoplar o sistema, isto é, KC = 0 os valores enviados para as juntasseriam os que se encontram na figura 4.11. Como não existe acoplamento a frequência dosmovimentos das juntas é diferente da frequência do COP. Observa-se também que emboranão haja acoplamento, θhipP , θkneeP e θankleP encontram-se em fase.

4.4.3 Movimento de Locomoção Bípede

No movimento de locomoção bípede o robô move-se para a frente de forma a começar acaminhar. Para isto acontecer é necessário manter os movimentos anteriores de balanço estepping e acrescentar novos elementos ao movimento de stepping. O objectivo é que aperna de suporte se mova para trás de modo a empurrar o robô para a frente, enquanto aperna de balanço se move para a frente. Para este movimento são usadas as juntas θhipR ,θankleR , θhipP , θkneeP e θankleP usadas no movimento de stepping.

Page 66: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

44 CAPÍTULO 4. GERAÇÃO DA LOCOMOÇÃO

0 1 2 3 4 5 6−10

−5

0

5

10

x

dx/dt

A B C B A B C B A B C

0 1 2 3 4 5 6−30

−20

−10

0

10

20

30

40

50

tempo (s)

Gra

us

θhip

R

θankle

R

θhip

P

θknee

P

θankle

P

Figura 4.11: Valores das juntas gerados no movimento de stepping da perna direita (θhipR , θankleR ,θhipP , θkneeP e θankleP) para o sistema desacoplado. θhipP , θkneeP e θankleP encontram-se em fase. Comonão existe acoplamento a frequência dos movimentos das juntas é diferente da frequência do COP(x).

Assim, para este movimento, tal como em [14], as equações de balanço 4.6 e 4.7 mantêm-se. A equação de stepping 4.9 também se mantém. Já as equações de stepping 4.8, 4.10, sãosubstituídas pelas equações 4.11 e 4.12, para a perna direita.

θhipP(φC) = AhipS sin(φ2

C −π

2

)+ AP sin(φ1

C) + θreshipP

(4.11)

θankleP(φC) = −AankleS sin(φ2

C −π

2

)+ AP sin(φ1

C) + θresankleP

(4.12)

Para a perna esquerda são usadas as mesmas equações, mas com o controlador de fase φ4C

em vez do φ2C e o controlador de fase φ3

C em vez do φ1C. Equações essas onde AhipS e AankleS

são as amplitudes dos movimentos e φ2C (perna direita) e φ4

C (perna esquerda) são o segundoe o quarto controladores de fase, respectivamente. É de notar que as equações 4.11 e 4.12resultam das equações de stepping (4.8 e 4.10), às quais foi acrescentado um membro extra.Esse membro extra é ligeiramente diferente do usado no artigo de Morimoto et al. [14], umavez que foi adicionado um desfasamento de −π2 . Isto foi feito porque não se conseguiu obterum movimento de locomoção bípede estável com as equações originais e assim foi feita umasintonização manual das mesmas.

Finalmente e na sequência de simulações efectuadas anteriormente para valores de AhipS =

11, 5 e AankleS = 9, 1 na figura 4.12 pode-se observar os valores enviados para as juntas daperna direita (θhipR , θankleR , θhipP ,θkneeP e θankleP), no movimento de locomoção bípede. Comoexiste acoplamento a frequência dos movimentos das juntas é a mesma que a frequência do

Page 67: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

4.4. GERAÇÃO DOS MOVIMENTO BÍPEDES 45

COP.

0 1 2 3 4 5 6−10

−5

0

5

10

x

dx/dt

A B C B A B C B A B C

0 1 2 3 4 5 6−40

−30

−20

−10

0

10

20

30

40

50

tempo (s)

Gra

us

θhip

R

θankle

R

θhip

P

θknee

P

θankle

P

Figura 4.12: Valores das juntas gerados no movimento de locomoção bípede da perna direita (θhipR ,θankleR , θhipP ,θkneeP e θankleP). Como existe acoplamento a frequência dos movimentos das juntas é amesma que a frequência do COP (x).

No caso de desacoplar o sistema, isto é, KC = 0 os valores enviados para as juntasseriam os que se encontram na figura 4.13. Como não existe acoplamento a frequência dosmovimentos das juntas é diferente da frequência do COP.

Page 68: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

46 CAPÍTULO 4. GERAÇÃO DA LOCOMOÇÃO

0 1 2 3 4 5 6−10

−5

0

5

10

x

dx/dt

A B C B A B C B A B C

0 1 2 3 4 5 6−40

−30

−20

−10

0

10

20

30

40

50

tempo (s)

Gra

us

θhip

R

θankle

R

θhip

P

θknee

P

θankle

P

Figura 4.13: Valores das juntas gerados no movimento de locomoção bípede da perna direita (θhipR ,θankleR , θhipP ,θkneeP e θankleP) para o sistema desacoplado. Como não existe acoplamento a frequênciados movimentos das juntas é diferente da frequência do COP (x).

Page 69: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

Capítulo 5

Simulação da Locomoção

Neste capítulo são feitas algumas considerações quanto à implementação da locomoção bí-pede no simulador Webots (Versão 6.3.4) e são apresentados os resultados das simulações.Primeiro é feita uma breve descrição do Webots e é explicado o cálculo do COP através dossensores de pressão colocados nos pés do robô. De seguida são definidos os parâmetros dassimulações e são efectuadas as simulações para o robô HOAP-2 da Fujitsu Automation epara o robô NAO da Aldebaran Robotics. Por fim é feita uma exploração de parâmetros parao caso específico do robô HOAP-2 de modo a se obter uma locomoção mais estável.

5.1 Implementação no Simulador Webots

Nesta secção, primeiro é feita uma breve descrição do software de simulação Webots. Sãotambém feitas pequenas considerações sobre a implementação da locomoção bípede no si-mulador Webots. Para o cálculo do COP dos robôs foram usados quatro sensores de pressãoem cada pé. Foram aqui definidas também as posturas iniciais e de descanso de cada juntados robôs.

5.1.1 Webots

A plataforma Webots foi desenvolvida pela Cyberbotics e é um software de simulação ro-bótica para modelar, programar e simular diferentes tipos de robôs (robôs com rodas, robôscom pernas ou robôs que voam). Este simulador fornece várias propriedades importantespara modelar a forma, a cor, a massa, a fricção, a densidade, entre outros. Para além disso,é possível transferir o código desenvolvido para o robô real. O simulador Webots é baseadono Open Dynamics Engine (ODE), um excelente e poderoso motor de física open source

que funciona como uma biblioteca para fornecer simulações mais realísticas e melhorar osresultados.

47

Page 70: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

48 CAPÍTULO 5. SIMULAÇÃO DA LOCOMOÇÃO

5.1.2 Sensores de Pressão

Para sincronizar a fase do robô (φR) com a fase do controlador (φC) apenas a informação dossensores de pressão é usada. Estes são usados para detectar a a dinâmica do robô, dandouma medição precisa da mesma. Essa precisão pode também ser usada para uma melhorestabilização do robô. A versão do Webots usada (Versão 6.3.4), permite a modelizaçãodirecta dos sensores de pressão, sem ser necessária a utilização de uma biblioteca de físicacustomizada para o efeito.

Cada pé, quer do HOAP-2 quer do NAO, está equipado com quatro sensores de pressão.No caso do HOAP-2 os sensores encontram-se posicionados de acordo com a figura 6.3,seguindo no NAO a mesma configuração.

Figura 5.1: Esquemático da sola dos pés do HOAP-2 com os quatro sensores de força em cada pé.

A cada simulação a pressão é medida pelos sensores e enviada para o controlador. Apartir desta informação, pode ser calculado o peso do robô e a posição do COP. Pelo que foiobservado os resultados dos sensores de pressão são precisos, uma vez que, por exemplo, nocaso do HOAP-2 o seu peso é de 7,2 kg, que corresponde ao verificado na figura 5.2. Nafigura pode-se discernir sobre os passos efectuados pelo robô e o peso medido correspondeà realidade.

5.1.3 Detecção do Centro de Pressão (COP)

Para o cálculo da posição do COP (x) começa-se por somar a força exercida em cada umdos quatro sensores de pressão colocados em cada um dos pés do robô como se pode ver nasequações 5.1 e 5.2.

FEsq. = FEsq.FD + FEsq.FE + FEsq.TD + FEsq.TE (5.1)

Page 71: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

5.1. IMPLEMENTAÇÃO NO SIMULADOR WEBOTS 49

0 1000 2000 3000 4000 5000 60000

1

2

3

4

5

6

7

8

9

10

Pes

o (K

g)

tempo (ms)

Figura 5.2: Peso do robô HOAP-2 no pé direito durante a locomoção, onde se pode confirmar o pesode 7,2 kg do HOAP-2.

FDir. = FDir.FD + FDir.FE + FDir.TD + FDir.TE (5.2)

Onde FEsq.FD, FEsq.FE, FEsq.TD e FEsq.TE são as forças, em Newtons, exercidas nos quatrosensores do pé esquerdo. Já FDir.FD, FDir.FE, FDir.TD e FDir.TE são as forças, em Newtons,exercidas nos quatro sensores do pé direito.

De seguida calcula-se propriamente a posição do COP (x) através da diferença entre osvalores dos sensores de pressão da perna esquerda (FEsq.) e da perna direita (FDir.) e se dividepela soma de ambos.

x(t) =

(FEsq. − FDir.

FEsq. + FDir.

)(5.3)

Esta equação fornece um valor de x entre -1 e 1 (equação 5.3). Optou-se por fazer estanormalização, em que não se obtém o valor real da posição do COP mas sim um valor quevaria entre -1 e 1, uma vez que aqui o que é importante não é a posição absoluta do COP,mas as transições de movimentos que ocorrem.

Para determinar o valor da velocidade do COP (x), subtrai-se ao valor de x actual (x(t))o valor de x anterior (x(t − dt)) e divide-se pelo tempo que decorreu entre as duas medidas(dt), obtendo assim a sua velocidade de variação (equação 5.4).

x(t) =x(t) − x(t − dt)

dt(5.4)

Ambos os valores, quer de posição do COP (x) quer de velocidade do COP (x) sãodepois aplicados na determinação da fase do robô (φR) como foi dito anteriormente usandoa equação 5.5.

Page 72: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

50 CAPÍTULO 5. SIMULAÇÃO DA LOCOMOÇÃO

φR(t) = −atan2(x(t), x(t)) (5.5)

5.1.4 Postura Inicial e de Descanso

A postura de descanso é definida como o valor do ângulo médio de cada junta controlada, àvolta da qual o oscilador funciona. Neste controlador, é modelizada por simples offsets nospadrões sinusoidais (θres), que facilitam a adaptação a diferentes posturas de descanso (rest).Um humano normalmente adopta uma postura de caminhada direita sem dobrar as pernas,no entanto isto é diferente para os robôs humanóides. Nas juntas artificiais, o ângulo dojoelho vai oscilar entre os 30◦ e os 45◦, então a perna vai estar sempre ligeiramente dobrada.Isto ajuda a estabilizar a dinâmica do pêndulo invertido do robô, uma vez que vai baixar ocentro de massa do robô. Para produzir um movimento mais realista, tenta-se manter estesoffsets o mais baixos possível. A postura de descanso escolhida tem uma grande influência naestabilidade do robô, onde uma pequena alteração pode influenciar fortemente os resultadosobtidos. Assim foram definidos os offsets da tabela 5.1. Estes offsets foram baseados nos de[97] e ajustados por tentativa e erro.

Tabela 5.1: Ângulos de offset para cada junta do robô.

Junta Ânguloθres

hipP−20◦

θreskneeP

40◦

θresankleP

−20◦

θresshoulderP

0◦

θreselbowP

90◦

Neste caso específico, na posição inicial das juntas foram usados os mesmos valores deoffset da postura de descanso. É importante que o robô comece numa posição inicial estável,para os resultados da simulação não serem influenciados por perturbações iniciais.

5.2 Parâmetros

O modelo do oscilador acoplado foi implementado na ferramenta de simulação Webots emdois robôs bípedes, o HOAP-2 e o NAO, para todas as simulações foram usados os parâme-tros da tabela 5.2. Estes parâmetros foram sintonizados manualmente, sendo necessária umaexploração de parâmetros para a sua optimização.

Page 73: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

5.3. SIMULAÇÃO DO HOAP-2 51

Tabela 5.2: Parâmetros de simulação dos robôs.

Parâmetro HOAP-2 NAOωC 3, 6 rad/sKC 9, 4

AhipR 3, 0◦

AankleR 5, 5◦

AP 2, 0◦

AhipS 11, 0◦ 8, 0◦

AankleS45 AhipS = 8, 8◦ 4

5 AhipS = 6, 4◦

5.3 Simulação do HOAP-2

Nesta secção são mostradas as simulações efectuadas, no ambiente de simulação Webots,dos movimentos de balanço e locomoção bípede com o robô HOAP-2.

5.3.1 Movimento de Balanço

Para esta simulação o objectivo é controlar o movimento de balanço do robô HOAP-2 (figura5.3).

Figura 5.3: Movimento de balanço do robô HOAP-2.

Na figura 5.4 pode-se ver a soma dos sensores de cada pé, o COP (x), a velocidade devariação do COP (x) e a fase do robô (φR). O comportamento observado é o esperado jáque o robô ao balançar transfere o seu COP de uma perna para a outra, mas sem nuncalevantar uma delas. A fase do robô varia dentro dos parâmetros esperados embora seja muitoinconstante.

Na figura 5.5 pode-se ver as juntas actuadas neste caso (θhipR e θankleR). De notar que asduas ondas têm um desfasamento entre si de π

2 de acordo com o esperado. As ondas sãoquase sinusoidais e praticamente sem deformações. Como existe acoplamento a frequênciados movimentos das juntas é a mesma que a frequência do COP. Este ajuste de frequênciadas ondas das juntas de modo a que se encontrem sincronizadas com o COP pode provocarpequenas deformações nas mesmas.

Page 74: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

52 CAPÍTULO 5. SIMULAÇÃO DA LOCOMOÇÃO

0 1000 2000 3000 4000 5000 60000

100

Sen

sor E

(N

)

0 1000 2000 3000 4000 5000 60000

100

Sen

sor D

(N

)

0 1000 2000 3000 4000 5000 6000−1

0

1

x0 1000 2000 3000 4000 5000 6000

−5000

500

x

0 1000 2000 3000 4000 5000 6000

−202

φ R (

Rad

)

tempo (ms)

Figura 5.4: Resultados obtidos de x, x e φR no movimento de balanço do HOAP-2. O comportamentoobservado é o esperado já que o robô ao balançar transfere o seu COP de uma perna para a outra, massem nunca levantar uma delas. A fase do robô varia dentro dos parâmetros esperados embora sejamuito inconstante.

0 1000 2000 3000 4000 5000 6000−6

−4

−2

0

2

4

6

tempo (ms)

Gra

us

θ

hipR

θankle

R

Figura 5.5: Resultados obtidos das juntas θhipR e θankleR no movimento de balanço do HOAP-2. Comoexiste acoplamento a frequência dos movimentos das juntas é a mesma que a frequência do COP, esteajuste de frequência das ondas das juntas de modo a que se encontrem sincronizadas com o COP podeprovocar pequenas deformações nas mesmas.

5.3.2 Movimento de Locomoção Bípede

Para esta simulação o objectivo é controlar o movimento de locomoção bípede do robôHOAP-2 (figura 5.6).

Na figura 5.7 pode-se ver a soma dos sensores de cada pé, o COP (x), a velocidade devariação do COP (x) e a fase do robô (φR), no caso do sistema estar acoplado e no casodo sistema estar desacoplado (KC = 0). Na figura 5.7(a) o comportamento observado éo esperado já que neste movimento o robô começa realmente a andar e pousa uma pernade cada vez no chão, alternadamente. Neste caso a onda do COP é praticamente quadradacom valores entre -1 e 1. A fase do robô varia dentro dos parâmetros esperados e tem umafrequência constante. Na figura 5.7(b) pode-se ver as mesmas variáveis mas no caso de osistema estar desacoplado, isto é, para KC = 0. Neste caso, o robô é incapaz de levantar

Page 75: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

5.3. SIMULAÇÃO DO HOAP-2 53

Figura 5.6: Movimento de locomoção bípede do robô HOAP-2.

alternadamente cada um dos pés do chão, uma vez que o COP não é uma onda quadrada,dando indícios de o robô estar a arrastar os pés no chão. A fase do robô possui bastanteruído.

0 1000 2000 3000 4000 5000 60000

100

Se

nso

r E (

N)

0 1000 2000 3000 4000 5000 60000

100

Se

nso

r D (

N)

0 1000 2000 3000 4000 5000 6000−1

0

1

x

0 1000 2000 3000 4000 5000 6000

−1000−500

0500

x

0 1000 2000 3000 4000 5000 6000−3−2−1

01

φR

(R

ad

)

tempo (ms)

(a) Sistema Acoplado. Neste caso a onda do COP épraticamente quadrada com valores entre -1 e 1, indi-cando que o robô começa realmente a andar e pousauma perna de cada vez no chão. A fase do robô variadentro dos parâmetros esperados e tem uma frequên-cia constante.

0 1000 2000 3000 4000 5000 60000

50

100

Se

nso

r E (

N)

0 1000 2000 3000 4000 5000 60000

100

Se

nso

r D (

N)

0 1000 2000 3000 4000 5000 6000−1

0

1

x

0 1000 2000 3000 4000 5000 6000

−2000

200

x

0 1000 2000 3000 4000 5000 6000

−202

φR

(R

ad

)

tempo (ms)

(b) Sistema Desacoplado. Neste caso o robô é inca-paz de levantar alternadamente cada um dos pés dochão. A fase do robô possui bastante ruído.

Figura 5.7: Resultados obtidos de x, x e φR no movimento de locomoção bípede do HOAP-2.

Na figura 5.8 é feita uma comparação entre a fase do robô (φR) e os controladores defase (φ1

C, φ2C, φ3

C e φ4C). Este gráfico encontra-se de acordo com aquilo que foi simulado

matematicamente, uma vez que os controladores de fase têm uma ondulação com a mesmafrequência da fase do robô. É de notar também o desfasamento de π

2 entre cada um doscontroladores de fase.

Na figura 5.9 pode-se ver as juntas, da perna direita (θhipR , θankleR , θhipP , θkneeP e θankleP), nocaso do sistema estar acoplado e no caso do sistema estar desacoplado (KC = 0). Na figura5.9(a) as quatro ondas têm um desfasamento entre si de acordo com as ondas esperadas.Neste caso as ondas não são completamente sinusoidais devido ao acoplamento que as obriga

Page 76: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

54 CAPÍTULO 5. SIMULAÇÃO DA LOCOMOÇÃO

1000 1500 2000 2500 3000−3−2−1

01

φ R (

Rad

)

tempo (ms)

1000 1500 2000 2500 30005

10

15

20

25

tempo (ms)

Rad

φ

c1

φc2

φc3

φc4

Figura 5.8: Resultados obtidos de φR e φ1C, φ2

C, φ3C e φ4

C no movimento de locomoção bípede doHOAP-2. Os controladores de fase têm uma ondulação com a mesma frequência da fase do robô etêm um desfasamento de π

2 entre si.

a estar sincronizadas com a fase do robô. Na figura 5.9(b) pode-se ver as mesmas variáveismas no caso de o sistema estar desacoplado, isto é, para KC = 0. Neste caso as ondas sãocompletamente sinusoidais uma vez que não existe acoplamento com a fase do robô, ou seja,têm uma frequência diferente da frequência da fase do robô.

0 1000 2000 3000 4000 5000 6000−40

−30

−20

−10

0

10

20

30

40

50

tempo (ms)

Gra

us

θ

hipR

θankle

R

θhip

P

θknee

P

θankle

P

(a) Sistema Acoplado. Neste caso as quatro ondastêm um desfasamento entre si de acordo com as on-das esperadas. As ondas não são completamente sinu-soidais devido ao acoplamento que as obriga a estarsincronizadas com a fase do robô.

0 1000 2000 3000 4000 5000 6000−40

−30

−20

−10

0

10

20

30

40

50

tempo (ms)

Gra

us

θ

hipR

θankle

R

θhip

P

θknee

P

θankle

P

(b) Sistema Desacoplado. Neste caso as ondas sãocompletamente sinusoidais uma vez que não existeacoplamento com a fase do robô, ou seja, têm umafrequência diferente da frequência da fase do robô.

Figura 5.9: Resultados obtidos das juntas θhipR , θankleR , θhipP , θkneeP e θankleP no movimento de loco-moção bípede do HOAP-2.

5.4 Simulação do NAO

Nesta secção são mostradas as simulações efectuadas, no ambiente de simulação Webots,dos movimentos de balanço e locomoção bípede com o robô NAO.

Page 77: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

5.4. SIMULAÇÃO DO NAO 55

5.4.1 Movimento de Balanço

Para esta simulação o objectivo é controlar o movimento de balanço do robô NAO (figura5.10).

Figura 5.10: Movimento de balanço do robô NAO.

Na figura 5.11 pode-se ver a soma dos sensores de cada pé, o COP (x), a velocidade devariação do COP (x) e a fase do robô (φR). O comportamento observado é o esperado já queo robô ao balançar transfere o seu COP de uma perna para a outra, mas sem nunca levantaruma delas. De notar o facto de que em relação ao HOAP-2 o movimento de balanço doNAO não é tão evidente uma vez que existe menor variação entre os extremos positivos enegativos do COP. A fase do robô varia dentro dos parâmetros esperados embora seja muitoinconstante.

0 1000 2000 3000 4000 5000 60000

5

Sen

sor E

(N

)

0 1000 2000 3000 4000 5000 60000

5

Sen

sor D

(N

)

0 1000 2000 3000 4000 5000 6000−1

0

1

x

0 1000 2000 3000 4000 5000 6000−1000

010002000

x

0 1000 2000 3000 4000 5000 6000

−202

φ R (

Rad

)

tempo (ms)

Figura 5.11: Resultados obtidos de x, x e φR no movimento de balanço do NAO. O comportamentoobservado é o esperado já que o robô ao balançar transfere o seu COP de uma perna para a outra, massem nunca levantar uma delas. A fase do robô varia dentro dos parâmetros esperados embora sejamuito inconstante.

Na figura 5.12 pode-se ver as juntas actuadas neste caso (θhipR e θankleR). De notar queas duas ondas têm um desfasamento entre si de π

2 de acordo com o esperado. As ondas sãoquase sinusoidais e praticamente sem deformações. Como existe acoplamento a frequência

Page 78: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

56 CAPÍTULO 5. SIMULAÇÃO DA LOCOMOÇÃO

dos movimentos das juntas é a mesma que a frequência do COP. Este ajuste de frequênciadas ondas das juntas de modo a que se encontrem sincronizadas com o COP pode provocarpequenas deformações nas mesmas, deformações essas que parecem mais evidentes nestecaso, com o NAO, do que com o HOAP-2.

0 1000 2000 3000 4000 5000 6000−6

−4

−2

0

2

4

6

tempo (ms)

Gra

us

θ

hipR

θankle

R

Figura 5.12: Resultados obtidos das juntas θhipR e θankleR no movimento de balanço do NAO. Comoexiste acoplamento a frequência dos movimentos das juntas é a mesma que a frequência do COP, esteajuste de frequência das ondas das juntas de modo a que se encontrem sincronizadas com o COP podeprovocar pequenas deformações nas mesmas.

5.4.2 Movimento de Locomoção Bípede

Para esta simulação o objectivo é controlar o movimento de locomoção bípede do robô NAO(figura 5.13).

Figura 5.13: Movimento de balanço do robô NAO.

Na figura 5.14 pode-se ver a soma dos sensores de cada pé, o COP (x), a velocidadede variação do COP (x) e a fase do robô (φR), no caso do sistema estar acoplado e no casodo sistema estar desacoplado (KC = 0). Na figura 5.14(a) o comportamento observado éo esperado já que neste movimento o robô começa realmente a andar e pousa uma pernade cada vez no chão, alternadamente. Neste caso a onda do COP é praticamente quadrada

Page 79: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

5.4. SIMULAÇÃO DO NAO 57

com valores entre -1 e 1. Nota-se no entanto uma pequena perturbação transitória entreos 5 segundos e os 6 segundos neste caso com o NAO. A fase do robô varia dentro dosparâmetros esperados e tem uma frequência constante. Na figura 5.14(b) pode-se ver asmesmas variáveis mas no caso de o sistema estar desacoplado, isto é, para KC = 0. Nestecaso, o robô é incapaz de levantar alternadamente cada um dos pés do chão, uma vez queo COP não é uma onda quadrada, dando indícios de o robô estar a arrastar os pés no chão.A fase do robô possui bastante ruído. Este comportamento é idêntico ao observado no robôHOAP-2.

0 1000 2000 3000 4000 5000 60000

5

Se

nso

r E (

N)

0 1000 2000 3000 4000 5000 60000

5

Se

nso

r D (

N)

0 1000 2000 3000 4000 5000 6000−1

0

1

x

0 1000 2000 3000 4000 5000 6000−2000−1000

01000

x

0 1000 2000 3000 4000 5000 6000

−202

φR

(R

ad

)

tempo (ms)

(a) Sistema Acoplado. Neste caso a onda do COP épraticamente quadrada com valores entre -1 e 1, indi-cando que o robô começa realmente a andar e pousauma perna de cada vez no chão. A fase do robô variadentro dos parâmetros esperados e tem uma frequên-cia constante.

0 1000 2000 3000 4000 5000 60000

50

100

Se

nso

r E (

N)

0 1000 2000 3000 4000 5000 60000

100

Se

nso

r D (

N)

0 1000 2000 3000 4000 5000 6000−1

0

1

x

0 1000 2000 3000 4000 5000 6000

−2000

200

x

0 1000 2000 3000 4000 5000 6000

−202

φR

(R

ad

)

tempo (ms)

(b) Sistema Desacoplado. Neste caso o robô é inca-paz de levantar alternadamente cada um dos pés dochão. A fase do robô possui bastante ruído.

Figura 5.14: Resultados obtidos de x, x e φR no movimento de locomoção bípede do NAO.

Na figura 5.15 é feita uma comparação entre a fase do robô (φR) e os controladores defase (φ1

C, φ2C, φ3

C e φ4C). Este gráfico encontra-se de acordo com aquilo que foi simulado

matematicamente, uma vez que os controladores de fase têm uma ondulação com a mesmafrequência da fase do robô. É de notar também o desfasamento de π

2 entre cada um doscontroladores de fase. Este comportamento é idêntico ao observado no robô HOAP-2.

Na figura 5.16 pode-se ver as juntas, da perna direita (θhipR , θankleR , θhipP , θkneeP e θankleP), nocaso do sistema estar acoplado e no caso do sistema estar desacoplado (KC = 0). Na figura5.16(a) as quatro ondas têm um desfasamento entre si de acordo com as ondas esperadas.Neste caso as ondas não são completamente sinusoidais devido ao acoplamento que as obrigaa estar sincronizadas com a fase do robô. Na figura 5.16(b) pode-se ver as mesmas variáveismas no caso de o sistema estar desacoplado, isto é, para KC = 0. Neste caso as ondas sãocompletamente sinusoidais uma vez que não existe acoplamento com a fase do robô, ou seja,têm uma frequência diferente da frequência da fase do robô. Este comportamento é idênticoao observado no robô HOAP-2.

Page 80: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

58 CAPÍTULO 5. SIMULAÇÃO DA LOCOMOÇÃO

1000 1500 2000 2500 3000−3−2−1

01

Rad

tempo (ms)

1000 1500 2000 2500 30005

10

15

20

25

tempo (ms)

Rad

φ

c1

φc2

φc3

φc4

Figura 5.15: Resultados obtidos de φR e φ1C, φ2

C, φ3C e φ4

C no movimento de locomoção bípede doNAO. Os controladores de fase têm uma ondulação com a mesma frequência da fase do robô e têmum desfasamento de π

2 entre si.

0 1000 2000 3000 4000 5000 6000−30

−20

−10

0

10

20

30

40

50

tempo (ms)

Gra

us

θ

hipR

θankle

R

θhip

P

θknee

P

θankle

P

(a) Sistema Acoplado. Neste caso as quatro ondastêm um desfasamento entre si de acordo com as on-das esperadas. As ondas não são completamente sinu-soidais devido ao acoplamento que as obriga a estarsincronizadas com a fase do robô.

0 1000 2000 3000 4000 5000 6000−40

−30

−20

−10

0

10

20

30

40

50

tempo (ms)

Gra

us

θ

hipR

θankle

R

θhip

P

θknee

P

θankle

P

(b) Sistema Desacoplado. Neste caso as ondas sãocompletamente sinusoidais uma vez que não existeacoplamento com a fase do robô, ou seja, têm umafrequência diferente da frequência da fase do robô.

Figura 5.16: Resultados obtidos das juntas θhipR , θankleR , θhipP , θkneeP e θankleP no movimento delocomoção bípede do NAO.

Page 81: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

Capítulo 6

Estabilidade

Neste capítulo são apresentadas algumas das medidas que permitem quantificar a estabi-lidade da locomoção dos robôs bípedes. A quantificação das medidas de estabilidade vaipossibilitar quer a produção de uma locomoção estável através de realimentação, quer sim-plesmente avaliar a estabilidade do robô durante a locomoção. Através dos critérios de es-tabilidade é possível também acrescentar evoluções a movimentos de locomoção já imple-mentados, em termos de perturbações externas à locomoção, terrenos inclinados e irregula-res, vento, entre outros. A estabilidade é importante nos robôs bípedes. Por exemplo, emtermos de mobilidade permite aos robôs moverem-se de um lado para o outro sem caírem.A estabilidade vai também proporcionar uma maior segurança na interacção dos robôs comas pessoas. Em termos monetários vai trazer poupanças devido ao menor risco de queda dosrobôs.

6.1 Área de Suporte

A área de suporte de um robô bípede numa superfície planar, é definida como o limite con-vexo (convex hull) dos pontos de contacto dos pés do robô com o solo. Na figura 6.1 ospés estão representados por rectângulos onde a zona sombreada é o polígono de suporte. Oscírculos pretos representam os pontos que se encontram em contacto com o solo enquantoos círculos brancos representam pontos que não estão em contacto com o solo. Assim nafigura mais à esquerda ambos os pés estão totalmente apoiados no solo, na figura central opé direito apenas tem a ponta da frente em contacto com o solo. Na figura à direita o péesquerdo é o único que se encontra em contacto com o solo.

Os indicadores de estabilidade são normalmente definidos como pontos no solo que as-seguram a estabilidade do robô desde que estejam dentro da área de suporte.

59

Page 82: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

60 CAPÍTULO 6. ESTABILIDADE

Figura 6.1: Representação da Foot Support Area onde mais à esquerda da figura ambos os pés estãototalmente apoiados, no centro o pé direito apenas tem a ponta da frente apoiada e à direita o péesquerdo é o único em contacto com o solo.

6.2 Medidas de Estabilidade

Nesta secção são apresentadas as medidas de estabilidade implementadas no robô HOAP-2: o COM, o COP, o ZMP e o FRI. Para a descrição destas medidas de estabilidade foramusados os eixos de coordenadas da figura 6.2.

Figura 6.2: Esquemático do robô HOAP-2 com os eixos de coordenadas na posição inicial de partidodo robô. À medida que o robô se vai movendo vai-se afastando gradualmente do centro do referencial.

A origem dos eixos de coordenadas adoptada encontra-se no centro do mundo. Essecentro do mundo encontra-se ao nível do solo na posição inicial de partido do robô. Àmedida que o robô se vai movendo vai-se afastando gradualmente do centro do mundo e

Page 83: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

6.2. MEDIDAS DE ESTABILIDADE 61

consequentemente do centro do referencial.

6.2.1 Centro de Massa (COM)

O COM, é a localização média de toda a massa do sistema. Pode ser calculado pelas equações6.1, 6.2 e 6.3.

xCOM =

∑Ni=0 xCOMi mi∑N

i=0 mi(6.1)

yCOM =

∑Ni=0 yCOMi mi∑N

i=0 mi(6.2)

zCOM =

∑Ni=0 zCOMi mi∑N

i=0 mi(6.3)

Sendo o robô composto por vários segmentos N indicados pelo índice i onde xCOMi ,yCOMi e zCOMi são as posições do COM do segmento i nos eixos x, y e z respectivamente, mi

representa a massa do segmento i.

Para a obtenção das posições do COM de cada segmento em cada instante foi calculadaa cinemática directa de todos os membros do robô. Esse cálculo foi simplificado através douso da biblioteca open source de C++ ROBOOP em conjunto com as funções da cinemática.Esta biblioteca é orientada para a síntese e simulação de modelos de manipuladores robó-ticos e revelou-se bastante útil na obtenção da posição de cada segmento do robô em cadainstante. A posição do COM de cada segmento do corpo do robô poderia também ser obtidadirectamente no Webots, mas neste caso optou-se pelo uso da cinemática directa já que, dasduas, esta seria a única que se poderia aplicar a um robô real. A massa de cada segmentofoi retirada de um relatório de inspecção ao HOAP-2 presente na tese [98] e os seus valoresforam confirmados com os existentes no modelo do HOAP-2 do Webots (versão 6.3.4).

À projecção do COM no solo, ao longo do eixo de gravidade chama-se Projecção doCentro de Massa (PCOM, do inglês Projection of Center of Mass). Como foi consideradoque a origem do referencial se encontra ao nível do solo, para calcular o PCOM basta usar osvalores do COM com a diferença de zCOM = 0. Esta projecção pode também ser usada comoum critério de estabilidade onde o robô é considerado estável enquanto esta se encontrardentro da área de suporte. A locomoção num robô bípede diz-se estável e a sua posturadiz-se equilibrada se o PCOM se encontrar dentro da área de suporte.

Page 84: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

62 CAPÍTULO 6. ESTABILIDADE

6.2.2 Centro de Pressão (COP)

O COP é definido como o ponto no solo onde a resultante das forças de reacção do soloactua. Assim, para se poder calcular o COP é necessário ter acesso às forças aplicadas nospontos de contacto dos pés do robot com o solo. Para isso vão ser usados os quatro sensoresde pressão que o robot HOAP-2 possui em cada pé, mostrados na figura 6.3.

Figura 6.3: Esquemático da sola dos pés do HOAP-2 com os quatro sensores de força em cada pé.

O COP pode ser então aproximado usando as equações 6.4 e 6.5.

xCOP =

∑Ni=0 xqi Fi∑N

i=0 Fi(6.4)

yCOP =

∑Ni=0 yqi Fi∑N

i=0 Fi(6.5)

O robô é composto por 8 sensores de força N indicados pelo índice i, onde xqi e yqi são aposição do sensor i, nos eixos x e y respectivamente, sendo Fi a força que actua nesse sensorna direcção perpendicular ao plano da sola do pé. De notar que zCOP = 0 uma vez que comoa sua definição indica o COP é um ponto de pressão no solo.

Para se poder calcular o COP foi necessário usar a cinemática directa dos membros in-feriores para calcular a posição dos 8 sensores em cada instante. Para além disto apenas foiusada a informação da quantidade força exercida em cada sensor de força do HOAP-2.

O COP e o PCOM coincidem quando o robô está numa posição estacionária ou quandotem uma velocidade linear e angular uniforme em todas as juntas.

Page 85: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

6.2. MEDIDAS DE ESTABILIDADE 63

6.2.3 Ponto de Momento Zero (ZMP)

O ZMP é um critério da estabilidade dinâmica da locomoção bípede, amplamente usado.Este foi originalmente definido por Vukobratovic [16] em 1972, embora tenha trabalhado noconceito anteriormente (Vukobratovic e Juricic, 1969) [99]. A definição de ZMP dada naaltura foi a seguinte: “Uma carga numa superfície, traduz-se numa força resultante R, cujoponto de aplicação será no limite da carga com a superfície. O ponto da superfície da carga,onde a força resultante R passa é chamado de ZMP.”

Embora o conceito de ZMP tenha sido tão amplamente usado e citado num grande nú-mero de artigos relacionados com a locomoção bípede, foi definido de várias formas, quevariam no seu grau de detalhe. Isto é exemplificado por algumas interpretações feitas aolongo do tempo. Dasgupta e Nakamura (1999) [100] apresentaram a seguinte interpreta-ção:“O ZMP é definido como ponto no solo no qual o momento das forças de inércia e dasforças de gravidade não têm componente horizontal.” Arakawa e Fukuda (1997) [101] deramoutra interpretação: “O ZMP é o ponto no solo no qual o momento T (Tx, Ty, Tz) geradopelas forças de reacção e de torque satisfaz a condição Tx=0 e Ty=0.”

Por fim Vukobratovic (2004) [12] afirmou: “O ZMP é definido como o ponto no solono qual o momento gerado pelos movimentos do robô é zero, isto é, onde a força de inérciaé zero.” Afirma-se que este ponto deve situar-se dentro da área de suporte. O ZMP nasua forma mais geral é mais frequentemente usado para geração de trajectórias e pode serdefinido pelas equações 6.6 e 6.7 [102].

xZMP =

∑Ni=1

[(azi + g) mi xCOMi − axi mi zCOMi + HCOMyi

]∑N

i=1 (azi + g) mi(6.6)

yZMP =

∑Ni=1

[(azi + g) mi yCOMi − ayi mi zCOMi + HCOMxi

]∑N

i=1 (azi + g) mi(6.7)

Sendo o robô composto por vários segmentos N indicados pelo índice i; mi é a massa dosegmento i; xCOMi , yCOMi e zCOMi representam a posição do COM do segmento i nos eixos x, y

e z respectivamente; axi , ayi e azi representam a aceleração linear do segmento i nos eixos x, y

e z respectivamente; HCOMxi e HCOMyirepresentam o momento angular no COM do segmento

i nos eixos x e y respectivamente. De notar também neste caso que zZMP = 0 uma vez quecomo a sua definição indica o ZMP é um ponto no solo.

Para simplificar o processo de cálculo do ZMP foi criado um plugin de física no Webots.Este plugin foi usado para aceder à ODE (Open Dynamics Engine) do Webots. A ODE éuma biblioteca de simulação que o Webots usa para a detecção de colisões e simulação dadinâmica de corpos, sendo assim possível aceder às propriedades físicas de cada segmentodo robô. Desta forma foi mais fácil obter directamente a posição e velocidade linear dos

Page 86: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

64 CAPÍTULO 6. ESTABILIDADE

diferentes segmentos do robô em cada instante. Mas para o cálculo do ZMP é necessária aaceleração linear e não a velocidade linear de cada segmento. Assim, através das equações6.8 e 6.9 pode-se calcular a aceleração linear de cada segmento do robô em cada instante.

Dado que:

ai(t) =vi(t) − vi(t − dt)

dt(6.8)

Então podem-se calcular as acelerações lineares nos diferentes componentes x, y e z daseguinte forma:

axi =

vxi (t)−vxi (t−dt)dt

ayi =vyi (t)−vyi (t−dt)

dt

azi =vzi (t)−vzi (t−dt)

dt

(6.9)

Onde vi(t) representa a velocidade linear actual do segmento i e vi(t − dt) a velocidadelinear do segmento i na simulação anterior e dt representa o tempo entre cada instante dasimulação.

Falta o cálculo do momento angular no COM de cada segmento do robô. Isto foi feitousando também o plugin de física criado. O único entrave é o facto de esse valor não poderser obtido directamente. Usando as equações 6.10 e 6.11 é possível calcular o momentoangular (HCOMi) no COM do segmento i através da velocidade angular (ωi) e da matriz dotensor de inércia do segmento.

HCOMi = ICOMiωi (6.10)

HCOMxi

HCOMyi

HCOMzi

=

ICOMxxi ICOMxyi

ICOMxzi

ICOMyxiICOMyyi

ICOMyzi

ICOMzxi ICOMzyiICOMzzi

ωxi

ωyi

ωzi

(6.11)

Onde ICOMi representa a Inertia Tensor Matrix, matriz tensor de inercia, definido na ODEpara o segmento i e ωi é a velocidade angular do segmento i. Ambas as matrizes podem seracedidas através do plugin de física bastando no final fazer a sua multiplicação para se obtero momento angular no COM do segmento i.

De acordo com Vukobratovic (2004) [12], na figura 6.4 podem-se observar os três casosque melhor descrevem a relação entre o ZMP e o COP. Na figura da esquerda em que o pése encontra numa posição estável, o ZMP coincide com o COP. Na figura do centro estádescrito um caso diferente em que ocorre uma perturbação que faz com que o ponto ondeactua a força de reacção (COP) seja na ponta do pé. Aqui, a perturbação no momento vaiinevitavelmente causar a rotação na ponta do pé do robô e a sua consequente queda. Uma

Page 87: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

6.2. MEDIDAS DE ESTABILIDADE 65

vez que o ponto no solo onde o momento é zero se encontra fora da área de suporte, existeapenas um Ponto de Momento Zero Fictício (FZMP, do inglês Fictitious Zero Moment Point),do qual a sua distância à ponta do pé é proporcional à magnitude da perturbação. O conceitode FZMP é introduzido uma vez que o ZMP tal como o COP nunca pode deixar a área desuporte. Na figura mais à direita o robô encontra-se num equilíbrio dinâmico na ponta dospés, isto vai fazer com que o ZMP coincida com o COP.

Figura 6.4: Diferenças entre o ZMP e o COP de [12]. À esquerda o ZMP coincide com o COP. Aocentro existe apenas um ZMP fictício (FZMP) provocado por um movimento dinâmico instável, doqual a distância do FZMP à ponta do pé é proporcional à magnitude da perturbação. Na figura mais àdireita o ZMP coincide com o COP.

O ZMP coincide sempre com o COP num movimento estável de locomoção, no entantoo COP não é sempre o ZMP (por exemplo num movimento dinâmico instável). Num mo-vimento dinâmico instável o COP existe sempre, mas o ZMP pode não existir, pode haverapenas um FZMP. Assim, na maior parte das vezes os seus valores são coincidentes, masneste caso específico a forma como o ZMP foi calculado possui muito maior rigor do que aforma como o COP foi calculada (usando apenas 4 sensores de força em cada pé), podendodaí advir algumas diferenças graças à falta de rigor no cálculo do COP.

6.2.4 Indicador de Rotação do Pé (FRI)

O FRI é um indicador de instabilidade definido em termos de rotação do pé, assim sendo,é apenas determinado durante a fase de suporte simples em que apenas um pé se encontraem contacto com o solo. Embora a posição do PCOM seja suficiente para determinar aocorrência de uma rotação (desiquilíbrio) num robô parado, o mesmo não acontece paraum robô em movimento. Em vez disso é a posição do FRI que indica a existência de umdesiquilíbrio rotacional no pé. Este foi definido por Goswami (1999) [13] como o ponto nosolo em que a força de reacção do solo tem de actuar para compensar a rotação do pé.

Na figura 6.5 pode-se ver no lado esquerdo o pé num equilíbrio estático já que existeuma força (representada pelas duas setas dentro do círculo) a apontar na direcção do pé.Neste caso o PCOM (C) encontra-se fora da área de suporte, mas o COP (P) e o FRI (F)encontram-se dentro desta. Já no caso do lado direito, o pé começa a rodar uma vez que o

Page 88: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

66 CAPÍTULO 6. ESTABILIDADE

FRI (F) se encontra fora da área de suporte, embora o PCOM (C) se encontre dentro desta.O COP (P) encontra-se na ponta sobre a qual o pé roda. De notar que se o pé do robô estiverparado numa posição de equilíbrio sem o efeito de qualquer força, o FRI, o ZMP e o COPencontra-se todos no mesmo ponto.

Figura 6.5: Diferença entre o FRI, o PCOM e o COP de [13]. À esquerda o pé encontra-se numequilíbrio estático e o PCOM (C) encontra-se fora da área de suporte, mas o COP (P) e o FRI (F)encontram-se dentro desta. Já no caso do lado direito, o pé começa a rodar uma vez que o FRI (F) seencontra fora da área de suporte, embora o PCOM (C) se encontre dentro desta e o COP (P) na pontasobre a qual o pé roda.

Assim, a estabilidade no que respeita à rotação do pé é assegurada quando o ponto FRI semantém dentro da área de suporte. A distância do FRI à área de suporte indica a quantidadedo desiquilíbrio do momento, que causa a rotação do pé. O FRI pode ser calculado a partirdas equações 6.12 e 6.13 [13].

xFRI =g m1 xCOM1 +

∑Ni=2

[(azi + g) mi xCOMi − axi mi zCOMi + HCOMyi

]g m1 +

∑Ni=2 (azi + g) mi

(6.12)

yFRI =g m1 yCOM1 +

∑Ni=2

[(azi + g) mi yCOMi − ayi mi zCOMi + HCOMxi

]g m1 +

∑Ni=2 (azi + g) mi

(6.13)

Neste caso, o robô é composto por vários segmentos N indicados pelo índice i (exceptoo segmento do pé de apoio que é representado pelo índice 1). mi é a massa do segmentoi, xCOMi , yCOMi e zCOMi representam a posição do COM do segmento i nos eixos x, y e z

respectivamente, sendo essa posição calculada como anteriormente usando o plugin de física.axi , ayi e azi representam a aceleração linear do segmento i nos eixos x, y e z respectivamente,a qual é calculada através das equações 6.8 e 6.9 usando o plugin de física, como explicadona secção 6.2.3. HCOMxi e HCOMyi

representam o momento angular no COM do segmento i

Page 89: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

6.2. MEDIDAS DE ESTABILIDADE 67

nos eixos x, y respectivamente, o qual é calculado através das equações 6.10 e 6.11 usandoo plugin de física. No caso específico do FRI, m1 representa a massa do segmento do péde apoio do robô e xCOM1 e yCOM1 representam a posição do COM do mesmo segmento noseixos x e y respectivamente. De notar também neste caso que zZMP = 0 uma vez que como asua definição indica o FRI é um ponto no solo.

Depois de implementadas as medidas de estabilidade no robô HOAP-2, no Webots,fizeram-se alguns testes de modo a comprovar que estas se encontravam correctamente cal-culadas. Na figura 6.6 pode-se ver o robô HOAP-2 em duas situações distintas, nas quaiso COM e o PCOM se encontram marcados a azul, o ZMP a verde e o FRI a vermelho.Em 6.6(a) o robô encontra-se numa posição de estabilidade estática em que tanto o PCOM,o ZMP e o FRI se encontram sobrepostos e dentro da área de suporte. Em 6.6(b) o robôencontra-se numa posição instável e por isso as medidas de estabilidade encontram-se forada área de suporte. O PCOM acompanha correctamente a projecção vertical do COM. OZMP (verde) encontra-se ligeiramente fora da área de suporte sendo neste caso um ZMPfictício, FZMP. O FRI (vermelho) encontra-se praticamente sobreposto com o anterior ligei-ramente distanciado da área de suporte indicando a instabilidade do robô.

(a) O robô encontra-se numa posição deestabilidade estática em que o PCOM, oZMP e o FRI se encontram sobrepostos edentro da área de suporte.

(b) O robô está numa posição instável e por isso as medidasde estabilidade encontram-se fora da área de suporte.

Figura 6.6: Medidas de estabilidade simuladas no robô HOAP-2.

Page 90: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

68 CAPÍTULO 6. ESTABILIDADE

6.3 Quantificação da Estabilidade

Para verificar a estabilidade do robô em termos quantitativos e não só qualitativos decidiu-sepela quantificação das medidas de estabilidade em valores concretos. Esta quantificação vaipermitir uma fácil comparação entre as diferentes simulações com o objectivo de se obteruma estabilidade óptima na locomoção do robô.

Assim, a primeira quantificação corresponde à percentagem do tempo de suporte em queo FRI se encontra encostado a qualquer um dos limites externos do pé. O cálculo destaquantificação encontra-se na equação 6.14.

%tsFRI limite =tFRI limite

tstance× 100 (6.14)

Primeiro é calculado o tempo em que o FRI se encontra encostado a qualquer um doslimites externos do pé (tFRI limite) com uma margem de erro de 8 mm. Por outras palavras éo tempo em que a distancia do FRI a qualquer uma das bordas do pé é menor que 8 mm.De seguida é calculado o tempo total de suporte do pé (tstance). A percentagem de tempode suporte em que o FRI se encontra no limite externo do pé (%tsFRI limite) vai ser dada peladivisão de ambos os valores, sendo que o valor calculado é actualizado no final da fase desuporte de cada pé. Esta percentagem quantifica a instabilidade do robô, uma vez que quantomaior o seu valor maior a instabilidade do mesmo.

A segunda e terceira quantificação de estabilidade correspondem à distancia do ZMP e doCOP ao centro do polígono de suporte do robô. O centro do polígono de suporte é calculadoatravés das equações 6.15 e 6.16.

xCPS =

∑Ni=0 xqi

N(6.15)

yCPS =

∑Ni=0 yqi

N(6.16)

Para o cálculo do centro do polígono de suporte é feita a média entre a posição dossensores de pressão que se encontram em contacto com o solo. Assim sendo N representaos sensores de força que se encontram em contacto com o solo, indicados pelo índice i, ondexqi e yqi são a posição do sensor i, nos eixos x e y respectivamente. Sabido o centro dopolígono de suporte do robô vai ser o cálculo da sua distância ao ZMP e ao COP que vão darorigem à segunda e terceira quantificação de estabilidade. Estes valores também quantificama instabilidade do robô, uma vez que quanto maior o seu valor maior a instabilidade domesmo.

Page 91: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

Capítulo 7

Avaliação da Locomoção

Neste capítulo é feita uma pequena avaliação da estabilidade da locomoção do robô HOAP-2 usando as medidas de estabilidade descritas e implementadas. A avaliação é feita atravésdas quantificações de estabilidade estabelecidas para a locomoção bípede no capítulo 6.3.Depois de feita esta avaliação é introduzido um movimento dos braços e é avaliada a suainfluência na estabilidade da locomoção do robô.

7.1 Movimento de Locomoção Bípede

Ao começar a avaliação da estabilidade do movimento de locomoção do robô importa emprimeiro lugar ter uma visão mais atenta sobre os sensores de força dos pés, de modo a fazeruma avaliação da forma como o robô coloca e levanta os pés do solo. A figura 7.1 mostra aforça exercida em cada um dos sensores em cada uma das fases da locomoção.

Em cada ciclo de locomoção em que o robô coloca os pés no solo, o padrão de locomoçãoverificado em cada um dos pés através dos sensores de força é praticamente idêntico. Assimcada um dos pés durante o seu ciclo de suporte começa por fazer pressão no sensor que seencontra atrás e no lado interior do pé (A). De seguida é notado um grande pico no sensorfrontal do lado exterior do pé. Após esse pico o robô mantém-se sobre ambos os sensores dafrente (B). De seguida sobre os sensores de trás (C) e quando se prepara para levantar o péa ultima parte do pé a deixar o solo é a da frente com predominância nos seus dois sensores(D). Assim o robô ao colocar o pé no solo começa por pousar o calcanhar gradualmente até àparte frontal do pé, e ao levantar o pé do solo começa por levantar o calcanhar gradualmenteaté à parte frontal do pé. Este movimento é muito idêntico ao observado nos humanos queao pousar o pé começam pelo calcanhar e ao levantar também começam pelo calcanhar.

Feita a avaliação do modo como o robô coloca o pé no solo em cada ciclo de locomoçãoprocedeu-se ao cálculo do seu duty cycle (β da equação 7.1). O duty cycle vai ser a percen-tagem de tempo que o robô está na fase de suporte em relação ao tempo total de cada ciclo

69

Page 92: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

70 CAPÍTULO 7. AVALIAÇÃO DA LOCOMOÇÃO

12.2 12.4 12.6 12.8 13 13.20

20

40

60

80

X: 12.23Y: 0 tempo (s)

F(N

)

X: 12.58Y: 0

X: 12.86Y: 0

FSREsq.FR

FSREsq.FL

FSREsq.BR

FSREsq.BL

12.2 12.4 12.6 12.8 13 13.20

20

40

60

80

tempo (s)

F(N

)

FSRDir.FR

FSRDir.FL

FSRDir.BR

FSRDir.BL

A C DB

STANCE SWING

SWING STANCE

(a) (b)

Figura 7.1: Força exercida nos sensores de pressão em Newtons. Em cima o pé esquerdo e em baixoo pé direito. Durante o seu ciclo de suporte o pé começa por fazer pressão no sensor que se encontramais atrás e no lado interior do pé (A). É notado de seguida um grande pico no sensor frontal dolado exterior do pé. Após isso o robô mantém-se sobre ambos os sensores da frente (B). De seguidasobre os sensores de trás (C) e quando se prepara para levantar o pé a última parte a deixar o solo éa da frente com predominância nos seus dois sensores (D). Observa-se assim que o robô começa porpousar o calcanhar quando coloca o pé no solo e quando o levanta do solo é também o calcanhar oprimeiro a começar a levantar.

de locomoção (tempo de suporte mais tempo de balanço). Através da observação da figura7.1, retiram-se os tempos correspondentes e substituem-se na equação 7.1. Como se podever na equação 7.2 a fase de suporte é mais longa que a fase de balanço, uma vez que o robôse encontra nessa fase em 56% do tempo total de cada ciclo de locomoção.

β =Tstance

Tstance + Tswing(7.1)

β =(12, 58 − 12, 23)

(12, 58 − 12, 23) + (12, 86 − 12, 58)≈ 0, 556 ≈ 56% (7.2)

Este duty factor está dentro dos parâmetros esperados. Isto porque a fase do robô φR temum comportamento periódico. Assim, em cada ciclo de locomoção o robô está apoiado nolado esquerdo durante metade do tempo e no lado direito durante a outra metade. Assim estevalor de aproximadamente 56% vem confirmar isso já que o pé direito encontra-se apoiadono solo durante a sua metade (50%) mais um tempo de transição em que ambos os pés seencontram em contacto com o solo (6%).

Seguidamente procedeu-se então à observação das medidas de estabilidade calculadaspara o movimento de locomoção bípede. Na figura 7.2 pode-se observar a variação do FRI,ZMP, COP, PCOM e COM ao longo da locomoção bípede em relação ao centro do mundo

Page 93: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

7.1. MOVIMENTO DE LOCOMOÇÃO BÍPEDE 71

e comparar com a posição das pegadas do robô.

0.7

0.8

0.9

1

−0.1−0.0500.050.10.15

0

0.05

0.1

0.15

0.2

0.25

0.3

X

Y

Z

FRI

ZMP

COP

PCOM

COM

(a) Visão a 3 dimensões.

0.7

0.75

0.8

0.85

0.9

0.95

1

−0.1−0.0500.050.10.15

X

Y

FRI

ZMP

COP

PCOM

(b) Visão a 2 dimensões.

Figura 7.2: FRI, ZMP, COP, PCOM e COM em relação ao centro do mundo. Existe uma enormesemelhança (quase sobreposição) entre o FRI e o ZMP. O COP segue a mesma tendência dos an-teriores, mas devido ao facto de que para o cálculo do COP apenas são usados quatro sensores emcada pé, este mantém-se numa posição mais interior do polígono de suporte. O FRI normalmentetende a passar pelas bordas exteriores do pé o que é provocado pelas oscilações que ocorrem durantea locomoção. O COM apresenta um comportamento oscilatório nos três planos de projecção, compredominância para o plano x, y devido às transições entre o pé de suporte do robô. O FRI, o ZMP, oCOP e o PCOM encontram-se sempre dentro do polígono de suporte.

Começando pelo COM este apresenta um comportamento oscilatório nos três planos deprojecção, sendo esta oscilação como esperado predominante no plano x, y, devido à incli-nação do COM do robô do lado direito para o esquerdo e vice-versa, quando o robô levantaalternadamente cada uma das pernas. Na projecção do centro de massa PCOM este com-portamento também é observado uma vez que as duas medidas se sobrepõem no plano x, y.Nota-se também uma enorme semelhança (quase sobreposição) entre o FRI e o ZMP. O COPsegue a mesma tendência dos anteriores, mas devido ao facto de para o calculo do COP ape-nas serem usados quatro sensores em cada pé, o que não dá uma medição realmente rigorosasobre a sua posição, este mantém-se numa posição mais interior do polígono de suporte. Denotar que as quatro medidas de estabilidade (FRI, ZMP, COP, PCOM) se encontram dentroda área de suporte. Em todas elas nota-se uma transição mais rápida de uma perna para aoutra sendo isso normal uma vez que o robô faz transições muito rápidas isto é, o tempo emque o robô se encontra apoiado nos dois pés é muito curto como se pode ver no gráfico dossensores de força. De notar também que o FRI normalmente tende a passar pelas bordasexteriores do pé o que é traduzido pelas oscilações que ocorrem na locomoção.

Depois de vista a evolução das diferentes medidas de estabilidade em relação ao centrodo mundo importa agora observar, na figura 7.3, a variação da sua posição ao longo dotempo.

Page 94: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

72 CAPÍTULO 7. AVALIAÇÃO DA LOCOMOÇÃO

12 12.5 13 13.5 140.7

0.8

0.9

1

1.1

tempo (s)X

FRI

ZMP

COP

PCOM

COM

12 12.5 13 13.5 14−0.1

−0.05

0

0.05

0.1

tempo (s)

Y

FRI

ZMP

COP

PCOM

COM

Figura 7.3: FRI, ZMP, COP, PCOM e COM ao longo do tempo. As medidas de estabilidade apre-sentam uma tendência oscilatória em que a posição ao longo do tempo em y tem metade da frequênciada posição ao longo do tempo em x. Salientam-se as semelhanças entre o FRI e o ZMP e a tendênciado COP em acompanhar os dois. A variação brusca do FRI, do ZMP e do COP, em y, de um valor ne-gativo para um positivo, e vice-versa, é mais uma indicação da rápida transição entre o pé de suportedo robô. O pico nas medidas de estabilidade logo após esta transição indica a maior instabilidade dorobô nesse momento.

Nesta variação todas as medidas de estabilidade apresentam um comportamento tenden-cialmente oscilatório em que a sua posição ao longo do tempo em y tem metade da frequênciada posição ao longo do tempo em x. Acontece que por exemplo, enquanto o COM em y os-cila meio ciclo (o robô se encontra apoiado num pé e passa o apoio para o outro pé) o COMem x oscila um ciclo inteiro uma vez que o robô balança para a frente e para trás neste mo-vimento. A figura 7.3 permite observar com mais rigor as semelhanças entre o FRI e o ZMPe a tendência do COP em acompanhar os dois. No gráfico de baixo nota-se também a rápidatransição de suporte de um pé para o outro, uma vez que o FRI, o ZMP e o COP, em y, man-tém valores algo constantes, por exemplo positivos (pé esquerdo), e fazem uma transiçãobrusca para valores negativos (pé direito). De notar que logo no final desta transição o FRI,o ZMP e o COP atingem um pico o que se traduz numa maior instabilidade nesta fase, sendonesta fase que o FRI e o ZMP atingem as bordas laterais do pé do robô já que é quando temo valor mais alto em y. Nota-se que na fase inicial de suporte simples o FRI oscila para afrente (no eixo de y) em relação ao COM do robô e na fase final oscila para trás (no eixo dey) do COM do robô.

Depois de observado o movimento das medidas de estabilidade do robô importa calcularagora as quantificações de estabilidade introduzidas no capítulo 6.3, para assim se poderemobter valores reais da instabilidade ou estabilidade da locomoção do robô. Na figura 7.4pode-se ver a percentagem de tempo de suporte em que o FRI se encontra encostado a qual-

Page 95: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

7.1. MOVIMENTO DE LOCOMOÇÃO BÍPEDE 73

quer um dos limites externos do pé, no final de cada ciclo de suporte, considerando umamargem de 8 mm.

14 16 18 20 22 24 26 28 30 3250

55

60

65

70

75

80

X: 23.27Y: 73.97

tempo (s)

% d

o t

em

po d

e s

tance

X: 18.66Y: 55.07

FRI no limite

Figura 7.4: Percentagem de tempo em que o FRI se encontra encostado a qualquer um dos limitesexternos do pé, ao fim de cada ciclo de suporte, considerando uma margem de erro de 8 mm. Durantea locomoção do robô entre 55% a 74% do tempo de suporte o FRI encontra-se encostado a um doslimites externos do pé de suporte.

Como se pode ver a percentagem é bastante alta, com valores que variam entre 55% e74% o que mostra que a estabilidade pode ser melhorada.

Outras duas quantificações de estabilidade correspondem à distância do ZMP e do COPao centro do polígono de suporte. Na figura 7.5 pode-se ver a distância ao longo do tempodo ZMP e do COP ao centro do polígono de suporte do robô.

12 12.5 13 13.5 140

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

X: 12.7Y: 0.02641

tempo (s)

dis

tân

cia

(m

)

X: 13.77Y: 0.06046

Distância entre o Centro do Polígono e o ZMP

Distância entre o Centro do Polígono e o COP

Figura 7.5: Distância do ZMP e do COP ao centro do polígono de suporte. A distância do ZMPao centro do polígono de suporte apresenta um máximo de 6 cm, enquanto a distância do COP aopolígono de suporte apresenta um máximo de 2,6 cm.

Como se esperava existe uma maior variação entre a distância do ZMP ao centro dopolígono de suporte do que a distância do COP ao mesmo. Isto vem concordar com o quefoi mostrado na figura 7.3 onde existe uma maior amplitude de variação no caso do ZMP em

Page 96: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

74 CAPÍTULO 7. AVALIAÇÃO DA LOCOMOÇÃO

relação ao COP. Assim enquanto a distância do ZMP ao centro do polígono de suporte temum valor máximo de 6 cm, a distância do COP ao mesmo tem um valor máximo de de 2,6cm.

Importa então salientar que o robô consegue produzir uma locomoção estável uma vezque nenhuma das medidas de estabilidade sai fora da área de suporte.

7.2 Movimento dos Braços

Nesta secção procedeu-se à inclusão de um movimento de balanço dos braços de modo aavaliar se este poderá ter alguma influência na estabilidade da locomoção do robô. Comoreferido em [103] o movimento humano de balanço dos braços está em anti-fase com o mo-vimento das pernas. Isto é, o braço direito move-se para a frente quando a perna direita semove para trás e vice-versa para o braço e perna esquerda. Assim, uma vez que o desloca-mento dos braços está em fase com o deslocamento da perna oposta usaram-se os mesmososciladores utilizados para as pernas. O movimento de balanço dos braços é simplesmenteoposto ao deslocamento da perna (braço esquerdo é sincronizado com a perna direita e obraço direito é sincronizado com a perna esquerda). Neste movimento está envolvida a juntade pitch do ombro (θshoulderP) e a junta de pitch do cotovelo (θelbowP). Neste caso as equaçõesque são enviadas para as juntas dos braços dos robôs (7.3, 7.4, 7.5 e 7.6) são as equações depitch opostas às utilizadas no movimento das pernas. Assim para o braço direito usaram-seas equações 7.3 e 7.4, já para o braço esquerdo usaram-se as equações 7.5 e 7.6.

θshoulderP(φC) = AhipS sin(φ4

C −π

2

)+ AP sin(φ3

C) + θresshoulderP

(7.3)

θelbowP(φC) = 12AP sin(φ3C) + θres

elbowP(7.4)

θshoulderP(φC) = AhipS sin(φ2

C −π

2

)+ AP sin(φ1

C) + θresshoulderP

(7.5)

θelbowP(φC) = 12AP sin(φ1C) + θres

elbowP(7.6)

Onde AP e AhipS são as amplitudes dos movimentos já utilizadas anteriormente e φ1C,

φ2C, φ3

C e φ4C são os controladores de fase. θres

shoulderPe θres

elbowPsão as posições de descanso

(posições das juntas que colocam o robô com os braços esticados para baixo numa posiçãode equilíbrio) da junta de pitch do ombro e da junta de pitch do cotovelo, respectivamente.

Na figura 7.6 podem-se ver as juntas, do braço direito, sobre as quais se está a actuarneste caso, (θshoulderP e θelbowP). De notar que as duas ondas têm o mesmo desfasamento entre

Page 97: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

7.2. MOVIMENTO DOS BRAÇOS 75

si de acordo com as ondas esperadas. As ondas não são completamente sinusoidais, uma vezque como no caso dos membros inferiores, sofrem uma adaptação para que estejam sempreem fase com a fase do robô.

0 1 2 3 4 5 6 7−50

0

50

100

150

tempo (s)

Gra

us

θshoulder

P

θelbow

P

Figura 7.6: Resultados obtidos das juntas θshoulderP e θelbowP no movimento dos braços do robô Hoap2.

Após a introdução do movimento dos braços procedeu-se ao cálculo das quantificaçõesde estabilidade para avaliar se houve alguma diferença quanto à estabilidade da locomoçãodo robô. Na figura 7.7 pode-se ver a percentagem de tempo de suporte em que o FRI seencontra encostado a qualquer um dos limites externos do pé, no final de cada ciclo desuporte, considerando uma margem de 8 mm, mas neste caso com a inclusão do movimentodos braços do robô.

14 16 18 20 22 24 26 28 30 3250

55

60

65

70

75

80

X: 20.68Y: 78.87

tempo (s)

% d

o t

em

po d

e s

tance

X: 17.09Y: 63.38

FRI no limite

Figura 7.7: Percentagem de tempo em que o FRI se encontra encostado a qualquer um dos limitesexternos do pé, ao fim de cada ciclo de suporte, considerando uma margem de erro de 8 mm eincluindo o movimento dos braços do robô. Durante a locomoção do robô entre 63% a 79% do tempode suporte o FRI encontra-se encostado a um dos limites externos do pé de suporte.

A percentagem é ligeiramente maior do que na situação em que o robô não tinha os braçosem movimento, variando neste caso entre 63% e 79%. À primeira vista isto mostra que paraalém dos benefícios estéticos inerentes à inclusão do movimento dos braços na locomoçãodo robô, não parece haver melhorias quanto à estabilidade da locomoção do mesmo.

Passando agora para as outras duas quantificações de estabilidade que correspondem àdistância do ZMP e do COP ao centro do polígono de suporte, na figura 7.8 pode-se ver essas

Page 98: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

76 CAPÍTULO 7. AVALIAÇÃO DA LOCOMOÇÃO

distâncias ao longo do tempo com a inclusão do movimento dos braços do robô.

12 12.5 13 13.5 140

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

X: 12.86Y: 0.0466

tempo (s)

dis

tân

cia

(m

)

X: 13.3Y: 0.02646

Distância entre o Centro do Polígono e o ZMP

Distância entre o Centro do Polígono e o COP

Figura 7.8: Distância do ZMP e do COP ao centro do polígono de suporte, com a inclusão domovimento dos braços do robô. A distância do ZMP ao centro do polígono de suporte têm no máximo4,7 cm, enquanto a distância do COP ao polígono de suporte tem no máximo 2,6 cm.

Neste caso, com a inclusão do movimento dos braços a distância do COP ao centro dopolígono de suporte manteve a mesma tendência de movimento da situação em que o robônão possuía movimento nos braços, com valor máximo de 2,6 cm. Já a distância do ZMP aocentro do polígono de suporte parece neste caso ser mais constante e sujeita a picos menosbruscos traduzindo-se num valor máximo 6 cm, inferior ao caso em que o robô possuíamovimento nos braços.

Seria necessário fazer testes mais aprofundados, nomeadamente ao nível da estabilidadeda locomoção do robô para outras configurações de movimentos dos braços, para se con-seguir avaliar com mais rigor se estes podem ter uma influência positiva na estabilidade dalocomoção do mesmo.

Page 99: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

Capítulo 8

Conclusão

O trabalho apresentado nesta tese é uma contribuição para a investigação da locomoção derobôs bípedes. As suas contribuições principais passam pelo algoritmo de controlo da lo-comoção capaz de produzir uma locomoção estável tendo como entrada apenas as forçasexercidas nos sensores de pressão dos pés, reduzindo assim a dimensão do problema de con-trolo. Para além disso a implementação do cálculo das diferentes medidas de estabilidade éum grande passo na avaliação da estabilidade da locomoção do robô. Isto abre a possibili-dade de utilização destas mesmas medidas para um melhoramento da estabilidade do robôem situações ambientais mais extremas.

Inicialmente começou-se por um estudo detalhado do tipo de controladores passivos eactivos desenvolvido para a locomoção bípede. Nomeadamente os grupos de investigaçãoexistentes nesta area, os métodos de controlo usados e respectivos robôs. Isto permitiu teruma visão mais abrangente sobre as metodologias de controlo existentes até ao momento.

Procedeu-se então de seguida ao estudo detalhado do sistema dinâmico não linear dooscilador, nomeadamente os seus pontos fixos e sua estabilidade. Isto permitiu fazer umbalizamento e impor algumas restrições quanto aos intervalos de valores dos parâmetros dosistema necessários para este caso específico.

Feito isto foi possível apresentar o modelo de controlo da locomoção usado. O sistemaé modelado por osciladores não lineares responsáveis pelo controlo da locomoção do robô.Os movimentos de cada junta resultam de trajectórias geradas por esses osciladores em cadainstante. O sistema permite coordenar todas as juntas de cada membro de modo a efectuar osmovimentos de locomoção. De modo a gerar os movimentos necessários para cada perna dorobô apenas é necessária a informação dos sensores de pressão colocados nas solas dos pésdos robôs. Foi realizada uma exploração de parâmetros para determinar quais as amplitudesde movimentos óptimas.

Estando concluído o controlador da locomoção procedeu-se ao estudo e cálculo das me-didas de estabilidade. Estas serviram para avaliar a estabilidade da locomoção do robô.

77

Page 100: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

78 CAPÍTULO 8. CONCLUSÃO

8.1 Discussão dos Resultados

Os resultados foram todos obtidos num ambiente de simulação usando o simulador Webots.Estes resultados mostraram que o controlador proposto é capaz de gerar com sucesso umalocomoção bípede estável tanto para o robô HOAP-2 como para o robô NAO.

Para além disso foi possível calcular com sucesso as medidas de estabilidade e utilizá-lasna avaliação da estabilidade do robô. Este estudo foi apenas verificado no robô HOAP-2.Embora se tenha procedido à inclusão do movimento dos braços no robô HOAP-2, é aindanecessária uma análise mais exaustiva para se poder inferir sobre as vantagens da inclusãodeste movimento.

Assim os objectivos inicialmente propostos para esta tese foram concluídos com sucesso.

8.2 Trabalho Futuro

O trabalho futuro inclui mais testes à estabilidade da locomoção do robô. Nomeadamentequanto ao seu melhoramento com a inclusão de vários movimentos dos braços, com di-ferentes amplitudes e frequências. Usar as medidas de estabilidade não só para avaliar aestabilidade da locomoção do robô, mas também como realimentação para o controlo, porexemplo, da estabilidade do robô quando este esteja a subir uma rampa. Dotar o controladorde controlo de velocidade e controlo de direcção. Munir o controlador de capacidade deultrapassar obstáculos nomeadamente subir rampas bastante acentuadas, subir degraus e atémesmo evitar obstáculos.

Page 101: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

Bibliografia

[1] J. Pratt, P. Dilworth, and G. Pratt. Virtual model control of a bipedal walking robot. InProceedings of the 2007 IEEE International Conference on Robotics and Automation,pages 193–198, 1997.

[2] K. Nishiwaki, J. Kuffner, S. Kagami, M. Inaba, and H. Inoue. The experimentalhumanoid robot h7: a research platform for autonomous behaviour. Philosophical

Transactions of the Royal Society - Series A: Mathematical, Physical and Engineering

Sciences, 365:79–107, 2007.

[3] K. Kaneko, F. Kanehiro, S. Kajita, H. Hirukawa, T. Kawasaki, M. Hirata, K. Akachi,and T. Isozumi. Humanoid robot hrp-2. In Proceedings of the 2004 IEEE International

Conference on Robotics and Automation, pages 1083–1090, 2004.

[4] Y. Ogura, H. Aikawa, K. Shimomura, A. Morishima, H. Lim, and A. Takanishi. De-velopment of a new humanoid robot wabian-2. In Proceedings of the 2006 IEEE

International Conference on Robotics and Automation, pages 76–81, 2006.

[5] Y. Sakagami, R. Watanabe, C. Aoyama, S. Matsunaga, N. Higaki, and K. Fujimura.The intelligent asimo: system overview and integration. In Proceedings of the 2002

IEEE/RSJ International Conference on Intelligent Robots and Systems, pages 2478–2483, 2002.

[6] I.-W. Park, J.-Y. Kim, J. Lee, and J.-H. Oh. Mechanical design of humanoid robotplatform khr-3 (kaist humanoid robot - 3: Hubo). In Proceedings of 2005 5th IEEE-

RAS International Conference on Humanoid Robots, pages 321–326, 2005.

[7] J. E. Pratt. Exploiting Inherent Robustness and Natural Dynamics in the Control of

Bipedal Walking Robots. PhD thesis, Massachusetts Institute of Technology, 2000.

[8] B. Vanderborght. Dynamic stabilisation of the biped Lucy powered by actuators with

controllable stiffness. PhD thesis, Vrije Universiteit Brussel, 2007.

79

Page 102: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

80 BIBLIOGRAFIA

[9] R. Zaier and S. Kanda. Piecewise-linear pattern generator and reflex system for huma-noid robots. In Proceedings of the 2007 IEEE International Conference on Robotics

and Automation, pages 2188–2195, 2007.

[10] G. Endo, J. Nakanishi, J. Morimoto, and G. Cheng. Experimental studies of a neuraloscillator for biped locomotion with qrio. In Proceedings of the 2005 IEEE Internati-

onal Conference on Robotics and Automation, pages 596–602, 2005.

[11] S. H. Strogatz. Nonlinear Dynamics and Chaos With Applications to Physics, Biology,

Chemistry, and Engineering. Perseus Books, 1994.

[12] M. Vukobratovic and B. Borovac. Zero-moment point-thirty five years of its life.International Journal of Humanoid Robotics, 1(1):157–173, 2004.

[13] A. Goswami. Postural stability of biped robots and the foot-rotation indicator (fri)point. The International Journal of Robotics Research, 18(6):523–533, 1999.

[14] J. Morimoto, G. Endo, J. Nakanishi, S.H. Hyon, G. Cheng, D. Bentivegna, and C.G.Atkeson. Modulation of simple sinusoidal patterns by a coupled oscillator modelfor biped walking. In Proceedings of the 2006 IEEE International Conference on

Robotics and Automation, pages 1579–1584, 2006.

[15] P. Sardain and G. Bessonnet. Forces acting on a biped robot. center of pressure-zeromoment point. IEEE Transactions on Systems, Man and Cybernetics, Part A: Systems

and Humans, 34(5):630–637, 2004.

[16] M. Vukobratovic. How to control artificial anthropomorphic systems. IEEE Transac-

tion on Systems, Man, and Cybernetics, SMC-3(5):497–507, 1973.

[17] J. E. Pratt. Virtual model control of a biped walking robot. Diploma thesis, Massa-chusetts Institute of Technology, 1995.

[18] J. Pratt, C. M. Chew, A. Torres, P. Dilworth, and G. Pratt. Virtual model control:An intuitive approach for bipedal locomotion. The International Journal of Robotics

Research, 20(2):129–143, 2001.

[19] A. L. Torres. Virtual model control of a hexapod walking robot. Undergraduate thesis,Massachusetts Institute of Technology, 1996.

[20] J. Kuffner, K. Nishiwaki, S. Kagami, M. Inaba, and H. Inoue. Motion planning forhumanoid robots under obstacle and dynamic balance constraints. In Proceedings of

the 2001 IEEE International Conference on Robotics and Automation, pages 692–698,2001.

Page 103: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

BIBLIOGRAFIA 81

[21] J. Chestnutt, J. Kuffner, K. Nishiwaki, and S. Kagami. Planning biped navigationstrategies in complex environments. In Proceedings of the 2003 IEEE International

Conference on Humanoid Robotics, 2003.

[22] K. Kaneko, F. Kanehiro, S. Kajita, K. Yokoyama, K. Akachi, T. Kawasaki, S. Ota, andT. Isozumi. Design of prototype humanoid robotics platform for hrp. In Proceedings

of the 2002 IEEE/RSJ International Conference on Intelligent Robots and Systems,pages 2431–2436, 2002.

[23] S. Kajita, F. Kanehiro, K. Kaneko, K. Fujiwara, K. Harada, K. Yokoi, and H. Hiru-kawa. Biped walking pattern generation by using preview control of zero-momentpoint. In Proceedings of the 2003 IEEE International Conference on Robotics and

Automation, pages 1620–1626, 2003.

[24] S. Kajita, M. Morisawa, K. Harada, K. Kaneko, F. Kanehiro, K. Fujiwara, and H. Hi-rukawa. Biped walking pattern generator allowing auxiliary zmp control. In Pro-

ceedings of the 2006 IEEE/RSJ International Conference on Intelligent Robots and

Systems, pages 2993–2999, 2006.

[25] R. Sellaouti, O. Stasse, S. Kajita, K. Yokoi, and A. Kheddar. Faster and smoother wal-king of humanoid hrp-2 with passive toe joints. In Proceedings of the 2006 IEEE/RSJ

International Conference on Intelligent Robots and Systems, pages 4909–4914, 2006.

[26] H. Arisumi, J.-R. Chardonnet, and K. Yokoi. Whole-body motion of a humanoid robotfor passing through a door - opening a door by impulsive force -. In Proceedings of

the 2009 IEEE/RSJ International Conference on Intelligent Robots and Systems, pages428–434, 2009.

[27] A. Escande and A. Kheddar. Contact planning for acyclic motion with tasks cons-traints. In Proceedings of the 2009 IEEE/RSJ International Conference on Intelligent

Robots and Systems, pages 435–440, 2009.

[28] K. Kaneko, S. Kajita, F. Kanehiro, K. Yokoi, K. Fujiwara, H. Hirukawa, T. Kawasaki,M. Hirata, and T. Isozumi. Design of advanced leg module for humanoid robotics pro-ject of meti. In Proceedings of the 2002 IEEE International Conference on Robotics

and Automation, pages 38–45, 2002.

[29] T. Nagasaki, S. Kajita, K. Yokoi, K. Kaneko, and K. Tanie. Running pattern generationand its evaluation using a realistic humanoid model. In Proceedings of the 2003 IEEE

International Conference on Robotics and Automation, pages 1336–1342, 2003.

Page 104: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

82 BIBLIOGRAFIA

[30] S. Kajita, T. Nagasaki, K. Kaneko, K. Yokoi, and K. Tanie. A running controller ofhumanoid biped hrp-2lr. In Proceedings of the 2005 IEEE International Conference

on Robotics and Automation, pages 616–622, 2005.

[31] S. Kajita, K. Kaneko, M. Morisawa, S. Nakaoka, and H. Hirukawa. Zmp-based bipedrunning enhanced by toe springs. In Proceedings of the 2007 IEEE International

Conference on Robotics and Automation, pages 3963–3969, 2007.

[32] K. Akachi, K. Kaneko, N. Kanehira, S. Ota, G. Miyamori, M. Hirata, S. Kajita, andF. Kanehiro. Development of humanoid robot hrp-3p. In Proceedings of 2005 5th

IEEE-RAS International Conference on Humanoid Robots, pages 50–55, 2005.

[33] K. Kaneko, K. Harada, F. Kanehiro, G. Miyamori, and K. Akachi. Humanoid robothrp-3. In Proceedings of the 2008 IEEE/RSJ International Conference on Intelligent

Robots and Systems, pages 2471–2478, 2008.

[34] Y. Ogura, K. Shimomura, A. Kondo, A. Morishima, T. Okubo, S. Momoki, H. Lim,and A. Takanishi. Human-like walking with knee stretched, heel-contact and toe-offmotion by a humanoid robot. In Proceedings of the 2006 IEEE/RSJ International

Conference on Intelligent Robots and Systems, pages 3976–3981, 2006.

[35] K. Hirai, M. Hirose, Y. Haikawa, and T. Takenaka. The development of honda huma-noid robot. In Proceedings of the 1998 IEEE International Conference on Robotics

and Automation, pages 1321–1326, 1998.

[36] B. Mutlu, S. Osman, J. Forlizzi, J. Hodgins, and S. Kiesler. Perceptions of asimo:an exploration on co-operation and competition with humans and humanoid robots.1st ACM SIGCHI/SIGART conference on Human-robot interaction, page 351U352,2006.

[37] J. Chestnutt, M. Lau, G. Cheung, J. Kuffner, J. Hodgins, and T. Kanade. Footstepplanning for the honda asimo humanoid. In Proceedings of the 2005 IEEE Internati-

onal Conference on Robotics and Automation, pages 629–634, 2005.

[38] T. Takenaka, T. Matsumoto, T. Yoshiike, and S. Shirokura. Real time motion gene-ration and control for biped robot -2nd report: Running gait pattern generation-. InProceedings of the 2009 IEEE/RSJ International Conference on Intelligent Robots

and Systems, pages 1092–1099, 2009.

[39] M. Gienger, K. Loffler, and F. Pfeiffer. A biped robot that jogs. In Proceedings of the

2000 IEEE International Conference on Robotics and Automation, pages 3334–3339,2000.

Page 105: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

BIBLIOGRAFIA 83

[40] S. Lohmeier, K. Loffler, M. Gienger, H. Ulbrich, and F. Pfeiffer. Computer system andcontrol of biped "johnnie". In Proceedings of the 2004 IEEE International Conference

on Robotics and Automation, pages 4222–4227, 2004.

[41] S. Lohmeier, T. Buschmann, H. Ulbrich, and F. Pfeiffer. Modular joint design forperformance enhanced humanoid robot lola. In Proceedings of the 2006 IEEE Inter-

national Conference on Robotics and Automation, pages 88–93, 2006.

[42] T. Buschmann, S. Lohmeier, and H. Ulbrich. Biped walking control based on hybridposition/force control. In Proceedings of the 2009 IEEE/RSJ International Conference

on Intelligent Robots and Systems, pages 3019–3024, 2009.

[43] J.-H. Kim, I.-W. Park, J. Lee, M.-S. Kim, B.-K. Cho, and J.-H. Oh. System designand dynamic walking of humanoid robot khr-2. In Proceedings of the 2005 IEEE

International Conference on Robotics and Automation, pages 1431–1436, 2005.

[44] Z. Peng, Y. Fu, Z. Tang, Q. Huang, and Taoxiao. Online walking pattern genera-tion and system software of humanoid bhr-2. In Proceedings of the 2006 IEEE/RSJ

International Conference on Intelligent Robots and Systems, pages 5471–5476, 2006.

[45] T. Soya. Stage of partner robot development in toyota and feasibility of applicationsin the medical field. Circulation Journal, 70, 2006.

[46] J.-M. Bourgeot, N. Cislo, and B. Espiau. Path-planning and tracking in a 3d com-plex environment for an anthropomorphic biped robot. In Proceedings of the 2002

IEEE/RSJ International Conference on Intelligent Robots and Systems, pages 2509–2514, 2002.

[47] C. Sabourin, O. Bruneau, and G. Buche. Experimental validation of a robust controlstrategy for the robot rabbit. In Proceedings of the 2005 IEEE International Confe-

rence on Robotics and Automation, pages 2393–2398, 2005.

[48] B. Morris, E. R. Westervelt, C. Chevallereau, G. Buche, and J. W. Grizzle. Achieving

Bipedal Running with RABBIT: Six Steps toward Infinity, page 277U297. Springer,2005.

[49] T. McGeer. Passive dynamic walking. The International Journal of Robotics Rese-

arch, 9(2):62–82, 1990.

[50] T. McGeer. Dynamics and control of bipedal locomotion. Journal of Theoretical

Biology, 163:277–314, 1993.

Page 106: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

84 BIBLIOGRAFIA

[51] M. S. Garcia. Stability, scaling, and chaos in passive-dynamic gait models. PhDthesis, Cornell University, 1999.

[52] A. D. Kuo. Stabilization of lateral motion in passive dynamic walking. The Interna-

tional Journal of Robotics Research, 18(9):917–930, 1999.

[53] A. D. Kuo. A simple model of bipedal walking predicts the preferred speed - steplength relationship. Journal of Biomechanical Engineering, 123:264–269, 2001.

[54] M. Wisse. Essentials of dynamic walking, Analysis and design of two-legged robots.PhD thesis, Delft University of Technology, 2004.

[55] S. Collins, A. Ruina, R. Tedrake, and M. Wisse. Efficient bipedal robots based onpassive-dynamic walkers. Science, 307:1082–1085, 2005.

[56] M. Wisse. Three additions to passive dynamic walking; actuation, an upper body,and 3d stability. In Proceedings of 2004 4th IEEE-RAS International Conference on

Humanoid Robots, pages 113–132, 2004.

[57] J. E. Pratt, B. Krupp, V. Ragusila, J. Rebula, T. Koolen, N. van Nieuwenhuizen,C. Shake, T. Craig, J. Taylor, G. Watkins, P. Neuhaus, M. Johnson, S. Shooter, K. Buf-finton, F. Canas, J. Carff, and W. Howell. The yobotics-ihmc lower body humanoidrobot. In Proceedings of the 2009 IEEE/RSJ International Conference on Intelligent

Robots and Systems, pages 410–411, 2009.

[58] G. A. Pratt and M. M. Williamson. Series elastic actuators. In Proceedings of the

1995 IEEE/RSJ International Conference on Intelligent Robots and Systems, pages399–406, 1995.

[59] J. Pratt, B. Krupp, and C. Morse. Series elastic actuators for high fidelity force control.Industrial Robot An International Journal, 29(3):234–241, 2002.

[60] M. A. Roa, R. E. Ramírez, and D. A. Garzón. Development of Biped Robots at the

National University of Colombia, page 357U364. Springer, 2005.

[61] K. D. Mombaur, H. G. Bock, J. P. Schlöder, and R. W. Longman. Open-loop stablesolution of periodic optimal control problems. ZAMM, 85(7):499U515, 2005.

[62] D. B. Leineweber, I. Bauer, H. G. Bock, and J. P. Schlöder. An efficient multipleshooting based reduced sqp strategy for large-scale dynamic process optimization.part 1: theoretical aspects. Computers and Chemical Engineering, 27:157–166, 2003.

Page 107: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

BIBLIOGRAFIA 85

[63] D. B. Leineweber, I. Bauer, H. G. Bock, and J. P. Schloder. An efficient multipleshooting based reduced sqp strategy for large-scale dynamic process optimization:Part ii: Software aspects and applications. Computers and Chemical Engineering,27:167–174, 2003.

[64] K. D. Mombaur, H. G. Bock, J. P. Schloder, and R. W. Longman. Human-like actuatedwalking that is asymptotically stable without feedback. In Proceedings of the 2001

IEEE International Conference on Robotics and Automation, pages 4128–4133, 2001.

[65] K. D. Mombaur, R. W. Longman, H. G. Bock, and J. P. Schloder. Open-loop stablerunning. Robotica, 23:21–33, 2005.

[66] K. D. Mombaur, H. G. Bock, J. P. Schloder, and R. W. Longman. Self-stabilizingsomersaults. IEEE Transactions on Robotics,, 21(6):1148–1157, 2005.

[67] R. M. Alexander. Three uses for springs in legged locomotion. The International

Journal of Robotics Research, 9(2):53–61, 1990.

[68] M. H. Raibert and E. R. Tello. Legged robots that balance. IEEE Expert, page 89,1986.

[69] J. Vermeulen, D. Lefeber, B. Verrelst, and Vanderborght B. Trajectory planning forthe walking biped "lucy". The International Journal of Robotics Research, 25(9):867–887, 2006.

[70] B. Verrelst, R. V. Ham, B. Vanderborght, F. Daerden, D. Lefeber, and J. Vermeulen.The pneumatic biped "lucy"actuated with pleated pneumatic artificial muscles. Auto-

nomous Robots, 18:201–213, 2005.

[71] B. Vanderborght, B. Verrelst, R. V. Ham, M. V. Damme, P. Beyl, and D. Lefeber.Development of a compliance controller to reduce energy consumption for bipedalrobots. Autonomous Robots, 24:419–434, 2008.

[72] R. V. Ham. Compliant Actuation for Biologically Inspired Bipedal Walking Robots.PhD thesis, Vrije Universiteit Brussel, 2006.

[73] H. Geyer, A. Seyfarth, and R. Blickhan. Spring-mass running: simple approximatesolution and application to gait stability. Journal of Theoretical Biology, 232:315–328, 2005.

[74] F. Iida, J. Rummel, and A. Seyfarth. Bipedal walking and running with compliantlegs. In Proceedings of the 2007 IEEE International Conference on Robotics and

Automation, pages 3970–3975, 2007.

Page 108: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

86 BIBLIOGRAFIA

[75] Y. Blum, S. W. Lipfert, and A. Seyfarth. Effective leg stiffness in running. Journal of

Biomechanics, 42:2400–2405, 2009.

[76] J. A. Smith and A. Seyfarth. Exploring toe walking in a bipedal robot. Autonome

Mobile Systeme, pages 287–293, 2007.

[77] T. Kerscher, J. Albiez, J. M. Zollner, and R. Dillmann. Evaluation of the dynamic mo-del of fluidic muscles using quick-release. In Proceedings of the 2006 first IEEE/RAS-

EMBS International Conference on Biomedical Robotics and Biomechatronics, pages637–642, 2006.

[78] K. Hosoda and K. Narioka. Synergistic 3d limit cycle walking of an anthropomorphicbiped robot. In Proceedings of the 2007 IEEE/RSJ International Conference on Intel-

ligent Robots and Systems, pages 470–475, 2007.

[79] K. Hosoda, T. Takuma, A. Nakamoto, and S. Hayashi. Biped robot design powe-red by antagonistic pneumatic actuators for multi-modal locomotion. Robotics and

Autonomous Systems, 56:46–53, 2008.

[80] C. Paul. Sensorimotor control of biped locomotion. Adaptive Behavior, 13(1):67–80,2005.

[81] R. Zaier and S. Kanda. Adaptive locomotion controller and reflex system for hu-manoid robots. In Proceedings of the 2008 IEEE/RSJ International Conference on

Intelligent Robots and Systems, pages 2492 –2497, 2008.

[82] T. Geng, B. Porr, and F. Worgotter. A reflexive neural network for dynamic bipedwalking control. Neural Computation, 18:1156–1196, 2006.

[83] P. Manoonpong, T. Geng, B. Porr, and F. Worgotter. The runbot architecture foradaptive, fast, dynamic walking. In Proceedings of the 2007 IEEE International Sym-

posium on Circuits and Systems, pages 1181–1184, 2007.

[84] Q. Huang and Y. Nakamura. Sensory reflex control for humanoid walking. IEEE

Transactions on Robotics, 21(5):977–984, 2005.

[85] G. Taga, Y. Yamaguchi, and H. Shimizu. Self-organized control of bipedal locomotionby neural oscillators in unpredictable environment. Biological Cybernetics, 65:147–159, 1991.

[86] G. Taga. A model of the neuro-musculo-skeletal system for human locomotion. ii.real-time adaptability under various constraints. Biological Cybernetics, 73:113–121,1995.

Page 109: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

BIBLIOGRAFIA 87

[87] G. Taga. A model of the neuro-musculo-skeletal system for human locomotion. i.emergence of basic gait. Biological Cybernetics, 73:97–111, 1995.

[88] K. Matsuoka. Mechanisms of frequency and pattern control in the neural rhythmgenerators. Biological Cybernetics, 56:345–353, 1987.

[89] K. Hase and N. Yamazaki. Computational evolution of human bipedal walking by aneuro-musculo-skeletal model. Artificial Life and Robotics, 3:133–138, 1999.

[90] N. Ogihara and N. Yamazaki. Generation of human bipedal locomotion by a bio-mimetic neuro-musculo-skeletal model. Biological Cybernetics, 84(1):1–11, 2001.

[91] O. Katayama, Y. Kurematsu, and S. Kitamura. Theoretical studies on neuro oscillatorfor application of biped locomotion. In Proceedings of the 1995 IEEE International

Conference on Robotics and Automation, pages 2871–2876, 1995.

[92] J. Shan and F. Nagashima. Neural locomotion controller design and implementationfor humanoid robot hoap-1. In Proceedings of The 20th Annual Conference of the

Robotics Society of Japan 2002, 2002.

[93] K. Tsuchiya, S. Aoi, and K. Tsujita. Locomotion control of a biped locomotion ro-bot using nonlinear oscillators. In Proceedings of the 2003 IEEE/RSJ International

Conference on Intelligent Robots and Systems, pages 1745–1750, 2003.

[94] S. Aoi and K. Tsuchiya. Locomotion control of a biped robot using nonlinear oscilla-tors. Autonomous Robots, 19:219–232, 2005.

[95] G. Endo, J. Morimoto, J. Nakanishi, and G. Cheng. An empirical exploration ofa neural oscillator for biped locomotion control. In Proceedings of the 2004 IEEE

International Conference on Robotics and Automation, pages 3036–3042, 2004.

[96] H. Kimura, Y. Fukuoka, and A. H. Cohen. Biologically inspired adaptive walkingof a quadruped robot. Philosophical Transactions of the Royal Society - Series A:

Mathematical, Physical and Engineering Sciences, 365:153–170, 2007.

[97] C. Lathion. Biped locomotion on the hoap2 robot. Master’s thesis, Ecole Polytechni-que Fédérale de Lausanne, 2006.

[98] P. Cominoli. Development of a physical simulation of a real humanoid robot. Master’sthesis, School of Computer and Communication Sciences Swiss Federal Institute ofTechnology, Lausanne, 2005.

Page 110: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

88 BIBLIOGRAFIA

[99] M. Vukobratovic and D. Juricic. Contribution to the synthesis of biped gait. IEEE

Transactions on Biomedical Engineering, BME-16(1):1–6, 1969.

[100] A. Dasgupta and Y. Nakamura. Making feasible walking motion of humanoid robotsfrom human motion capture data. In Proceedings of the 1999 IEEE International

Conference on Robotics and Automation, pages 1044–1049, 1999.

[101] T. Arakawa and T. Fukuda. Natural motion generation of biped locomotion robotusing hierarchical trajectory generation method consisting of ga, ep layers. In Procee-

dings of the 1997 lEEE International Conference on Robotics and Automation, pages211–216, 1997.

[102] M. B. Popovic, A. Goswami, and H. Herr. Ground reference points in legged locomo-tion: Definitions, biological trajectories and control implications. The International

Journal of Robotics Research, 24(12):1013–1032, 2005.

[103] J. Park. Synthesis of natural arm swing motion in human bipedal walking. Journal of

Biomechanics, 41:1417–1426, 2008.

Page 111: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

Apêndice A

HOAP-2

Este robô tem 25 juntas com dois braços de 5 graus de liberdade, duas pernas com 6 grausde liberdade, a cabeça com 2 graus de liberdade, e uma junta no tronco.

Figura A.1: Juntas do robô HOAP-2.

89

Page 112: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

90 APÊNDICE A. HOAP-2

Figura A.2: Definição dos parâmetros de distância entre as juntas.

Page 113: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

91

Figura A.3: Coordenadas dos parâmetros de Denavit-Hartenberg.

Page 114: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

92 APÊNDICE A. HOAP-2

Tabela A.1: Parâmetros de Denavit-Hartenberg e distâncias entre as juntas.

Page 115: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

93

Figura A.4: Posição dos sensores de pressão do robô.

Page 116: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

94 APÊNDICE A. HOAP-2

Tabela A.2: Propriedades físicas das diferentes partes do robô.

Page 117: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

95

Page 118: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

96 APÊNDICE A. HOAP-2

Page 119: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

97

Page 120: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

98 APÊNDICE A. HOAP-2

Page 121: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

Apêndice B

NAO

Este robô tem 22 juntas com dois braços de 4 graus de liberdade, duas pernas com 6 grausde liberdade, a cabeça com 2 graus de liberdade, e uma junta no tronco.

99

Page 122: André Queirós Gonçalves Locomoção Bípedeintranet.dei.uminho.pt/gdmi/galeria/temas/pdf/50115.pdf · geração de uma locomoção robusta é ainda um problema difícil de resolver

100 APÊNDICE B. NAO

Figura B.1: Juntas do robô NAO.