CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM...

202
MARIA DE JESUS TROVOADA DOS SANTOS CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM BASE EM MARCADORES DO CROMOSSOMA Y E DNA MITOCONDRIAL Dissertação apresentada à Faculdade de Ciências e Tecnologia da Universidade de Coimbra para obtenção do grau de Doutor em Antropologia, especialidade de Antropologia Biológica Universidade de Coimbra 2004

Transcript of CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM...

Page 1: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

MARIA DE JESUS TROVOADA DOS SANTOS CARACTERIZAÇÃO GENÉTICA DE

SÃO TOMÉ E PRÍNCIPE COM BASE EM MARCADORES DO

CROMOSSOMA Y E DNA MITOCONDRIAL

Dissertação apresentada à Faculdade de Ciências e Tecnologia

da Universidade de Coimbra para obtenção do grau de Doutor em Antropologia, especialidade de Antropologia Biológica

Universidade de Coimbra 2004

Page 2: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

ÍNDICE

ÍNDICE DE FIGURAS………………………………………………………………… vii ÍNDICE DE TABELAS………………………………………………………………… ix RESUMO………………………..…………………………….……………………...… xi

SUMMARY.....…………………………….………………………... xix

AGRADECIMENTOS……………………………………………………………....… xxvii

I - INTRODUÇÃO

1.1 - Introdução geral………………………….……………….……………..….. 3

1.2 - São Tomé e Príncipe: história e povoamento……………………………... 6

1.2.1 - A Localização……………………..…………….……………............... 6

1.2.2 - A Descoberta………………………..…………….……………............ 7

1.2.3 - Povoamento e resenha histórica ………………………..……............... 8

1.2.3.1 - Ciclo do açúcar………………………………………..………....... 8

1.2.3.2 - Ciclo do café e do cacau….......................................................... 10

1.2.4 - Estrutura populacional………...………………….……........................ 12

1.2.5 - Língua……………………………………………………………..…... 15

1.3 - Cromossoma Y e DNA mitocondrial……………………………………… 16

1.3.1 - Cromossoma Y…………………………………………………………. 16

1.3.1.1 - Estrutura e conteúdo génico…………………………..……........... 16

1.3.1.2 - Características chave em estudos evolutivos……..……….…..... 17

1.3.1.3 - Subestruturação geográfica de linhagens do Y……….…..….… 18

Page 3: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

1.3.1.4 - Marcadores genéticos ……......................................................... 19

1.3.1.4.1 - Marcadores multialélicos………………………......... 21

1.3.1.4.2 - Marcadores bialélicos………….................................. 22

1.3.2 - DNA mitocondrial…………………………………………………….. 24

1.3.2.1 - Organização do genoma mitocondrial…………….…………... 24

1.3.2.2 - Taxa de substituição nucleotídica………….…………..…….… 26

1.3.2.3 - Modo de transmissão………………………………...………....... 27

1.3.2.4 - Heteroplasmia do mtDNA…....................................................... 28

1.3.2.5 - Filogenia de linhagens de mtDNA………………..……………… 29

1.3.3 - Padrões de diversidade do cromossoma Y e do mtDNA em África…... 30

1.3.3.1 - A Expansão do Homem Moderno………………………………... 30

1.3.3.2 - A expansão Bantu…………………………………………...………. 32

1.3.3.3 - Afinidades com a Península Ibérica e a Península Arábica....... 33

1.3.3.4 - África e as descobertas quinhentistas ………………………….... 35

1.4 - Objectivos………………………………………………………………...… 39

II - MATERIAL E MÉTODOS

2.1 - Amostras………………………………………………...……………..…… 43

2.2 - Extracção de DNA…………...…………………...………………………... 44

2.2.1 - Extracção a partir de sangue total……………………………….…….. 44

2.2.1.1 - Extracção por Chelex………………...…………......................... 44

2.2.1.2 - Extracção por fenol-clorofórmio……………………...…….…... 45

2.2.2 - Extracção a partir de manchas…………………….…………….…….. 46

2.3 - Marcadores do cromossoma Y…………………………………...……….. 46

2.3.1 - Microssatélites………………………………………………………… 47

2.3.1.1 - Condições de amplificação………………………...…………….. 47

2.3.1.2 - Separação automática de fragmentos de DNA amplificados….. 48

2.3.1.3 - Separação não-automática de fragmentos de DNA amplificados…………………………………………………………... 49

2.3.1.4 - Método de visualização do DNA amplificado……………....…... 49

2.3.1.5 - Genotipagem de STRs……………………………………………… 50

2.3.2 - Marcadores Biológicos…………………………………………………. 50

2.3.2.1 - Condições de amplificação………….…………………….…….. 51

Page 4: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

2.3.2.2 - Digestão enzimática e separação dos fragmentos digeridos….. 52

2.3.2.3 - Classificação dos haplogrupos……………………………...……. 53

2.4 - DNA mitocondrial………………………………………………………….. 55

2.4.1 - Amplificação e sequenciação………………….………….…..……….. 55

2.4.2 - Classificação de sequências……………………………………...……. 56

2.5 - Análise estatística………………………………………………...…..….…. 57

III - RESULTADOS E DISCUSSÃO

3.1 - STRs do cromossoma Y………………………...……………………….…. 61

3.1.1 - Análise locus a locus……………………...……………………….….. 61

3.1.2 - Análise haplotípica……………………………...………………….…. 67

3.1.3 - Padrão de partilha……………………………………………………... 71

3.1.4 - Distribuição de diferenças entre pares de haplótipos …………….…… 72

3.1.5 - Diferenciação genética entre populações……………………………… 75

3.1.6 - Estruturação genética em São Tomé e Príncipe inferida com STRs do Y………………………………………………………………………. 77

3.1.7 - Considerações globais sobre o estudo de STRs do Y em São Tomé e Príncipe.. ……………………………………………………………... 79

3.2 - Marcadores bialélicos……………………………………………………... 84

3.2.1 - Perfil de haplogrupos e comparação com outras populações ……… 84

3.2.2 - Padrão de diversidade e comparação entre Angolares, Tongas e Forros 92

3.2.3 - Avaliação da diferenciação genética entre Angolares, Tongas e Forros 95

3.2.4 - Análise conjunta de SNPs e STRs….……………………...………….. 96

3.2.5 - Considerações globais sobre o estudo de marcadores bialélicos do Y em São Tomé e Príncipe…………………………………………….... 99

3.3 - DNA Mitocondrial…………………………………………………………. 101

3.3.1 - Pesquisa de mutações “fantasma”……….………………….…............ 101

3.3.2 - Níveis de diversidade em HVS-I e HVS-II em São Tomé e Príncipe.... 103

3.3.3 - Perfil de haplogrupos em São Tomé e Príncipe…………….……….... 106

3.3.4 - Árvore filogenética de sequências de mtDNA………………………... 108

3.3.5 - Estruturação genética em São Tomé e Príncipe inferida com mtDNA.. 110

3.3.6 - Comparação com outras populações africanas ……….………………. 111

3.3.6.1 - Diversidade molecular…………………………………...……. 112

3.3.6.2 - Padrão de partilha de sequências de mtDNA…………………. 114

Page 5: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

3.3.6.3 - Análise de componentes principais……………………...…...... 118

3.3.7 - Considerações globais sobre o estudo de mtDNA em São Tomé e Príncipe…...……………………..………....…….………....………… 120

3.3.7.1 - Padrão de variação de mtDNA em São Tomé e Príncipe……... 120

3.3.7.2 - Achegas do mtDNA sobre a questão da origem dos Angolares. 122

3.3.7.3 - Afinidades genéticas entre Angolares, Forros e Tongas……….. 125

3.3.7.4 - Fluxo génico mediado pelo sexo feminino entre grupos sãotomenses.………....……………....…….………....…………………....…….. 126

IV – CONCLUSÕES…………………………………………………………………... 131

V - BIBLIOGRAFIA………………….………………………………………………. 139

VI - APÊNDICES……………………………………………………………………. 163

Apêndice 1 - Frequências de haplogrupos definidos por marcadores bialélicos

utilizadas na análise de componentes principais………………………….. 165 Apêndice 2 - Haplótipos de STRs dentro de haplogrupos definidos por marcadores

bialélicos do Y em amostras de Angolares, Forros e Tongas…………….. 167 Apêndice 3 - Frequência de haplogrupos definidos por mtDNA em amostras de

Angolares, Forros e Tongas .……………………………………………. 169 ARTIGO 1 Polimorfismos Genéticos de ESD, GLO1, GPT e PGM1 em São Tomé e Príncipe ARTIGO 2

Evidence for population sub-struturing in São Tomé e Príncipe as inferred from Y chromosome STR analysis. ARTIGO 3

Pattern of mtDNA Variation in Three Populations from São Tomé e Príncipe.

Page 6: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

ÍNDICE DE FIGURAS Figura 1.1 - Mapa e localização de São Tomé e Príncipe …………………………. 7

Figura 1.2 - Esquema do cromossoma Y ….………………………………………. 17

Figura 1.3 - Esquema da molécula de DNA mitocondrial humano………………... 25

Figura 2.1 - Mapa da ilha de São Tomé com os locais de recolha de amostras…..... 44

Figura 2.2 - Haplogrupos possíveis de discriminar com 14 marcadores bialélicos do Y ………………………………………………………...................

54

Figura 2.3 - Esqueleto filogenético mostrando as sequências de HVS-I e HVS-II do mtDNA ……………………………………………………………. 56

Figura 3.1 - Distribuição de frequências alélicas de sete STRs em amostras populacionais de São Tomé e Príncipe e outras populações ……….… 64

Figura 3.2 - Distribuição do número e da média das diferenças entre pares de haplótipos definidos por STRs do Y ………………………………… 73

Figura 3.3 - Árvore neighbour-joining dos três grupos populacionais sãotomenses e outras populações africanas e portuguesas .………………………... 77

Figura 3.4 - Distribuições de frequências de haplogrupos definidos pelos marcadores bialelicos do Y observadas em São Tomé e Príncipe……. 85

Figura 3.5 - Perfil de haplogrupos na amostra de São Tomé e Príncipe e estimativas de componentes europeu e subsariano …………………... 89

Figura 3.6 - Projecção dos dois componentes principais obtidos com frequência de haplogrupos definidos por marcadores bialélicos do Y ..……….......... 92

Figura 3.7 - Distribuição de pares de diferenças e média das diferenças entre pares de haplogrupos ……………………………..……………………….... 94

Figura 3.8 - Median-joining networks de haplótipos definidos por STRs ………... 97

Figura 3.9 - Network representando a weighty variation de sequências de mtDNA. 103

Page 7: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

Figura 3.10 - Distribuições do número de diferenças nucleotídicas entre pares de sequências de mtDNA …….………………………………………….. 105

Figura 3.11 - Distribuição de haplogrupos de mtDNA em São Tomé e Príncipe… 107

Figura 3.12 - Árvores filogenéticas de sequências de mtDNA em amostras de São Tomé e Príncipe………………………………………………………. 109

Figura 3.13 - Distribuição de diferenças entre pares de sequências de mtDNA em diferentes amostras populacionais…………..……………………….... 114

Figura 3.14 - Projecção dos dois componentes principais obtidos com frequências relativas de haplogrupos de mtDNA subsarianos……………….……. 120

Page 8: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

ÍNDICE DE TABELAS

Tabela 2.1 - Composição de soluções utilizadas no processo de extracção de DNA.. 46

Tabela 2.2 - Sequência e marcação dos primers utilizados na amplificação de sete STRs do cromossoma Y……………….……………………………... 47

Tabela 2.3 - Condições de amplificação dos STRs do cromossoma …….………… 48

Tabela 2.4 - Soluções utilizadas e tempos de incubação na técnica de coloração com nitrato de prata…………………..……………………………….. 50

Tabela 2.5 - Primers, condições de amplificação e tamanho dos fragmentos obtidos para cada marcador……………….…………………………... 51

Tabela 2.6 - Condições da digestão enzimática, substituição nucleotídica e fragmentos resultantes para cada SNP……………………………...…. 53

Tabela 2.7 - Sequência dos primers utilizados na análise das regiões HVS-I e II do DNA Mitocondrial..…………………………………………………… 55

Tabela 2.8 - Condições das reacções de amplificação e de sequenciação das regiões HVS-I e HVS-II…………………………….………………… 55

Tabela 3.1 - Estimativas de frequências alélicas para sete STRs em São Tomé Príncipe………………………………………………………………... 62

Tabela 3.2 - Diversidade génica relativa a sete STRs em amostras de São Tomé e Príncipe e outras populações……………………………..…………… 65

Tabela 3.3 - Valores de FST por locus e médios, relativos a sete STRs do cromossoma Y………………………………………..……………….. 66

Tabela 3.4 - Haplótipos de STRs do cromossoma Y encontrados em Angolares, Forros, e Tongas, e número de matches …………..………………….. 68

Page 9: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

Tabela 3.5 - Índices de diversidade haplotípica em São Tomé e Príncipe e outras populações…………………………………………………………… 70

Tabela 3.6 - Valores de RST entre pares de populações………………………… 75

Tabela 3.7 - Percentagem de variação produzida por AMOVA na população sãotomense…………………………………………………………….. 78

Tabela 3.8 - Parâmetros de diversidade em Angolares, Forros, Tongas e na amostra global de São Tomé e Príncipe………………………………. 93

Tabela 3.9 - Percentagem de variação em diferentes níveis hierárquicos de agrupamentos populacionais produzido por AMOVA………………... 95

Tabela 3.10 - Índices de diversidade de sequências HVS-I e HVS-II em populações de São Tomé e Príncipe……………………...………………………… 104

Tabela 3.11 - Percentagem de variação produzida por AMOVA com diferentes níveis de hierarquização dos grupos populacionais sãotomenses……... 110

Tabela 3.12 - Código, proveniência, tamanho das amostras e referências bibliográficas para as populações africanas consideradas neste estudo. 111

Tabela 3.13 - Medidas de diversidade e neutralidade para sequências HVS-I em São Tomé e Príncipe e de outras regiões africanas…………….……… 112

Tabela 3.14 - Sequências sãotomenses partilhadas com outros grupos populacionais africanos…………………………………………...…........................... 117

Page 10: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de
Page 11: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

xi

RESUMO

A análise do padrão de variação genética em populações humanas contemporâneas,

constitui uma fonte importante de informações quando se procura reconstituir a sua

origem e história evolutiva. Entre os múltiplos instrumentos de investigação genética,

têm-se destacado os polimorfismos da região não recombinante do cromossoma Y ou

do mtDNA, dadas algumas das suas propriedades, nomeadamente, transmissão

uniparental, haplóidia e ausência de recombinação. O estudo desses marcadores, tem

permitido inferir muitos aspectos da história demográfica de linhagens masculinas e

femininas em contextos de investigação muito diversificados, pelo que tem vindo a ser

cada vez mais recrutado em numerosas áreas de pesquisa antropológica.

Neste trabalho, utilizou-se esse tipo de marcadores para estudar o arquipélago de São

Tomé e Príncipe, uma ex-colónia portuguesa localizada no Golfo da Guiné. A sua

história populacional remonta apenas a finais do século XV quando foi descoberto por

navegadores portugueses. Na altura era desabitado e os portugueses, apercebendo-se da

localização estratégica para as suas actividades comerciais, cedo investiram no

povoamento de São Tomé e Príncipe. O projecto português para São Tomé e Príncipe

foi transformar o arquipélago, de início, num centro de produção de cana-de-açúcar e

entreposto para o comércio de escravos e, a partir do século XIX, num espaço de

exploração intensiva da cultura do café e do cacau. A sociedade sãotomense actual, é

fruto de um processo de povoamento conturbado e sobre o qual os registos históricos,

embora proporcionem os traços gerais, são bastante escassos. Presentemente, sobre a

estrutura populacional do arquipélago, é percepção comum a existência de três grupos

populacionais, Forros, Tongas e Angolares, que são também uma referência constante

Page 12: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

Resumo

xii

na bibliografia sobre São Tomé e Príncipe. Forros são todos aqueles cujos antepassados

chamados “homens livres”. Tongas são os descendentes dos imigrantes forçados

provenientes de Angola, Cabo Verde e Moçambique que, entre o século XIX e meados

do XX, entraram em massa no arquipélago para trabalhar nas roças do cacau e do café.

Os Angolares constituem um pequeno grupo mas com traços de identidade bem

vincados. Até há pouco viviam concentrados na região sudeste da ilha, mas actualmente

também se encontram em pequenas povoações dispersas pelo litoral de São Tomé e do

Príncipe. Quanto à origem dos Angolares, a documentação existente é bastante

imprecisa, pelo que permanecem em aberto algumas hipóteses sobre a questão.

No presente estudo, por recurso a técnicas de PCR, PCR/RFLP e/ou sequenciação

directa, analisaram-se os padrões de distribuição de 7 STRs (DYS19, DYS389I,

DYS389II, DYS390, DYS391, DYS392 e DYS393) e 14 marcadores bialélicos (YAP,

SRY8299, 92R7, SRY1532, SRY2627, Tat, sY81, M9, LLy22g, 12f2, M109, M112,

M150 e M168) do cromossoma Y e de variações de sequência em HVS-I e HVS-II do

mtDNA, em amostras de Angolares, Forros e Tongas, tendo em vista os seguintes

objectivos:

- avaliar o nível de subestruturação populacional actualmente existente em São

Tomé e Príncipe;

- entender como se geraram os padrões de distribuição de diversidade

observados e inferir os factores de maior impacto nesses padrões;

- estudar as afinidades de São Tomé e Príncipe com populações africanas e

outras que pudessem contribuir para o esclarecimento do passado genético do

arquipélago;

- contribuir para a caracterização fina da diversidade genética no continente

africano.

De forma a possibilitar o enquadramento dos resultados obtidos, utilizaram-se dados,

recolhidos da bibliografia, de outras amostras populacionais europeias e africanas.

Relativamente aos STRs do cromossoma Y, as distribuições alélicas encontradas para

cada marcador em São Tomé e Príncipe diferem significativamente das observadas em

populações europeias mas, pelo contrário, tendem a enquadrar-se bem nos padrões

comuns em populações africanas. Também quanto à variância do número médio de

Page 13: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

Resumo

xiii

repetições, um parâmetro em que, para STRs do Y, as populações africanas se

distinguem das europeias, o valor encontrado na amostra global de São Tomé e Príncipe

(0.886) é elevado e de uma ordem de grandeza que, em geral, apenas se regista em

africanos. Estes resultados reflectem a forte contribuição de escravos para o

povoamento do arquipélago, cuja proveniência terá sido a faixa ocidental atlântica do

continente africano.

No entanto, os STRs do Y também manifestam sinais de que a contribuição europeia

para o gene pool masculino da população de São Tomé e Príncipe não foi irrelevante. O

STR que individualmente melhor reteve essa influência foi DYS390, um marcador com

elevada capacidade para diagnosticar populações europeias e africanas. O segundo alelo

mais frequente (13.6%) em São Tomé e Príncipe é DYS390*24, um alelo muito raro em

populações africanas subsarianas, mas comum em europeus, nomeadamente do Norte e

Centro de Portugal. Outros indícios desse contributo surgiram da análise do padrão de

partilha de haplótipos do Y definidos pelos 7 STRs. Na amostra global do arquipélago,

num total de 103 cromossomas Y, encontraram-se 79 haplótipos distintos, o que se

traduziu num nível de diversidade haplotípica elevado (0.987±0.006), como se verifica

na maioria das populações. No sentido de procurar inferir a origem geográfica das

linhagens sãotomenses, investigou-se o padrão de matches com os registos contidos

numa base de dados de populações de origem europeia e com os de outra que se

construiu com populações africanas. Alguns haplótipos sãotomenses apresentam

numerosos matches com populações europeias, incluindo portuguesas, o que leva a crer

que a sua presença em São Tomé e Príncipe tivesse resultado de introgressão mediada,

muito provavelmente, por homens portugueses. Com base em STRs não se estimou a

fracção do componente genético de São Tomé e Príncipe de presumível origem

europeia, mas parece ser a presença desse componente, associada ao facto de o aporte

de linhagens africanas ter sido originário de áreas de recrutamento bastante dispersas,

que explica a observação de um valor muito elevado para a diferença média entre pares

de haplótipos sãotomenses (6.19±2.97).

Sobre os grupos populacionais sãotomenses, Forros e Tongas compartilham

basicamente o mesmo padrão de variação ao nível de STRs do Y e, consequentemente,

não diferem geneticamente entre si (RST = - 0.067, P>5%). Pelo contrário, os Angolares

Page 14: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

Resumo

xiv

distinguem-se de Tongas e Forros pela clara redução de diversidade, o que se observou

em diferentes parâmetros de avaliação: são os Angolares que apresentam os valores

mais baixos de heterozigotia média por STR (0.504±0.298), de diversidade haplotípica

(0.967±0.030), diversidade génica (0.504±0.298), da variância média do número de

repetições (0.554) e do número médio de diferenças entre pares de haplótipos

(4.69±2.39). São sinais que indiciam uma certa microdiferenciação dos Angolares e que

se reflectiu na observação de distâncias genéticas significativas não só relativamente a

Forros (RST = 0.916, P<5%) ou Tongas (RST =0.853, P<5%), mas também relativamente

a qualquer das restantes populações africanas com que se compararam. Em

conformidade, quando se aplicou AMOVA para investigar o grau de subestruturação

populacional no interior de São Tomé e Príncipe, detectou-se uma percentagem

significativa de variação devida a diferenças entre grupos (FCT=0.0324, P<5%) quando

os Angolares foram confrontados com Tongas e Forros. Assim, encontraram-se nos

Angolares traços de uma certa diferenciação genética que poderá ter decorrido de

efeitos de deriva génica, endogamia, ou efeito de fundador, ou seja, os esperados em

grupos populacionais pequenos que mantiveram algum isolamento e escassos contactos

com grupos populacionais circunvizinhos. Todas as fontes históricas referem essas

circunstâncias para os Angolares até há relativamente pouco tempo.

A análise dos marcadores bialélicos do cromossoma Y, permitiu detectar em São Tomé

e Príncipe a presença dos seguintes haplogrupos: E3a, B2a1, B2b, B*(xB2a,b),

P*(xR1a,R1b3f), CR*(xDE,J,K) e E*(xE3a). Os quatro primeiros, altamente específicos

de África subsariana, representam a fracção maioritária das linhagens presentes em São

Tomé e Príncipe. E3a constitui 69.1% dos cromossomas Y sãotomenses, e atinge a

frequência mais elevada, 78.6%, entre os Angolares e a mais baixa nos Tongas, 59.1%.

Os haplogrupos B2a1, B2b e B*(xB2a,b), em conjunto representando 6.5% dos

cromossomas Y sãotomenses, não se encontraram nos Forros mas estavam presentes em

5.4% dos Angolares e em 13.7% dos Tongas.

Quanto a P*(xR1a,R1b3f), um haplogrupo muito comum na Europa e virtualmente

ausente em África, encontrou-se em 11.5% dos indivíduos da amostra global de São

Tomé. CR*(xDE,J,K), é também um haplogrupo que não se encontra habitualmente em

africanos mas que se detectou em 5.7% dos sãotomenses. Atendendo à filogeografia de

P(xR1a,R1b3f) e CR*(xDE,J,K), a explicação mais provável para a sua presença na

Page 15: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

Resumo

xv

população actual de São Tomé e Príncipe é de terem sido introduzidos por indivíduos

masculinos de origem europeia e, portanto, a frequência combinada dos dois

haplogrupos - 17.3% - constitui uma estimava do valor mínimo do componente genético

europeu em São Tomé e Príncipe. 7.2% dos cromossomas Y sãotomenses eram do

haplogrupo E*(xE3a). Trata-se de um haplogrupo muito heterogéneo, incluindo no

padrão de distribuição geográfica pois encontra-se espalhado por toda a África, mas

também pelo Médio Oriente e Europa. Por ser impossível inferir a origem geográfica de

cromossomas E*(xE3a) sem recorrer a uma caracterização molecular mais fina,

utilizou-se uma extrapolação para inferir que o aporte português de linhagens em São

Tomé e Príncipe incluiria cerca 3.1% de haplogrupos tipo E*(xE3a). Assim, estimou-se

em 20.7%, a fracção de linhagens masculinas de origem europeia actualmente existente

em São Tomé e Príncipe. Esta proporção supera substancialmente o que está

documentado sobre a reduzida fracção de europeus relativamente a africanos registada

em diferentes períodos no arquipélago e o desfasamento traduz a grande variância no

sucesso reprodutivo dos indivíduos que contribuíram para o povoamento de São Tomé e

Príncipe.

O componente europeu atinge 27.2% entre os Forros, o grupo populacional maioritário

no arquipélago, é de 21.4% nos Tongas e apresenta a proporção mais baixa nos

Angolares, 14.7%. É um resultado que denuncia novamente os contactos menos

intensos entre os Angolares e outros habitantes de São Tomé, neste caso europeus, e que

se explica pela história de isolamento em que o grupo se manteve durante muito tempo.

Quanto a haplótipos definidos por marcadores bialélicos do Y, os Angolares

distinguem-se outra vez pelos baixos níveis de diversidade, quer no que respeita à

proporção de haplogrupos diferentes (8.93%) quer nos níveis de diversidade de

haplogrupos (0.376±0.080), génica (0.098±0.068) ou número médio de pares de

diferenças entre haplogrupos (1.375±0.860). Em oposição, para os mesmos parâmetros

os Tongas registam os valores mais elevados, o que se pode entender pela grande

dispersão geográfica das regiões de origem dos seus ancestrais. Angola, Cabo Verde e

Moçambique foram as fontes de fornecimento de serviçais pelo que, de certa forma, os

Tongas representam uma sub-amostragem da região subsariana de África

geograficamente bastante mais abrangente que a representada pelos Forros, cujos

ancestrais foram mais restritivamente recrutados na faixa continental atlântica entre os

Page 16: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

Resumo

xvi

actuais Costa de Marfim e Angola. Compreende-se assim algum excesso de diversidade

dos Tongas relativamente aos Forros. Não obstante estas observações, com base em

haplogrupos definidos por marcadores bialélicos do Y não se detectam distâncias

genéticas estatisticamente significativas entre Angolares, Forros ou Tongas: FST Forros/

Tongas = 0.008, P=0.27; FST Forros/ Angolares = 0.003, P=0.26; FST Tongas/ Angolares

= 0.032, P=0.09.

A fim de investigar o padrão de variação das linhagens maternas em São Tomé e

Príncipe, analisaram-se em amostras de Angolares, Forros e Tongas sequências de

HVS-I e HVS-II do DNA mitocondrial. Quanto aos níveis de diversidade em HVS-I e

HVS-II, novamente os Angolares se distinguem de Forros ou Tongas pela redução de

heterozigotia média e proporção de haplogrupos diferentes. Nos Angolares o número

médio de diferenças entre sequências é um pouco mais elevado do que nos dois outros

grupos populacionais, mas o padrão de distribuição de pares de diferenças angolar é

mais irregular e difere significativamente do esperado assumindo um modelo de

expansão populacional, ao contrário do que se observa em Forros ou Tongas.

Sobre a diferenciação genética entre os três grupos populacionais, os dados de mtDNA

apontam no mesmo sentido que os de STRs do Y e indicam que existem diferenças

significativas entre Angolares e Forros (FST=0.037, P=0.04) ou Angolares e Tongas

(FST=0.030, P=0.04), e ausência de diferenciação entre Forros e Tongas (FST =0.01,

P=0.14). Quando se aplica AMOVA a sequências de mtDNA, a percentagem de

variação devida a diferenças entre grupos também atinge o valor mais elevado quando

os Angolares são confrontados com Forros+Tongas (FCT=0.024) mas porém, ao

contrário do observado com STRs, essa proporção não atinge níveis de significância

estatística. Estas observações sugerem que entre os grupos populacionais sãotomenses

não se verificaram restrições tão marcadas do fluxo génico mediado pelo sexo feminino

como o do mediado pelo sexo masculino, o que poderá ter decorrido, por um lado, de

uma certa generalização em São Tomé e Príncipe de sistemas de acasalamento

poligâmicos, com consequente diminuição relativa do tamanho efectivo da população

masculina e, por outro, de uma prática antiga entre os Angolares, e persistente durante

séculos, de procurarem mulheres fora da comunidade.

Page 17: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

Resumo

xvii

As sequências de mtDNA sãotomenses, pertenciam a 32 haplogrupos distintos todos

específicos de regiões subsarianas, o que significa que o impacto europeu no pool de

linhagens femininas de São Tomé e Príncipe foi virtualmente nulo. O desequilíbrio

relativamente ao observado para linhagens paternas, testemunha o forte enviezamento

do tipo de cruzamentos entre europeus e africanos e que se entende pelo facto de ter

sido sempre muito reduzido o número de mulheres europeias que foi para São Tomé e

Príncipe e por um contexto social que, estimulando os cruzamentos entre homens

europeus e mulheres africanas, era muito estigmatizador das ligações recíprocas.

Na amostra global sãotomense, os quatro haplogrupos mais frequentes são L1b, L1c,

L2a e L3e1*, que no conjunto representam 56 % do total das sequências, enquanto que

33% pertencem a sete haplogrupos que ocorrem com frequências mais moderadas, L1a,

L2b, L2c, L3*, L3b, L3d e L3e2. Pelas características filogeográficas, pode concluir-se

que predominam em São Tomé e Príncipe ou haplogrupos que são típicos de África

Central e/ou Ocidental ou outros que se encontram amplamente disseminados pelo

continente africano. Portanto, o perfil de linhagens de mtDNA de São Tomé e Príncipe

sugere uma origem principal a partir dum substrato típico do centro/sudoeste atlântico

de África, o que vai ao encontro com o que está documentado sobre as áreas de

fornecimento dos escravos transportados para São Tomé e Príncipe no período que

antecedeu o ciclo do café e do cacau.

No sentido de obter achegas adicionais sobre a origem geográfica das linhagens de

mtDNA sãotomenses, efectuou-se uma análise de matches entre estas e as contidas

numa base de dados construída com sequências de diversas populações africanas, tendo-

se detectado uma frequência de partilha muito elevada com sequências de Cabo Verde,

em especial do grupo NO de ilhas. Esta observação parece ser o reflexo do recente

influxo migratório que se registou em São Tomé e Príncipe, iniciado no século XIX

com a exploração das culturas do café e do cacau, e que envolveu a entrada de

numerosos serviçais de Angola, Moçambique e Cabo Verde, mas em que apenas os de

proveniência cabo-verdiana incluíam uma quota feminina relevante. A análise do

padrão de partilha revela ainda que os Angolares são os que partilham menor proporção

(43.8%) de linhagens de mtDNA com outras populações africanas o que constitui mais

um indicador de que o grupo registou um fluxo génico bastante mais limitado que

Forros ou Tongas.

Page 18: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

Resumo

xviii

Entre os Angolares, o haplogrupo mais bem representado é L1c, e dentro deste, o sub-

grupo L1c1a só aparece mesmo em sequências angolares. O haplogrupo tem uma

distribuição geográfica que sugere ter tido origem na região compreendida entre Angola

e o delta de Congo, uma região que permanece ainda por caracterizar quanto a mtDNA,

mas que poderá ter sido uma das fontes principais de antepassados dos Angolares. Não

obstante a redução de diversidade nos Angolares comparativamente a Forros e Tongas,

o reportório de linhagens de mtDNA angolares é bastante variado, o que se traduz numa

média elevada do número de diferenças entre pares de haplótipos, resultado que parece

mais compatível com um cenário envolvendo a entrada sucessiva de linhagens múltiplas

e heterogéneas, ou seja, o previsto assumindo a hipótese sobre a origem dos Angolares

que considera serem os descendentes dos escravos fugitivos das plantações que ao

longo do tempo foram consolidando uma comunidade relativamente isolada de outros

habitantes de São Tomé e Príncipe, hipótese que os dados linguísticos também

favorecem.

Page 19: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

xix

SUMMARY

Analysis of patterns of genetic variation in contemporaneous human populations

represents an important source of information for reconstructing their origin and

evolutionary history. Among the research tools available attention has been

progressively centred on polymorphisms of the non-recombining region of the Y-

chromosome or the mtDNA, due to their shared properties of uniparental transmission,

haploidy and absence of recombination. The study of these markers affords important

clues about the demographic history of male and female lineages and is being recruited

in numerous areas of anthropologic research.

In this work, the two kinds of markers were used to study the archipelago of São Tomé

e Príncipe, a former Portuguese colony located in the Gulf of Guinea. Its population

history traces back to the end of the XV century when it was discovered by Portuguese

navigators. The archipelago was uninhabited and the Portuguese, recognising its

strategic location for their commercial activities, early invested in the archipelago

settlement. At the beginning, the Portuguese project for São Tomé e Príncipe was to

transform the islands in a centre of sugar production and warehouse for the trade of

slaves and, from the XIX century on, in a place of intensive exploration of coffee and

cacao’ cultures. The present-day Sãotomean society is the result of a complex process of

peopling about which the historic records are rather scarce and vague. Nowadays,

concerning the population structure of the archipelago is a common perception the

existence of three population groups, Angolares, Forros and Tongas, which are also

systematically referred to in the bibliography on São Tomé e Príncipe. Forros are the

Sãotomeans whose ancestor have the origin in the archipelago and include the descents

Page 20: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

Summary

xx

of the first freedman slaves. Tongas have as ancestors the forced immigrants coming

from Angola, Cabo-Verde and Mozambique who, between the XIX century and middle

of the XX, entered in mass into the archipelago to work in the cacao and coffee

productions. Although the Angolares are a very small group, they show the strongest

signals of identity. Until few times ago, they lived concentrated in the Southeast region

of São Tomé but presently they are also spread through small villages located in the

coasts of São Tomé and of Príncipe. Concerning the Angolares’ origin, the historical

documentation is not conclusive and some hypotheses about the question remain

opened.

In this study PCR, PCR/RFLP and/or sequenciation direct methods were used to analyse

the distribution patterns of 7 STRs (DYS19, DYS389I, DYS389II, DYS390, DYS391,

DYS392 and DYS393) and 14 biallelic markers (YAP, SRY8299, 92R7, SRY1532,

SRY2627, Tat, sY81, M9, LLy22g, 12f2, M109, M112, M150 and M168) of the Y

chromosome and sequence variation in HVS-I and HVS-II of mtDNA, in samples from

Angolares, Forros and Tongas, having as main objectives:

- to evaluate the level of populational sub-structure that presently characterises São

Tomé e Príncipe;

- to understand how the observed patterns of diversity were generated and to make

inferences about the factors with greatest impact in those patterns;

- to study the genetic affinities of São Tomé e Príncipe with African and others

populations that could bring clues about the genetic past of the archipelago;

- to contribute to the refinement of the genetic characterisation of Africa. Relatively to

the STRs of the Y chromosome, the allelic distributions found for each marker in São

Tomé e Príncipe significantly differed from the observed in European populations, and

clearly tended to fit well in the patterns commonly registered in African populations.

Also with respect to the variance in the mean number of repeats in Y-STRs, a parameter

that usually assumes distinct values in African and European populations, the value

found in the whole sample of São Tomé e Principe (0.886) was high and of an order of

magnitude that, in general, is only observed in Africans. These results reflect the high

contribution of slaves to the archipelago’ settlement, salves whose main origin was the

Atlantic fringe of the African continent.

Page 21: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

Summary

xxi

However, the Y-STRs also revealed signals that the European contribution to the

Sãotomean male gene pool was not irrelevant. The STR that individually better captured

this influence was DYS390, a marker with high ability to diagnose European and

African populations. The second more frequent allele (13.6%) in São Tomé e Príncipe

was DYS390*24, which is very rare in sub-Saharan populations but is common in

Europeans, including from the North and Centre of Portugal.

Others signs of this contribution were evidenced by the analysis of patterns of shared

haplotypes defined by the 7 Y-STRs. In the whole sample of the archipelago, containing

103 Y-chromosomes, 79 distinct haplotypes were found and the level of haplotypic

diversity was very high (0.987±0.006), as it is usual in most populations. In order to

look for the geographic origin of the Sãotomean Y-STRs lineages, it was examined the

pattern of matches with entries logged in a database for populations of European

descent and in other one constructed for African populations. Some Sãotomean

haplotypes presented numerous matches with Europeans, including Portuguese,

indicating that their presence in São Tomé e Príncipe was the result of introgression

likely mediated by Portuguese men.

Probably, it is the presence of the European component together with the fact that the

African lineages were originated from a considerably dispersed area of recruitment, that

explain the very high value observed for the mean difference between pairs of

Sãotomean Y-STR haplotypes (6.19±2.97).

Focusing on the Sãotomean population groups, Forros and Tongas basically shared the

same pattern of variation at Y-STRs and, consequently, they did not showed significant

genetic differences (RST = - 0.067, P>5%). By the contrary, Angolares could be

distinguished from Tongas and Forros by a clear reduction of diversity that was

assessed by different parameters: they presented the lowest values of mean

heterozigosity for Y-STR (0.504±0.298), of haplotypic diversity (0.967±0.030), gene

diversity (0.504±0.298), variance of the mean number of repeats (0.554) and mean

number of differences between pairs of haplotypes (4.69±2.39).

These are evidences of a certain microdifferentiation of the Angolares that was reflected

in the detection of significant genetic distances with Forros (RST=0.916, P<5%) or

Page 22: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

Summary

xxii

Tongas (RST =0.853, P<5%), and also with any of the remaining African populations

with which Angolares were compared.

In conformity, when AMOVA was applied to investigate the degree of population sub-

structuring in São Tomé e Príncipe, a statistically significant percentage of variation due

to differences between groups was detected (FCT=0.0324, P<5%) when the Angolares

were confronted with Tongas and Forros.

The slight genetic differentiation found within Angolares, seems to be due to

endogamy, genetic drift or founder effect, as expected for small groups that live in

relative isolation and with scarce contacts with surrounding populations. All historic

sources refer to these circumstances for the Angolares until very recently.

The analysis of biallelic markers of the Y-chromosome, led to detect in São Tomé e

Príncipe the presence of the following haplogroups: E3a, B2a1, B2b, B*(xB2a,b),

P*(xR1a,R1b3f), CR*(xDE,J,K) and E*(xE3a). The first four are highly specific of sub-

Saharan Africa and represented the major fraction of the lineages found in São Tomé e

Príncipe. E3a was found in 69.1% of Sãotomean Y-chromosomes and reached the

highest frequency, 78.6%, among the Angolares and the lowest one, 59.1%, among the

Tongas. The haplogroups B2a1, B2b and B*(xB2a,b), globally comprising 6.5% of the

Sãotomean chromosomes, were absent in Forros and were present in 5.4% of the

Angolares and 13.7% of the Tongas.

Concerning P*(xR1a, R1b3f), a haplogroup very common in Europe and virtually

absent in Africa, it represented 11.5% of the whole sample of São Tomé. CR*(xDE, J,

K), a haplogroup also usually not found in Africans, was detected in 5.7% of the

Sãotomeans. Considering the filogeography of P(xR1a, R1b3f) and CR*(xDE, J, K), the

more likely explanation for their presence in São Tomé e Príncipe is to have been

introduced by European males and, therefore, the joint frequency of the two

haplogroups - 17.3% - constitutes an estimation for the minimum value of the European

genetic component in São Tomé e Príncipe. 7.2% of Sãotomean Y-chromosome

belonged to haplogroup E*(xE3a). This is a very heterogeneous haplogroup, including

in the pattern of geographic distribution since it is spread throughout Africa and also in

the Middle East and Europe. Due to the impossibility to infer the geographic origin of

chromosomes E*(xE3a) without a refinement of their molecular characterisation, an

Page 23: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

Summary

xxiii

extrapolation was made to infer that among the São Tomé e Príncipe lineages of

Portuguese ancestry, approximately 3.1% were E*(xE3a). Therefore, the yielded

estimate for the male fraction of European origin in the present-day São Tomé e

Príncipe population was 20.7%. This proportion is substantially greater than the reduced

fraction of Europeans relatively the Africans recorded in different periods for the

archipelago, and the differential translates the high variance in the reproductive success

of the individuals that contributed for the São Tomé e Príncipe’ peopling.

The European component reached 27.2% in Forros, the more numerous population

group of the archipelago, 21.4% in Tongas and the lowest proportion, 14.7%, in

Angolares. This result supports again the weaker contacts between the Angolares and

other São Tomé inhabitants, in this case Europeans, which can be understood by the

long history of considerable isolation of the group.

Relatively to haplotypes defined by Y-biallelic markers, once more the Angolares

exhibited the lowest levels of diversity, either at the proportion of different haplogroups

(8.93%), haplogroup diversity (0.376±0.080), gene diversity (0.098±0.068) or mean

number of differences between pairs of haplogroups (1.375±0.860).

In opposition, for the same parameters the Tongas registered the highest values, which

can be the consequence from the large geographic scattering of the original regions of

their ancestors. Angola, Cabo Verde and Mozambique were the main sources of

contract labourers for the Sãotomean plantations and then, in a certain way, the Tongas

represent a sub-sampling of sub-Saharan Africa geographically more heterogeneous

than the represented by Forros, whose ancestors were more restrictively recruited in the

Atlantic fringe between present-day Ivory Coast and Angola. This can explain the slight

excess of diversity of Tongas comparatively to Forros.

Notwithstanding these observations, based upon haplogroups defined by Y-biallelic

markers, genetic distances between Angolares, Forros or Tongas were not statistically

significant: FST Forros/Tongas = 0.008, P=0.27; FST Forros/Angolares = 0.003, P=0.26;

FST Tongas/Angolares = 0.032, P=0.09.

In order to investigate the pattern of variation of maternal lineages in São Tomé e

Príncipe, HVS-I and HVS-II sequences of mitochondrial DNA were analysed in

samples from Angolares, Forros and Tongas.

Page 24: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

Summary

xxiv

Regarding levels of diversity in HVS-I and HVS-II, the Angolares were again distinct

from Forros or Tongas due to decreased mean heterozigosity and proportion of different

haplogroups. In Angolares, the mean number of differences between sequences was

somewhat higher than in the two other population groups, but the Angolar pattern of

distribution of pairwise differences was more irregular and significantly differed from

the expected assuming a model of population expansion, contrarily to the observed in

Forros or Tongas.

The data from mtDNA produced identical results to those derived from Y-STRs

concerning the genetic differentiation between the three Sãotomean groups, revealing

significant differences between Angolares and Forros (FST=0.037, P=0.04) or Angolares

and Tongas (FST=0.030, P=0.04), and the absence of significant differentiation between

Forros and Tongas (FST=0.01, P=0.14). When AMOVA was applied to the mtDNA

data, the percentage of variation due differences between groups also reached the

highest value when Angolares were compared with Forros+Tongas (FCT=0.024), but

even so, contrarily of the observed with STRs, this proportion did not attained level of

statistical significance. These observations suggest that among the Sãotomean groups

did not exist such marked restrictions to the gene flow mediated by the female sex as

the restrictions to the gene flow mediated by the male sex. For this finding might have

accounted the common trend to polygamic matting systems in São Tomé e Príncipe,

with consequent relative decrease on the effective population size of males, and the old

and persistent practice along centuries among Angolares of looking for women outside

the community.

The Sãotomenses mtDNA sequences belonged to 32 distinct haplogroups, all being

specific from sub-Saharan regions, which means that the European impact in the São

Tomé e Príncipe female pool was virtually nil. The discrepancy relatively to the

observed for the paternal lineages, testifies the strong sex bias in the matting type

between Europeans and Africans occurred in the archipelago, that can be explained by

the fact that the number of European women arriving at São Tomé e Príncipe was

always extremely reduced and by the social context that strongly encouraged the

crossing between European men and African women and repressed the reciprocal

unions.

Page 25: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

Summary

xxv

In the Sãotomean sample, the four most frequent haplogroups were L1b, L1c, L2a and

L3e1*, that together represented 56 % of sequences, while 33% of sequences belonged

to seven haplogroups occurring with more moderate frequencies, L1a, L2b, L2c, L3*,

L3b, L3d and L3e2. From the mtDNA filogeographic pattern, it was possible to deduce

that in São Tomé e Príncipe are predominant either haplogroups typical from Central

and/or Western Africa or others widely spread in the African continent. Therefore, the

profile of mtDNA lineages in the archipelago suggests a main origin from a substratum

characteristic from the Atlantic Central/Western Africa, which fully meets the

documented concerning the areas that supplied the slaves brought to São Tomé e

Príncipe during the period that preceded the coffee and cacao cycle.

Aiming to obtain additional clues about the geographical origin of the mtDNA lineages

found in São Tomé e Príncipe, it was investigated the pattern of matches between

Sãotomean sequences and those contained in a database constructed with African

sequences from other populations. The frequency of shared sequences with Cabo Verde

was rather high, specially with the NO group of islands, and the finding seems to reflect

the recent migration influx that occurred in São Tomé e Príncipe, initiated in the XIX

century with the exploration of the coffee and cacao cultures, and that involved the

entrance of thousands of workers from Angola, Mozambique and Cabo Verde. In the

immigrants’ waves, the female quote was only similar to the male one in that of

Caboverdean provenance.

The analysis of shared mtDNA haplotypes also showed that Angolares were the

Sãotomeans that shared the least proportion (43.8%) of lineages with others Africans,

which constitutes another evidence that the group registered a more limited gene flow

than Forros or Tongas.

Within Angolares, the more frequent haplogroup was L1c and the sub-cluster L1c1a

was only detected in sequences from the group. The haplogroup presents a geographical

distribution that suggests to have been originated in the region between Angola and the

Congo Mouth, an area that still remains uncharacterised for mtDNA, but that might

have been an important source of Angolares’ ancestors.

Despite the reduction of diversity in Angolares comparatively to Forros and Tongas,

their repertory of mtDNA lineages is rather diverse, as expressed in high mean number

Page 26: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

Summary

xxvi

of pairwise differences between haplotypes, and this result seems more compatible with

a scenario involving successive inputs of multiple and heterogeneous lineages within

the group, that is, the predicted assuming the hypothesis for the Angolares’ origin that

presumes they are the descents of the fugitive slaves from the plantations that along the

time have consolidated a relatively isolated community from other São Tomé e Príncipe

inhabitants, hypothesis that the linguistics data also support.

Page 27: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

xxvii

AGRADECIMENTOS

Após um longo e árduo percurso cabe-me agora a doce tarefa de agradecer a todos

aqueles que de algum modo tornaram possível a concretização desta tese.

Ao Prof. Dr. Augusto Abade, orientador da tese, pelo apoio e pelas facilidades

concedidas ao longo dos trabalhos.

Um agradecimento muito especial a minha co-orientadora a Prof. Dra. Maria João Prata

pelos ensinamentos e por ter acompanhado a realização deste trabalho, dando-me um

apoio permanente, disponibilidade, incentivo e amizade durante toda a sua realização,

que permitiram levar a bom termo esta tese.

Ao Prof. Dr. António Amorim, a quem não podia deixar de expressar a minha mais

profunda gratidão pelos valiosos comentários e por ter desde o início apoiado e

incentivado o Projecto de investigação genética de São Tomé e Príncipe.

À Doutora Leonor Gusmão pelos incentivos, apoio, amizade e acolhimento, durante as

minhas digressões ao Porto, que muito contribuíram para a concretização dos trabalhos

conducentes a esta tese. Aos seus filhos, gostaria de agradecer por me terem feito sentir

parte integrante da família. Foi maravilhosa a convivência com eles.

À Dra Cíntia Alves e à Doutora Luísa Pereira pela disponibilidade e apoio

incondicionais que facilitaram a minha integração na equipa de trabalho em que estão

integradas, no IPATIMUP.

Page 28: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

Agradecimentos

xxviii

Ao Doutor Licínio Manco pelo apoio e companheirismo demonstrados durante a

realização dos trabalhos no Departamento de Antropologia da Universidade de

Coimbra.

Ao Doutor Francisco Corte Real e ao Prof. Dr. Sobrinho Simões por terem consentido a

realização dos trabalhos no Instituto de Medicina Legal de Coimbra e no IPATIMUP,

respectivamente.

À Dra Conceição de Vide, à Dra Ana Mónica Carvalho e respectiva equipa de trabalho,

por terem facilitado e tornado agradável a minha passagem pelo Instituto de Medicina

Legal de Coimbra.

Ao Prof. Dr Jorge Rocha pela cedência de algumas amostras, o que permitiu aumentar a

nossa amostragem.

Ao Dr. António Lima, ex-Ministro da Saúde de São Tomé e Príncipe por ter autorizado

aí, a realização deste trabalho e à Dra. Julieta Espírito Santo pelas valiosas sugestões e

apoio dados desde o início deste projecto.

À população sãotomense que muito gentilmente acedeu à doação do seu sangue, sem o

qual, este trabalho não teria sido possível. Aos Delegados de Saúde, aos técnicos de

laboratório e aos agentes sanitários pelas facilidades concedidas. Às Dr Fernanda Dias,

à Dra. Evangelina Boamorte pela colaboração prestada durante as colheitas.

Às Comissões Científica e Executiva do Departamento de Antropologia, pelas

facilidades concedidas.

Os meus sinceros agradecimentos ao Centro de Investigação em Antropologia da

Universidade de Coimbra, à Fundação Calouste Gulbenkian, à Fundação do BCP e à

casa de Cultura da Língua Portuguesa da Universidade do Porto pelos apoios

concedidos.

Page 29: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

Agradecimentos

xxix

Uma palavra muito especial à toda minha família, em especial à minha mãe, à minha

irmã e às minhas sobrinhas, por terem estado sempre presentes, nos momentos

angustiantes e nos mais felizes.

Aos meus queridos filhos por terem suportado toda a minha falta de paciência nos

momentos de maior ansiedade, e me terem conferido forças para chegar ao fim.

Finalmente, a todos os que de algum modo tornaram possível a realização desta tese.

Page 30: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

À Nini e ao Davy

Page 31: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

Na elaboração desta dissertação, foram utilizados resultados já publicados e que abaixo são

discriminados. Em todos eles, a signatária participou na obtenção, análise e discussão dos

resultados, bem como na elaboração da sua forma publicada. O conteúdo dos mesmos foi parte

integrante do tema da sua tese de Doutoramento.

Trovoada MJ, Manco L, Gusmão L, Santos MT, Abade A, Amorim A, Prata MJ (2001) Polimorfismos Genéticos de ESD, GLO1, GPT e PGM1 em São Tomé e Príncipe. Antropologia Portuguesa. 18: 143-150.

Trovoada MJ, Alves C, Gusmão L, Abade A, Amorim A, Prata MJ (2001) Evidence for population sub-struturing in São Tomé e Príncipe as inferred from Y chromosome STR analysis. Ann. Hum. Genet. 65: 271-283.

Trovoada MJ, Pereira, L, Gusmão L, Abade A, Amorim A, Prata MJ (2003) Pattern of mtDNA Variation in Three Populations from São Tomé e Príncipe. Ann. Hum. Genet. 65: 271-283. 68:40-54.

Page 32: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I – INTRODUÇÃO

_____________________________________

Page 33: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

3

1.1 – INTRODUÇÃO GERAL

Desde há muito que se reconhece que a análise genética de populações humanas

contemporâneas constitui uma ferramenta extremamente importante em diversas áreas

de investigação antropológica, nomeadamente na tentativa de reconstrução do nosso

passado evolutivo. A sua capacidade de resolução foi melhorando à medida que

aumentou o espectro de marcadores genéticos possível de investigar. Desde a fase dos

marcadores serológicos, antes de 1970, à dos polimorfismos proteicos e do complexo de

histocompatibilidade das décadas 70 e 80, passando pelos primeiros marcadores

moleculares ainda nos anos 80 e 90, até aos nossos dias, em que se pode dissecar

finamente a variação em segmentos genómicos específicos, os avanços foram

extraordinários. Para os avanços mais recentes, em muito contribuíram os progressos

nas tecnologias de genotipagem estimulados pelo Projecto do Genoma Humano.

O crescimento das fontes de informação genética foi acompanhado pela

expansão do número de questões para que foi mobilizada a análise genética, sendo de

destacar, na área da Genética Populacional, as que envolvem inferências sobre episódios

demográficos do passado evolutivo das populações, como bottlenecks, expansões,

migrações ou misturas populacionais. Para esse tipo de problemas, o estudo de

haplótipos do DNA mitocondrial (mtDNA) ou da região não-recombinante do

cromossoma Y, tem revelado ser um instrumento privilegiado. Devido à ausência de

recombinação e transmissão uniparental, é relativamente simples recuperar as relações

evolutivas entre linhagens de mtDNA ou do cromossoma Y, o que associado ao

conhecimento cada vez mais detalhado dos padrões de distribuição geográfica tem

permitido um tipo de abordagem que Avise et al. (1987) designaram por filogeográfica.

Pelas características referidas, cada um desses dois genomas comporta-se como um

Page 34: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

4

locus único, o que pode representar uma insuficiência em estudos evolutivos. No

entanto, ambos têm proporcionado inferências consistentes, muitas vezes suportadas por

estudos independentes, e em acordo com dados arqueológicos, históricos e outras fontes

de informação genética (Cavalli-Sforza e Feldman, 2003).

África é um continente com uma história rica e de importância crucial para a

compreensão da origem e evolução da espécie humana. Foi em África que surgiu o

género Homo, foi no leste africano que surgiram os primeiros homens modernos que

empreenderiam uma milenar jornada de dispersão e colonização de todas as regiões do

globo, foi em África que há pouco mais de quinhentos anos se iniciou uma das maiores

movimentações humanas dos tempos modernos que envolveu o tráfico de milhões de

escravos africanos para a Europa e Américas. O continente africano contém uma

extraordinária diversidade genética, cultural, linguística e étnica

(http://www.ethnologue.com). Não obstante, as populações africanas permanecerem do

ponto de vista genético sub-estudadas comparativamente a populações de outras

regiões. A maioria dos estudos inclui marcadores genéticos avulsos, poucos indivíduos

e, geralmente, incide sobre as populações africanas mais divergentes (Tishkoff e

Williams, 2002). Desconhece-se ainda muito sobre os padrões de distribuição da

diversidade genética em África, quer à escala continental quer a escalas geográficas

mais restritas.

Numa perspectiva mundial, a atenção dos estudos genéticos tem-se centrado em

acontecimentos bastante remotos por se assumir que os ocorridos mais recentemente,

sobretudo a partir dos últimos 500 anos, são fáceis de recuperar pela consulta de

arquivos históricos (Jobling e Tyler-Smith, 2003). Porém, para a maioria das

populações da África subsariana, para além de não existir documentação escrita pré-

quinhentos, a posterior, resultante de registos efectuados pelos europeus, é geralmente

bastante precária. É o que acontece relativamente a São Tomé e Príncipe. A história

deste pequeno arquipélago localizado no Golfo da Guiné remonta apenas a finais do

século XV quando foi descoberto por navegadores portugueses. Portanto, uma história

breve de pouco mais de cinco séculos, mas complexa e conflituosa, que retrata muito do

que foi a presença europeia em África.

O projecto português para São Tomé e Príncipe foi transformar o arquipélago, de

início, num centro de produção de cana-de-açúcar e entreposto para o comércio de

escravos e, a partir do século XIX, num espaço de exploração intensiva da cultura do

Page 35: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

5

café e do cacau. Este modelo de organização resultaria no afluxo de uma fracção,

sempre minoritária, de colonos europeus, e na entrada de vagas maciças de africanos,

escravos ou imigrantes forçados, consoante o contexto social que ao longo do tempo foi

mudando. A sociedade sãotomense actual, africanizada (Henriques, 2000), é fruto deste

processo de povoamento conturbado e sobre o qual os registos históricos, embora

proporcionem os traços gerais, são bastante escassos. Pouca informação existe sobre o

volume de tráfico de escravos e a sua proveniência nos séculos que se seguiram ao

povoamento das ilhas. Por vezes, a documentação é vaga ou contraditória e assim se

entende que, apesar da curta trajectória de povoamento do arquipélago persistam

dúvidas sobre a origem dos Angolares, um dos três grupos étnicos de São Tomé e

Príncipe. Presentemente, sobre a estrutura populacional do arquipélago, é percepção

comum a existência de três grupos populacionais, Forros, Tongas e Angolares, que são

também uma referência constante na bibliografia etno-histórica sobre São Tomé e

Príncipe (Ambrósio, 1984; Neves, 1989; Henriques, 2000).

A distinção entre Forros e Tongas resulta essencialmente de uma construção

social recente. Consideram-se Forros todos os sãotomenses cujos ascendentes têm raízes

no arquipélago, em oposição aos Tongas, descendentes dos milhares de serviçais que, a

partir do século XIX, foram recrutados de Cabo Verde, Moçambique e Angola para os

trabalhos nas roças do café e do cacau. É bem mais antigo e persistente, o registo de um

grupo populacional, designado de Angolares, vivendo em relativo isolamento no

sudeste de São Tomé, que ainda actualmente, embora tendendo a ser assimilado no

tecido social e económico da ilha, preserva hábitos e tradições próprios, incluindo a

língua, um crioulo apenas falado pelos Angolares. Mas sobre a sua origem, as fontes

históricas não têm permitido dar resposta às incertezas que ainda perduram.

No que diz respeito a São Tomé e Príncipe, existe já um número considerável de

dados relativos a sistemas clássicos (Santos et al., 1996; Manco et al., 1999; Trovoada

et al., 2001), marcadores moleculares autossómicos (Prata et al., 1997; Seixas et al.,

1999; Albarrán et al., 1998; Pereira et al., 2000a, Gusmão et al., 2001; Tomás et al.,

2002) e até mtDNA (Mateu et al., 1997), que têm contribuído para o conhecimento da

história genética geral de São Tomé e Príncipe, mas nenhum dos trabalhos referidos foi

desenhado para avaliar a subestruturação interna no arquipélago. Com o

desenvolvimento dos trabalhos que conduziram a esta tese, procurou-se aprofundar o

grau de caracterização genética de São Tomé e Príncipe, analisando o padrão de

Page 36: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

6

diversidade de linhagens de mtDNA ou do cromossoma Y em amostras de indivíduos

identificados como Forros, Tongas e Angolares. Recorreu-se à documentação histórica

disponível para tentar compreender a variação genética observada, e espera-se ter

contribuído para reforçar o papel da análise genética como instrumento de

reconstituição histórica.

1.2 - SÃO TOMÉ E PRÍNCIPE: HISTÓRIA E POVOAMENTO

1.2.1 - A Localização

São Tomé e Príncipe, o segundo país mais pequeno de África, é um arquipélago situado no

Golfo da Guiné, composto por duas ilhas principais e vários ilhéus (Figura 1.1). A ilha de

São Tomé, com cerca de 857 km2 de superfície, encontra-se a cerca de 180 milhas da costa

africana e a extremidade sul fica imediatamente acima do Equador. A ilha do Príncipe,

com uma área de 114 km2, situa-se a 82 milhas a norte de São Tomé, e a cerca de 160

milhas do continente africano. Adjacentes à ilha de São Tomé existem alguns ilhéus, dos

quais os mais importantes são, a Sul, o das Rolas (Gago Coutinho), a NE o das Cabras, e a

Este, o de Santana e um aglomerado de 18 rochas denominado o rochedo das Sete Pedras.

Junto à ilha do Príncipe encontram-se os ilhéus Boné de Jokei, Caroço, Bom-Bom e Pedras

Tinhosas. Além das duas ilhas principais e dos ilhéus, esteve também sob administração de

São Tomé e Príncipe, até 1960, o Forte de São João Batista de Ajudá, localizado no antigo

Reino do Daomé, actual Benin. O arquipélago faz parte de um alinhamento vulcânico,

orientado na direcção NE-SO, com cerca de 2.000 km de comprimento, onde se encontram

também localizadas as ilhas de Ano Bom/Pagalu e Bioko/Fernando Pó e, no continente, as

montanhas dos Camarões.

Page 37: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

7

Figura 1.1 - Mapa e localização de São Tomé e Príncipe

1.2.2 - A Descoberta

Apesar de persistirem algumas dúvidas quanto ao ano da descoberta e descobridores, a

maioria das fontes situa o descobrimento das ilhas de São Tomé e Príncipe entre 1470 e

1471 nos dias 21 de Dezembro e 17 de Janeiro, dias dedicados a Santo Tomé e Santo

Antão, respectivamente. Santo Antão terá sido o nome inicial da ilha do Príncipe,

renomeada posteriormente em homenagem ao Príncipe D. João. O descobrimento tem

sido atribuído a João de Santarém e Pêro Escobar.

As fontes mais antigas sobre a história de São Tomé e Príncipe referem que as

ilhas eram desabitadas na altura da descoberta, facto que até há pouco era aceite

consensualmente. Recentemente, porém, colocou-se a hipótese, pouco fundamentada,

da existência de uma população autóctone na ilha de São Tomé antes da chegada dos

navegadores portugueses, a propósito da questão da origem dos Angolares que será

abordada no ponto 1.2.4.

Page 38: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

8

1.2.3 - Povoamento e resenha histórica

Na curta história do arquipélago, destacam-se duas fases: a do ciclo do açúcar e a do

ciclo do cacau e do café, que acompanharam mudanças importantes nos tecidos social,

demográfico e económico de São Tomé e Príncipe.

1.2.3.1 - Ciclo do açúcar

Este ciclo teve início logo após a ocupação das ilhas pelos portugueses, que aí

desenvolveram um projecto económico organizado em duas vertentes: plantação de

açúcar e centro de concentração e redistribuição de escravos. A cultura de cana-de-

açúcar, introduzida em 1501 a partir da ilha da Madeira, a produção da pimenta e a

exportação de madeiras, eram no século XVI a principal fonte de rendimento de São

Tomé.

A ilha iria transformar-se numa região com alta concentração de escravos,

alguns - escravos de “quarto”- com fixação na ilha de carácter permanente, que seriam

ocupados em tarefas domésticas ou agrícolas como a monocultura da cana do açúcar, e

outros - escravos de “resgate”- que permaneciam pouco tempo em São Tomé onde eram

armazenados e posteriormente traficados para o Brasil, como um dos destinos

principais. A baía de Ana Chaves iria ser o maior porto negreiro da África Ocidental

(Costa, 1982), antes do tráfico ser despachado via feitoria da Mina, situada no actual

Gana.

A ilha de São Tomé esteve entregue a vários donatários antes de 1521, ano em

que passou para o domínio directo da Coroa Portuguesa.

A primeira tentativa de povoamento ter-se-á iniciado em 1485, quando D. João II doou

a capitania da ilha ao primeiro donatário - o fidalgo João de Paiva. Em 1490, a capitania

passou para João de Pereira, fidalgo da casa real e um dos primeiros moradores, em

reconhecimento dos serviços que anteriormente prestara à Coroa. Em Julho de 1493, em

virtude do seu falecimento, a capitania é doada a Álvaro Caminha, a quem se deve o

grande impulso no processo de povoamento de São Tomé (Tenreiro, 1961; Neves,

1989).

O povoamento da ilha foi assegurado por dois grupos cuja convivência se viria a

manifestar bastante conflituosa (Henrique, 2000): o grupo europeu, hegemónico mas

Page 39: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

9

numericamente minoritário, e o grupo africano, formado pelos escravos recrutados pelos

europeus para o abastecimento da mão-de-obra necessária aos engenhos de açúcar e

para o comércio transatlântico.

O primeiro grupo, quase exclusivamente constituído por indivíduos do sexo

masculino, era muito heterogéneo e incluía portugueses, livres ou degredados e, em

menor fracção, outros europeus, nomeadamente, castelhanos, holandeses, genoveses e

franceses. Alguns judeus expulsos de Portugal terão tido como destino São Tomé. É

referido por várias fontes que a maior leva única que deu entrada no arquipélago,

ocorreu pouco antes do virar do século XV, e incluiu cerca de 2000 crianças judias

mandadas retirar a famílias expulsas pelos Reis Católicos e aceites em Portugal, das

quais, em 1499, já só sobreviriam cerca de 600 (Tenreiro, 1961).

O segundo grupo, de impacto demográfico muito superior, era composto pelos

africanos oriundos de regiões diversas do litoral atlântico, que ao longo do tempo se

foram deslocando para Sul - de início, do Golfo da Guiné (Costa da Mina, Benin, Togo,

Gana e Gabão especialmente), mais tarde abrangendo também a região do Manicongo e,

ainda mais tarde, do Norte de Angola (Tenreiro, 1961; Almeida, 1966; Henriques,

2000). Por volta de 1550 a população de São Tomé rondaria cerca de 10 mil habitantes,

dos quais o número de europeus não ultrapassaria o milhar, número que regrediria

permanentemente nos séculos seguintes (Tenreiro, 1961).

A ilha do Príncipe só começou a ser povoada em 1500 quando a respectiva

capitania foi doada a António Carneiro; todo o esforço de desenvolvimento demográfico

foi feito à sombra da ilha de São Tomé.

Desde o início do século XVI, com a utilização de escravos na exploração da

cana-de-açúcar e com a intensificação do tráfico negreiro, São Tomé viu crescer um

clima de hostilidade e de conflitos sociais iminentes. Cedo se registaram tentativas de

rebeliões por parte dos negros, mas as primeiras movimentações foram facilmente

contidas devido à falta de organização, ao excesso de espontaneidade e ao carácter

localizado das mesmas. À violenta repressão dos colonos, os escravos respondiam com

um número crescente de fugas para zonas interiores de floresta mais inacessíveis, onde,

escapando ao controlo colonial, podiam viver com mais aproximação aos seus padrões

culturais. A partir dos locais de refúgio - os quilombos, aplicando o termo mais tarde

utilizado no Brasil para designar realidades sociais equivalentes, e depois de atingirem

um nível de organização mínimo, os escravos fugidios e revoltados desencadeavam

Page 40: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

10

ataques aos engenhos açucareiros. Incêndios às plantações, mortes, raptos de mulheres,

intensificaram-se durante todo o século XVI, contribuindo fortemente para destabilizar

a economia de plantação.

Para os europeus, a adaptação às condições do arquipélago revelar-se-ia muito

complicada, devido à elevada taxa de mortalidade e debilitação por malária. A fama de

São Tomé, depressa propagada, tornava difícil a renovação da população europeia

(Caldeira, 1999). Paralelamente, a convivência entre os grupos sociais dominantes

deteriorava-se em consequência de vários focos de conflito entre poder civil e religioso.

No final do século, uma crise de desentendimento entre o poder político e o eclesiástico,

facilita aquela que será a maior revolta de escravos em São Tomé (Tenreiro, 1961;

Neves, 1989). A perturbação instala-se na ilha, levando muitos produtores de açúcar a

partir para o Brasil, onde a produção florescia, os conflitos sociais estavam ainda

apaziguados e os lucros se adivinhavam maiores. Devido à agitação existente em São

Tomé, a capital foi até transferida para a ilha do Príncipe, situação que se manteve até

1852 (Tenreiro, 1961).

Depois do auge do período açucareiro na primeira metade do século XVI, na

segunda metade a produção de açúcar começa a sofrer sérias flutuações cujas causas se

podem atribuir às constantes convulsões sociais, à dificuldade em controlar ataques

piratas e de potências europeias, e à concorrência comercial de outros centros

produtores, destacando-se, a partir de finais do século, o Brasil (Henriques, 2000).

Desse modo, e não obstante o papel económico do tráfico de escravos, assiste-se a um

declínio rápido das actividades produtivas das ilhas. Ao entrar na segunda metade do

século XVII, a maioria das plantações de cana-de-açúcar entrou em derrocada e foi total

ou parcialmente abandonada, encerrando-se assim o ciclo do açúcar.

1.2.3.2 - Ciclo do café e do cacau

O período de estagnação económica que se instalou em São Tomé e Príncipe,

prolongou-se até ao século XIX, altura em que a introdução da cultura do café logo

seguida da do cacau irá marcar o início de novo ciclo de desenvolvimento. Por volta de

1800 o café é introduzido no arquipélago, e pouco depois, em 1822, será a vez do cacau.

A intensificação das duas culturas, mas sobretudo a do cacau, irá acarretar profundas

transformações na vida económica e social do país. Assiste-se ao renascer de uma

Page 41: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

11

prosperidade que havia desaparecido, não obstante o ambiente social continuar a não ser

muito favorável aos novos desafios de desenvolvimento.

No princípio do século, São Tomé e Príncipe vivia ainda a crise demográfica

consequente à recessão económica dos séculos XVII e XVIII, em parte motivada pela

retirada para o Brasil dos grandes proprietários das plantações da cana-de-açúcar.

Durante esses dois séculos, muitos “homens livres”, negros chamados “filhos da terra”

(ver ponto 1.2.4) reforçam o estatuto social, tornando-se detentores de terras aráveis

abandonadas. O conflito de interesses entre estes e a leva de colonos portugueses atraída

pela introdução das novas culturas será difícil de ultrapassar. Os colonos acabarão por

extorquir grande parte das terras que pertenciam aos “homens livres”, a quem restaram

parcelas de terreno insignificantes. Poucos anos depois, recuperar-se-ia e adaptar-se-ia o

sistema de divisão em grandes unidades de exploração, conhecidas por “roças”, que

havia sido implementado para a produção sacarina. O sistema de roças exigia um

enorme reforço de mão-de-obra que os colonos não conseguiam recrutar entre os

sãotomenses pela resistência oferecida em regressar a uma condição social e de trabalho

que há muito haviam definitivamente superado.

O recurso à importação de novos escravos estava fora de questão face às

pressões internacionais contra o esclavagismo que preconizavam a urgente abolição da

escravatura, o que em Portugal ocorreria oficialmente em 1869. Uma espécie de

escravatura disfarçada (Carreira, 1982) foi a solução encontrada para suprir as recentes

necessidades de mão-de-obra. A partir de 1879, Portugal passou a firmar contratos de

trabalho com imigrantes provenientes de outras colónias (na altura) portuguesas em

África, vinculando-os coercivamente a um estilo de trabalho forçado. Tratava-se, na

realidade, de uma forma de imigração também forçada, que resultou na entrada em São

Tomé e Príncipe de milhares de trabalhadores, trazidos de Cabo Verde, Moçambique e

Angola. Aproximadamente entre 1900 e 1920, entraram no arquipélago mais de 23 000

caboverdianos, 21 000 angolanos e 29 000 moçambicanos, e a geografia do

recrutamento iria manter-se, com volumes oscilantes mas sempre expressivos, até aos

anos 70 (Carreira, 1982; Davidson, 1988). Os repatriamentos previstos nos contratos de

trabalho foram frequentemente incumpridos, e assim, a entrada desse contingente de

trabalhadores em São Tomé e Príncipe, dará início a nova fase de crescimento

demográfico no arquipélago.

Em Julho de 1975, São Tomé e Príncipe torna-se um país independente.

Page 42: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

12

Actualmente, o arquipélago conta com cerca de 175 000 habitantes, tendo

registado a partir de 1985, um índice de crescimento populacional da ordem dos 2.3%.

1.2.4 - Estrutura Populacional

A maioria das fontes sobre a estrutura populacional de São Tomé considera, para além

dos europeus e antes do segundo quartel do Século XIX, a existência de:

- Filhos da terra - descendentes dos primeiros negros livres fixados no

arquipélago;

- Angolares - descendentes de escravos negros;

- outros escravos negros envolvidos em trabalhos domésticos ou nas fazendas

agrícolas.

Posteriormente, e até 1962 (em fins de 1961 dá-se a abolição do indigenato) as

referências passam a considerar:

- Filhos da terra ou Forros -incluindo, inicialmente, os descendentes dos primeiros

negros livres e de todos aqueles a quem tinha sido concedida carta de alforria e, a partir

de 1875 com a declaração do fim da escravatura em São Tomé e Príncipe, num sentido

mais lato, todos os indivíduos, mulatos ou negros, naturais de São Tomé e Príncipe

exceptuando os Angolares;

- Angolares;

- Serviçais - contratados temporariamente em Angola, Cabo Verde e Moçambique

para trabalhar nas roças;

- Tongas - os descendentes dos serviçais nascidos na ilha.

Para a ilha do Príncipe eram referenciados os mesmos grupos com a excepção dos

Angolares.

Actualmente entre os sãotomenses é percepção normal a existência de três

grupos populacionais, Angolares, Forros e Tongas, que continuam a ser mencionados na

bibliografia sobre o arquipélago (Ambrósio, 1984; Neves, 1989; Henriques, 2000).

Forros são todos aqueles cujos antepassados têm raízes no arquipélago. Neles se

incluem os descendentes dos primeiros africanos libertados pelos portugueses - os

“homens livres” - que na fase inicial do povoamento tiveram um papel importante no

desenvolvimento de toda a arquitectura social e económica de São Tomé e Príncipe.

Admite-se que entre as gerações iniciais de “filhos da terra”, houvesse um número

Page 43: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

13

razoável de mestiços, já que o incentivo ao acasalamento entre homens europeus e

mulheres africanas, era uma estratégia de povoamento daquela altura (Tenreiro, 1961).

O poder colonial, não só promovia a mestiçagem como procurava valorizar socialmente

os mestiços dela resultante.

Tongas são os descendentes dos imigrantes forçados que, sobretudo entre o final

do século XIX e meados do XX, entraram em massa no arquipélago. Para muitos

serviçais, o regresso à terra natal findos os contratos temporários de trabalho foi

comprometido por razões diversas, entre as quais as condições económicas

extremamente precárias, restando-lhes como “opção”, novamente forçada, a fixação em

São Tomé e Príncipe. Para esta onda de imigrantes, os contributos mais significativos

vieram de Angola, Cabo Verde e Moçambique, e quanto ao último, os Makua da região

Norte terão constituído uma fracção importante (Nascimento, 2002).

Traços mais marcados de identidade são encontrados entre os Angolares.

Concentrados de início na região sudeste da ilha, actualmente são cerca de 10 000

(Seibert, 1999) e vivem em pequenos povoamentos dispersos ao longo do litoral de São

Tomé, (Ribeira Afonso, Pantufo, Praia Melão, Praia das Conchas, Neves e São João da

Vargem) e até do Príncipe (Lapa), tendo como actividade tradicional a pesca. Possuem

uma estrutura hierárquica social e funcional que parece assentar no compartilhar de uma

herança cultural, passando pela não-aceitação de poderes coercivos; falam o Angolar,

um crioulo que lhes é exclusivo. Segundo Henriques (2000), a primeira referência

escrita aos Angolares é feita apenas em 1841 por Cunha Matos, que assinala

expressamente a sua presença no sudeste da ilha, perto da Angra de São João.

Posteriores registos etno-históricos remetem frequentemente para o período entre 1574 e

1595 e para as revoltas que então desencadearam, envolvendo ataques e destruição de

engenhos de açúcar de que resultaram severos prejuízos. É-lhes atribuído um padrão de

organização típico de sociedades africanas, sendo liderados pelo lendário Rei dos

Angolares, que foi capturado na altura.

Em trabalhos sobre São Tomé e Príncipe, as referências aos Angolares são uma

constante a par de explicações mais ou menos verosímeis quanto à sua origem. A

inexistência de suporte documental consistente faz com que permaneça por esclarecer

cabalmente a questão da origem dos Angolares, sobre a qual três versões se confrontam.

Segundo a versão mais antiga, que também corresponde ao registo de uma tradição oral

vulgarizada na ilha, os Angolares seriam descendentes dos sobreviventes de um

Page 44: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

14

naufrágio que teria ocorrido perto da costa sul de São Tomé em meados do século XVI.

Tratar-se-ia de um navio negreiro proveniente de Angola com destino ao Brasil, e os

náufragos ter-se-iam abrigado nas zonas mais recônditas e de densa vegetação do sul da

ilha, constituindo o núcleo fundador do grupo. A maior debilidade desta versão é a

ausência de qualquer referência ao sucedido em documentos oficiais da época, sendo

difícil de entender que, a ter ocorrido, não tivesse despoletado o relato da ocorrência ou

o registo de previsíveis medidas tomadas por parte das entidades administrativas da ilha.

Uma interpretação recente (Cruz, 1975), em que as motivações político-ideológicas

levam Seibert, 1999, a referi-la como “hipótese da prioridade africana”, sugere que São

Tomé possuiria anteriormente à (re) descoberta quinhentista uma população africana já

radicada, que se considera ser os Angolares. Como os primeiros portugueses que

desembarcaram na ilha começaram por se fixar em Ana Ambó e só depois foram para a

região Norte da actual baía de Ana Chaves, tal teria possibilitado aos Angolares a

deslocação progressiva para as zonas mais isoladas do sudeste da ilha, onde se

concentraram mantendo-se muito tempo incógnitos e afastados do contacto com outros

habitantes até cerca do século XIX. O facto de os Angolares possuírem uma língua,

alegadamente Bantu, e um sistema de organização próprios é considerado indicativo de

uma ancestralidade étnica única, invocando-se até supostas afinidades morfológicas

com duas tribos pertencentes à grande família dos Bantu – os Mussorongos do NO de

Angola e os Kimbundos, das regiões interiores de Luanda (Galhano, 1962). Para além

da improbabilidade de uma população autóctone conseguir escapar, durante quase um

século, ao conhecimento dos europeus que se estabeleceram em São Tomé, outros

argumentos de sustentação desta hipótese, nomeadamente os linguísticos, são

destituídos de qualquer suporte investigativo sério.

A explicação mais plausível para a existência, abundantemente documentada

desde o século XVI, de um significativo grupo populacional vivendo nas zonas mais

recônditas da floresta tropical e escapando ao controle oficial (os “negros do mato”,

como começaram por ser referenciados), é de que seja fruto do grande número de

escravos fugitivos que procurava escapar à violência do trabalho nas roças açucareiras.

Desde cedo que há registo de numerosas fugas, algumas bem organizadas, e

normalmente em rescaldo das revoltas nas fazendas. É bem provável que,

paulatinamente, numa área de refúgio mais inacessível no sudeste da ilha, se fosse

formando uma comunidade de africanos auto-libertados cujo número ia aumentando, a

Page 45: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

15

que mais tarde se dará a designação de Angolares. A partir do foco de resistência,

organizam assaltos às fazendas, o que se revelará um elemento altamente perturbador e

instigará, ao longo dos séculos, severas expedições punitivas (Caldeira, 1999).

A evidência linguística parece corroborar esta hipótese. O Angolar, é um crioulo

estrutural e lexicalmente próximo dos outros dois falados no arquipélago, e o seu

substrato vocabular tem origem predominante no Português (80-90%, segundo

Lorenzino, 1998). No Angolar, o peso lexical africano não é significativamente superior

ao registado nos outros crioulos, como seria de esperar se o Angolar tivesse origem

primordial numa língua Bantu. O componente africano nos três crioulos é de línguas

Kwa ou Bantu ocidentais, ambas da família Niger - Congo. Kwa é um conjunto de

línguas que abrange o litoral-interior da área que se estende do Gana até à Nigéria, e do

enorme grupo Bantu, o Ki(shi)kongo e o Kimbundu, são línguas faladas na região do

Congo e Angola (Hagemeijer, 1999). Segundo Lorenzino (1998), o Angolar distingue-

se dos outros crioulos sãotomenses por 80% do seu léxico africano ser de origem

Kimbundo. O mesmo autor sustenta que o Angolar resultou apenas de uma relexificação

da língua falada nas fazendas à custa da impregnação com vocábulos Kimbundo. Por

outro lado, de acordo com a análise lexical e fonética, há indicações que o Angolar foi o

último dos três crioulos a autonomizar-se e estabilizar-se no arquipélago (Hagemeijer,

1999). Assim, este tipo de evidência sugere uma origem linguística recente e

heterogénea, o que parece reforçar a ideia de os Angolares serem os descendentes dos

marrones, como eram conhecidos os escravos que fugiam dos engenhos de açúcar.

1.2.5 - Língua

A língua oficial em São Tomé e Príncipe é o Português, falado por mais de 95% da

população. Cerca de 85% da população fala também o Forro ou Sãotomense, que é, dos

três crioulos falados no arquipélago, o mais difundido. O Principense, ou Lung´iye

como é localmente conhecido, é falado no Príncipe mas actualmente está quase extinto

sendo utilizado por pouco mais de um milhar de pessoas (Hagemeijer, 1999). O Angolar

é o crioulo exclusivamente falado pelos Angolares e calcula-se em 5 000 o número

mínimo de falantes (Hagemeijer, 1999).

O substrato dos três crioulos é uma mistura de um componente minoritário de

línguas Kwa e Bantu ocidentais e uma fracção maioritária, 80-93% (Lorenzino, 1998),

Page 46: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

16

de português antigo e moderno. O Angolar compartilha 70% de similaridade lexical

com o sãotomense e 67% com o Principense e a fracção do léxico não partilhada é,

essencialmente, de origem Bantu (http://www.ethnologue.com).

1.3 - CROMOSSOMA Y E DNA MITOCONDRIAL

1.3.1 - Cromossoma Y

A análise da variação de DNA do cromossoma Y, tem revelado ser um importante

instrumento de estudo em diferentes áreas de investigação, pelo que tem sido

amplamente utilizada em genética forense (Gil et al., 2001; Jobling et al., 2001),

genética médica (Jobling e Tyler-Smith, 2000; Krausz et al., 2001), reconstrução

genealógica e evolução humana (Sykes e Irven, 2000; Underhill, et al., 2001). Em

particular na última área, a perspectiva masculina que o cromossoma Y proporciona,

tem dado contributos fundamentais para reconstituir a história evolutiva das populações

humanas contemporâneas e inferir como diferentes factores - demográficos, culturais,

históricos, entre outros - têm interagido na modelação da sua estrutura genética (Perez-

Lezaun et al., 1997; Jobling e Tyler-Smith, 2000).

1.3.1.1 - Estrutura e conteúdo génico

O cromossoma Y, o segundo mais pequeno cromossoma do genoma humano (~60 Mb),

é uma molécula linear que representa cerca de 2% - 3% do genoma haplóide (Figura

1.2). Análise citogenética baseada em técnicas de bandas, permitiu identificar diferentes

regiões no cromossoma: nas extremidades teloméricas encontram-se duas pequenas

porções pseudoautossómicas, PAR1 e PAR2 (PAR - pseudoautosomal region), que

delimitam uma extensa região haplóide não recombinante, NRY (non-recombining

portion of the Y); esta representa cerca de 95% do cromossoma e contém uma porção

eucromática e outra heterocromática de tamanho altamente polimórfico.

A culminar um período de grande esforço de investigação sobre o mapeamento

do cromossoma Y (Tilford et al., 2001), e tirando partido dos avanços nas tecnologias

genómicas e do DNA recombinante, foi recentemente publicada a sequência quase

completa da região NRY (Skaletsky et al., 2003), também designada de MSY (male-

Page 47: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

17

specific region of the Y) face à descoberta de alguns acontecimentos de recombinação

na região (Rozen, 2003). O conhecimento dessa sequência, para além de proporcionar

um melhor quadro sobre a estrutura e organização do cromossoma Y, contribuiu para

actualizar o catálogo de genes localizados no Y.

Figura 1.2 - Esquema do cromossoma Y. NRY - Região não recombinante; Yp - braço curto; Yq - braço longo; PAR I e II - região pseudoautossómica I e II.

Sabe-se que só essa região contém 78 genes codificantes que colectivamente codificam

27 proteínas distintas. A maioria desses genes encaixa em duas categorias funcionais: os

que se expressam ubiquamente no corpo ou em alguns órgãos; e outros que se

expressam quase exclusivamente nos testículos. Entre os últimos, e enumerando apenas

alguns, encontram-se genes que estão envolvidos na espermatogénese e/ ou cuja

delecção está associada a casos de infertilidade masculina, AZFa, AZFb e AZFc

(Graves, 2000; Ferlin et al., 2003) e o gene SRY, que determina o sexo masculino

(Quintana-Murci e Fellous, 2001; Graves, 2002).

1.3.1.2 - Características chave em estudos evolutivos

O interesse que a análise de polimorfismos do cromossoma Y suscitou em estudos sobre

origem e evolução de populações humanas, prende-se com algumas características

específicas deste cromossoma. Tem herança uniparental por via paterna, transmitindo-se

apenas de pai para filho. Ao contrário de outros cromossomas, escapa, em quase toda a

sua extensão, a fenómenos de recombinação meiótica. A ausência de recombinação em

NRY implica que, na região, a única fonte de variação é a mutação e, por isso,

CentrómeroYp Yq

Eucromatina Heterocromatina NRPY

~ 60MB

PAR II (~0.32 Mb) PAR I

(~2.6 Mb)

Page 48: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

18

preservará o registo da sua história mutacional. Outra consequência de não haver

recombinação meiótica é que os haplótipos, isto é, as combinações de não-alelos ao

longo da região, passarão em bloco e, portanto, intactos de geração em geração. Assim,

recorrendo a polimorfismos com taxas de mutação baixa, é possível recuperar a

filogenia das sequências e procurar traçar a história das linhagens paternas numa

população.

Ainda outra peculiaridade do cromossoma Y, é o seu baixo efectivo

populacional. Assumindo para a população humana uma proporção de sexos de 1:1, o

tamanho efectivo de cromossomas Y é um quarto de qualquer autossoma, um terço

relativamente ao X, e igual ao do, também haplóide, genoma mitocondrial. O reduzido

efectivo populacional permite compreender a considerável estruturação geográfica que

se regista ao nível da variação do cromossoma Y e que tem permitido desvendar muitas

rotas de migrações antigas. No entanto, torna o cromossoma Y particularmente sensível

à deriva génica, fenómeno que envolve alterações aleatórias de frequência de haplótipos

entre gerações por mero efeito amostral. A deriva génica acelera a diferenciação de

linhagens masculinas entre populações, conferindo grande utilidade ao cromossoma Y

na investigação de acontecimentos passados e na avaliação de afinidades populacionais.

Porém, por efeitos de deriva, as frequências haplotípicas podem alterar-se rapidamente

com o decorrer do tempo e induzir enviezamentos sobre inferências quanto a aspectos

demográficos das histórias populacionais (Jobling e Tyler-Smith, 2003) como

bottlenecks, expansões ou misturas populacionais.

1.3.1.3 - Subestruturação geográfica de linhagens do Y

Em média, a distância genética entre duas populações é tanto maior quanto maior o

afastamento geográfico entre elas, mas o grau de estruturação geográfica parece ser

influenciado pelo comportamento de migração de homens e mulheres. Para populações

europeias com determinada distância entre si, o nível de diferenciação genética inferido

com base no cromossoma Y é não só bastante superior ao inferido com autossomas, o

que está de acordo com os efectivos populacionais relativos, mas também superior ao

inferido com mtDNA, apesar do idêntico efectivo populacional (Seielstad et al., 1998).

Esta diferença tem sido atribuída ao facto da patrilocalidade ser normal na maioria das

sociedades europeias. Quando um homem e uma mulher casam e não são do mesmo

Page 49: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

19

local, a tendência é para ser a mulher e não o homem a abandonar a terra natal.

Consequentemente, a taxa de migração das mulheres é superior à dos homens, tendendo

estes a permanecer perto do local de nascimento. Este comportamento pode explicar a

maior diferenciação local de linhagens do cromossoma Y relativamente às de mtDNA,

registada não só na Europa mas também em ilhas do sudoeste asiático (Kayser et al.,

2001a) ou na Nova Guiné (Kayser et al., 2003) onde a patrilocalidade é usual. Em

oposição, na Tailândia, onde se pratica a matrilocalidade, verifica-se uma diferenciação

aumentada nas linhagens mitocondriais e reduzida nas do cromossoma Y (Oota et al.,

2001). Explicações alternativas podem concorrer para a observação de estruturação

populacional diferencial para linhagens femininas e masculinas, sendo de destacar, entre

outras, a prática de poligamia, comum em muitas sociedades humanas, e que estando

associada a elevada variância do sucesso reprodutivo dos homens, avaliado pelo número

de descendentes dos indivíduos de sexo masculino, acarreta efeitos populacionais

semelhantes à redução do número efectivo de homens (Seielstad et al., 1998).

As histórias demográficas de homens e mulheres podem ser muito diferentes e

ter mudado substancialmente ao longo do tempo. Recentemente, Dupanloup et al.

(2003), procuraram reconciliar a observação, na maioria das populações humanas, de

sinais de expansão populacional nos padrões de diversidade do mtDNA ou de

microssatélites do Y, com a aparente não detecção de crescimento populacional em

análises baseadas em SNPs (single nucleotide polymorphisms) do Y, invocando a

capacidade diferencial das três baterias de marcadores em reter (para idênticos

tamanhos amostrais) sinais de acontecimentos demográficos passados, e admitindo uma

mudança relativamente recente quanto ao sistema de acasalamento humano.

Consideram que, desde o Pleistoceno, o crescimento da população humana registou

mais cedo o início da expansão do número efectivo de mulheres que o de homens, em

resultado da mudança de práticas ancestrais poligâmicas para outras tendencialmente

monogâmicas. A alteração é remetida para o Neolítico, e poderá ter acompanhado a

tendência que então se registou para a sedentarização das populações humanas.

1.3.1.4 - Marcadores genéticos

À medida que em estudos de genética e evolução humana, cresceu o interesse pela

análise do cromossoma Y e se renovaram as tecnologias, cresceu também o número de

Page 50: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

20

variações polimórficas da NRY potencialmente úteis. Actualmente, com o projecto de

sequenciação em fase avançada, aproximamo-nos do conhecimento detalhado do

número e tipo de variações do cromossoma Y e o cenário afasta-se muito da “aridez de

variação” como começou por ser caracterizado (Goodfellow et al., 1985). Tal como

para outras regiões genómicas, os polimorfismos do cromossoma Y classificam-se em

duas categorias: marcadores multialélicos e marcadores bialélicos. Os últimos são

polimorfismos de baixa taxa de mutação que, no cromossoma Y, definem linhagens

monofiléticas designadas por haplogrupos, enquanto que os multialélicos são

polimorfismos de mutação elevada que permitem definir um número mais ou menos

elevado de haplótipos dentro de haplogrupos, podendo ser usados para avaliar níveis de

diversidade intra-haplogrupos ou para estimar a idade do ancestral comum mais recente

de um conjunto de cromossomas.

Page 51: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

21

1.3.1.4.1 - Marcadores multialélicos

Nesta categoria, incluem-se os polimorfismos de sequências repetidas em tandem.

Convencionalmente subdividem-se em microssatélites (designação sinónima de short

tandem repeat - STR) se o motivo de repetição possui entre 2 a 5 pares de bases, e

minissatélites se a unidade de repetição é maior. Esta sub-divisão reflecte não apenas as

diferenças estruturais entre os polimorfismos, mas sobretudo as diferenças quanto a

taxas médias de mutação e mecanismos geradores de diversidade alélica. Devido à

elevada mutabilidade e aos complexos processos mutacionais que lhes estão associados,

minissatélites do Y, como o MSV1, têm sido de utilidade limitada em estudos de

evolução humana, em oposição ao interesse que os STRs têm despertado.

A estimativa de taxa média de mutação para os microssatélites é de 2x10-3 por

locus por geração (Jobling et al., 1999) e, especificamente para tetranucleotídicos do Y,

de 3.17x10-3 por locus por geração (Kayser et al., 2000). A taxa é, no entanto, muito

variável de marcador para marcador ou até de alelo para alelo, dependendo do número

de repetições (Jin et al., 1996), da composição em bases das unidades de repetição, da

sequência das regiões flanqueadoras (Santibáñez-Koref et al., 2001) e do tipo de

genoma em que os microssatélites estão inseridos (Eisen e Hanawalt, 1999). Esta

grande variabilidade das taxas de mutação é particularmente crítica quando a

diversidade de STRs é usada para datar linhagens, contribuindo, a par de outros

factores, para aumentar o grau de incerteza das estimativas obtidas.

Apesar de se admitir que os mecanismos mutacionais subjacentes aos STRs são

mais simples que os dos minissatélites, sabe-se ainda pouco sobre eles. Slipped-strand

mispairing tem sido apontado como um dos principais processos moleculares

responsável pelo elevado polimorfismo dos STRs (Tautz e Schlötterer, 1994). O facto

de o padrão de variação alélica de muitos STRs encaixar razoavelmente no modelo

single-stepwise mutation, em que se assume que um alelo se origina do ancestral por um

passo mutacional simples, tem sido considerado favorável ao mecanismo explicativo

(Jorde et al., 1995; Perez-Lezaun et al., 1997). Outros fenómenos, nomeadamente

crossing-over desigual durante a meiose, poderão estar na origem de novos alelos que

apresentam alterações mais drásticas de estrutura ou do número de repetições (Smith,

1976; Stephan, 1989).

Page 52: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

22

Actualmente, conhecem-se no cromossoma Y entre 100 a 200 STRs

potencialmente úteis em genética ou evolução humana, para além dos cerca de 30 tri,

tetra ou pentanucleotídicos com dados já publicados (Jobling e Tyler-Smith, 2003). A

análise de alguns desses STRs tornou-se um procedimento de rotina em numerosas

investigações de âmbito forense, em que a avaliação do significado de um match

depende da frequência populacional de um dado perfil genético. São de referir os

notáveis esforços da comunidade forense no estabelecimento daquela que é hoje a maior

base de dados de STRs do Y, sujeita a criterioso controlo de qualidade e de acesso

público em (http://ystr.org), onde estão já disponíveis dados relativos a populações

europeias, americanas, asiáticas e africanas, por ordem aproximada de representação

numérica actual. Apesar da construção dessa base de dados ter obedecido a critérios de

interesse essencialmente forense, ela representa presentemente um valioso recurso

instrumental em diversas áreas antropológicas.

Uma dificuldade compartilhada em investigações forenses e em outros campos é

a elevada frequência de homoplasia que se encontra em STRs. Por possuírem uma alta

taxa de mutação, não são muito raros os fenómenos de recorrência que originam

alelos/haplótipos idênticos por estado mas não por descendência. Como o tamanho da

população humana é grande, espera-se que em cada geração surjam novas sequências

homoplásicas, a um ritmo ainda desconhecido, mas que, a não serem consideradas em

análises forenses, podem comprometer a interpretação da observação de um match. Por

outro lado, a elevada taxa de mutação e, logo, de recorrência dos STRs, faz com que

facilmente se perca a sequência de acontecimentos que diversificam os haplótipos, pelo

que, ao contrário do que se passa com marcadores bialélicos, só tem sido possível

recuperar filogenias de haplótipos definidos por STRs ou (a) em escalas geográficas

relativamente restritas e, por vezes, ancorando os haplótipos em SNPs, ou (b)

mobilizando um pequeno número de STRs e, mesmo assim, obtendo árvores com

bastantes ambiguidades (Forster et al., 2000).

1.3.1.4.2 - Marcadores bialélicos

Nesta categoria incluem-se polimorfismos como os SNPs (single nucleotide

polymorphisms), que resultam da substituição de uma base por outra na sequência do

DNA, e os decorrentes de inserções/delecções, nomeadamente de elementos Alu, em

Page 53: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

23

determinada posição no cromossoma. Caracterizam-se por taxas de mutação muito

baixas, pelo que, com raras excepções, surgem por acontecimentos únicos de que

resultam apenas dois alelos, o ancestral e o mutado/derivado, e daí serem designados de

marcadores bialélicos. As excepções são consequência de mutações recorrentes

(reversões ou mutações paralelas) que, mesmo admitindo a mais baixa estimativa de

taxa de substituição nucleotídica, 2x10-8 por base por geração (Nachman e Crowell,

2000), é possível que ocorram ainda que com muita raridade.

Algumas bases de dados (por exemplo, http://www.ensembl.org) listam milhares

de SNPs do cromossoma Y, e ainda que alguns possam ser apenas artefactos (Jobling,

2003), é vasto o repertório de SNPs potencialmente interessantes em estudos

antropológicos. Hoje em dia, estão já razoavelmente bem caracterizados mais de 200

marcadores bialélicos da região NRY. Por resultarem de acontecimentos únicos e

ocorrerem na região não-recombinante do Y, isto significa que: (a) os indivíduos que

actualmente apresentam uma mesma mutação compartilharam, num passado mais ou

menos remoto, um ancestral comum por via paterna; e (b) os limites da distribuição da

mutação pelo globo correspondem aos limites da dispersão daquela linhagem

masculina. É ainda por serem acontecimentos únicos e raros, mas temporalmente

desfasados, que à medida que vão surgindo vão gerando combinações haplotípicas

novas, monofiléticas, cujo registo sequencial é em grande parte possível de recuperar.

Assim, foi recentemente apresentada pelo Y Chromosome Consortium, 2002 (YCC:

http://ycc.biosci.arizona.edu), aquela que é considerada a mais robusta, ainda que não

definitiva, filogenia de 153 haplogrupos do cromossoma Y definidos por 245

marcadores bialélicos que, em 2003, o YCC volta a publicar apenas com pequenas

revisões (Jobling e Tyler-Smith, 2003). É também o YCC que, em 2002, propõe e

recomenda um sistema de nomenclatura uniforme, de forma a neutralizar as

dificuldades inerentes à multiplicação de nomenclaturas alternativas a que se assistiu

nos últimos anos, e a permitir que, independentemente dos painéis de marcadores

bialélicos utilizados, os resultados de diferentes grupos de investigação possam ser

rapidamente integrados.

Ao longo dos últimos anos, acumulou-se uma grande quantidade de dados sobre

marcadores bialélicos e começa agora a emergir um cenário filogeográfico a nível

mundial bastante consistente dos principais haplogrupos do Y. No entanto, é ainda

impreciso o quadro da distribuição geográfica fina de muitas linhagens, permanecendo

Page 54: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

24

por caracterizar um grande número de populações e sendo necessário complementar

muitos dados avulso que têm sido publicados. No futuro, o conhecimento mais

profundo do padrão de distribuição da diversidade de marcadores bialélicos do Y,

proporcionará uma base mais sólida para esclarecer muitas questões em aberto relativas

à origem e evolução das populações humanas.

1.3.2 - DNA mitocondrial

Relativamente a muitas propriedades, pode considerar-se que o equivalente feminino do

cromossoma Y é o mtDNA. Trata-se também de um genoma haplóide, não

recombinante, mas que se transmite exclusivamente por via materna. Assim, em estudos

de evolução humana, o mtDNA constitui uma janela na tentativa de recuperação das

histórias populacionais femininas. Estas, não são necessariamente idênticas às

masculinas, mas o passado evolutivo das populações foi só um, pelo que muitas das

questões que se procura investigar pela análise genética, podem ser melhor clarificadas

se comparar dados de mtDNA com os de cromossoma Y, a par de outro tipo de loci.

Os trabalhos pioneiros de mtDNA em estudos de evolução humana, devem-se à

equipa de Alan Wilson e surgem em 1980 quando Brown e seus colaboradores reportam

a existência de padrões de enzimas de restrição de mtDNA específicos de diferentes

populações. É a mesma equipa que, ainda nessa década, lançará definitivamente a

Antropologia na era molecular com um dos trabalhos mais polemizados publicado nas

últimas décadas. Cann et al. (1987), sugerem que o último ancestral comum dos homens

actuais poderá ter vivido em África há menos de 200 mil anos, hipótese que ficará

ligada à simplificação confusa de “Eva mitocondrial”. Desde então, a análise de mtDNA

não parou de ser mobilizada para áreas cada vez mais diversificadas, em que tem vindo

a dar contributos fundamentais.

1.3.2.1 - Organização do genoma mitocondrial

As mitocôndrias são organitos que constituem a central celular da cadeia da fosforilação

oxidativa (OXPHOS), que é a principal via metabólica de produção de ATP. Cada

célula possui 10 a 100 mitocôndrias, e cada mitocôndria contem entre 0 a 11 cópias de

mtDNA (Cavelier et al., 2000). O mtDNA é uma molécula grande, 0.5 μm-10 μm, de

Page 55: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

25

cadeia dupla e circular (Figura 1.3), conformação que lhe confere grande estabilidade à

degradação.

Figura 1.3 - Esquema da molécula de DNA mitocondrial humano, adaptado de Wallace, 1994.

A sequência completa do genoma mitocondrial foi publicada em 1981, por

Anderson et al., e é conhecida por Cambridge Reference Sequence (CRS), por ser

relativamente a ela que passaram a ser reportadas as alterações nucleotídicas

encontradas noutras sequências. Posteriormente, foi ressequenciada e ligeiramente

revista, Andrews et al., 1999. Cada molécula de mtDNA contém ~16 600 nucleótidos,

sendo diferente a distribuição de tipo de bases nas duas cadeias. Numa predominam

purinas e na complementar pirimidinas. Devido ao comportamento diferencial em

gradiente de densidade, as cadeias costumam ser referidas por cadeia H (heavy) e cadeia

L (light), respectivamente.

Cerca de 90% do mtDNA é codificante e compreende 37 genes, 13 dos quais

codificam proteínas envolvidas na cadeia da fosforilação oxidativa. Dos restantes genes,

Page 56: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

26

22 codificam RNAs de transferência e 2 RNAs ribossómicos, que participam no

processo de tradução proteica no interior da mitocôndria.

Uma região não-codificante de aproximadamente 1.2 Kb (7% do genoma

mitocondrial), espalha-se de ambos os lados de uma posição arbitrariamente referida por

“o” (origem de replicação) e é designada por região controlo, ou D-Loop (displacement

loop). É nessa região que se encontram sinais de início de replicação da cadeia pesada e

promotores de transcrição de ambas as cadeias do mtDNA (Shadel e Clayton, 1997) que

poderão determinar a exposição de locais de ligação a proteínas envolvidas nos

processos (Fisher et al., 1992). D-Loop decorre da fase inicial da replicação, quando a

primeira cadeia recém-sintetizada se liberta da cadeia parental formando uma estrutura

tridimensional em ansa.

1.3.2.2 - Taxa de substituição nucleotídica

A taxa de substituição do genoma mitocondrial é cerca de 5 a 10 vezes superior à do

DNA nuclear (Brown et al., 1982). Esta taxa elevada poderá resultar de uma frequência

aumentada de incorporação errada de nucleótidos ou de baixa eficiência de reparação da

polimerase de DNA (Lansman e Clayton, 1975). Estudos sobre a fidelidade da

polimerase do mtDNA (polγ), indicam que a taxa de erro é de 1 em cada 1-20 milhões

de nucleótidos, o que representa uma taxa de incorporação errada muito superior à

esperada para a replicação de DNA nuclear (1 em cada 109 - 1010 pb), podendo explicar

a elevada frequência de mutação no mtDNA (Johnson e Johnson, 2001). Para o mesmo

efeito também pode concorrer a elevada taxa de renovação de mitocôndrias nos tecidos,

que implica muitos ciclos de replicação e, portanto, muitas oportunidades para a

ocorrência de erros. Toda a região controlo acumula substituições a uma taxa 2.8 (Cann

et al., 1984) a 5 (Aquadro e Greenberg, 1983) vezes superior à da porção codificante do

mtDNA.

No interior de D-Loop, a taxa de mutação é particularmente elevada em dois

segmentos conhecidos por região hipervariável I e II (HVS-I e HVS-II) que

compreendem as posições 16024-16383 e 73-340, respectivamente (Vigilant et al.,

1989, 1991). Devido à hipervariabilidade, HVS-I e HVS-II têm constituído o alvo

preferencial em estudos de mtDNA, o que resultou na acumulação de uma grande

quantidade de dados, frequentemente utilizados para fazer inferências filogenéticas e

Page 57: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

27

calibrar acontecimentos das histórias populacionais. Todavia, as taxas de mutação de

HVS-I e HVS-II permanecem ainda bastante incertas. Estimativas recentes têm

produzido valores muito díspares que apontam para taxas 5 a 30 vezes superiores à do

mtDNA codificante. Essas disparidades poderão, entre outros factores, estar

relacionadas: (a) com o tipo de métodos utilizados - genealógicos (taxas de substituição

entre 0.32-2.5/posição/milhão de anos, Parsons et al., 1997; Sigurðardóttir et al., 2000)

ou filogenéticos (taxas de substituição entre 0.025-0.26/posição/milhão de anos, ver:

Parsons et al., 1997); e (b) com os padrões intrínsecos de mutabilidade das regiões que

se caracterizam por uma grande heterogeneidade de posição para posição (Excoffier e

Yang, 1999), com algumas posições apresentando taxas de substituição extremamente

elevadas (Maddison, 1992 in Ingman, 2003; Wakeley, 1993).

1.3.2.3 - Modo de transmissão

O mtDNA tem herança uniparental sendo transmitido por via materna (Giles et al.,

1980). Este modo de transmissão decorre de usualmente, na passagem inter-geracional

de mitocôndrias, só participarem as mães através das mitocôndrias existentes nos

oócitos. Os oócitos maduros humanos contêm cerca de 100 000 a 200 000 mitocôndrias

(Marchington et al., 1997), dispersas por todo o citoplasma, enquanto que os

espermatozóides contêm apenas entre 50 a 100, concentradas na base do flagelo (Ankel-

Simons e Cummins, 1996). Por isso, normalmente na altura da fecundação as

mitocôndrias paternas não penetram o óvulo (Sphuhler, 1988). Esporadicamente,

quando tal acontece, o número é tão baixo relativamente aos milhares de mitocôndrias

maternas que, por simples efeito de diluição, acentuado com as subsequentes divisões

mitóticas, a contribuição paterna pode considerar-se, em geral, irrelevante. Por outro

lado, há indicações de que as mitocôndrias paternas são activamente eliminadas após

fertilização (Kaneda et al., 1995; Boore, 1997). A ubiquitina, que se expressa na

superfície da mitocôndria, parece marcar as mitocôndrias paternas como estranhas,

tornando-as alvo de destruição selectiva no embrião com 2 - 4 células (Sutovsky et al.,

2000). Mesmo que este mecanismo não seja infalível, a taxa de sobrevivência de

mitocôndrias paternas no ovo é extremamente baixa ou nula, não comprometendo,

portanto, a assunção de herança materna para o mtDNA (Parsons et al., 1997; Torroni et

al., 1998).

Page 58: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

28

A natureza clonal da transmissão do mtDNA suscitou recentemente outra

controvérsia, em consequência de algumas observações interpretadas como sugestivas

de ocorrência de recombinação neste genoma: por um lado um excesso de homoplasia

nas análises filogenéticas (Eyre-Walker et al., 1999; Halgelberg et al., 1999) e, por

outro, o padrão de desequilíbrio de ligação (LD) na molécula mitocondrial (Awadalla et

al., 1999). Estes últimos resultados foram particularmente criticados pelo pequeno

número de posições nucleotídicas analisadas, pela qualidade da amostra e pelas medidas

de LD usadas (Jorde e Bamshad, 2000; Kivisild et al., 2000; Kumar et al., 2000). Em

resposta às críticas, Awadalla et al. (2000), insistem na consistência entre os padrões de

LD que detectam e a hipótese de recombinação, embora admitam que, a ocorrer, seja

um acontecimento muito pouco frequente. Mas não dando por encerrada a questão,

Eyre-Walker e Awadalla (2001), apresentam alguns dos possíveis mecanismos de

quebra da clonalidade de transmissão do mtDNA.

1.3.2.4 - Heteroplasmia do mtDNA

O grande número de cópias de mtDNA e a elevada taxa de mutação deste genoma

extranuclear, são responsáveis pela ocorrência de heteroplasmia, situação em que num

mesmo indivíduo co-existem sub-populações de sequências de mtDNA de tipo

diferente. Os primeiros casos reportados de heteroplasmia, estavam relacionados com

mutações patogénicas de mtDNA causadoras de doenças mitocondriais raras (Larsson e

Clayton, 1995). Logo se constatou que os indivíduos afectados eram portadores de

proporções muito variáveis de moléculas de mtDNA mutadas, de que dependia a

severidade clínica da patologia (Chinnery et al., 1997). Por outro lado, mulheres

heteroplásmicas transmitiam um número imprevisível de moléculas mutadas, o que

constituía (e constitui) uma grande dificuldade em termos de aconselhamento genético.

É neste contexto que começam a surgir modelos sobre a transmissão de mutações

heteroplásmicas do mtDNA humano (Wallace, 1994; Bendall et al., 1996; Jenuth et al.,

1996). Entretanto, somam-se os indícios de que um mecanismo fundamental nesse

processo envolve efeitos aleatórios de deriva - bottlenecks mitocondriais - que ocorrem

durante as divisões celulares, principalmente da oogénese, mas também da fase inicial

do desenvolvimento embrionário e mesmo de outras fases pós-zigóticas (Poulton et al.,

1998; Brown et al., 2001). Esse mecanismo, permite explicar a imprevisibilidade e

Page 59: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

29

variabilidade dos padrões de segregação quer de patologias mitocondriais - incluindo a

perda de heteroplasmia, e consequente fixação de uma sequência, numa só passagem

geracional, (Lightowlers et al., 1997), ou casos, como um recentemente reportado por

Schwartz e Vissing (2003), em que moléculas de mtDNA de origem materna e paterna

foram encontrados em diferentes tecidos -, quer de mutações não patológicas.

Em indivíduos normais relativamente a doenças mitocondriais, tem-se assumido

que o geral é existir apenas um tipo de moléculas de mtDNA (homoplasia).

No entanto, essa visão tem sido questionada em consequência de alguns

resultados que apontam para uma variabilidade de sequência intra-individual superior ao

suspeitado, e das indicações que, a nível de indivíduo, a proporção de heteroplasmia

pode variar não só de tecido para tecido (sendo particularmente usual em cabelos),

como dentro do próprio tecido e também em função da idade (Grzybowski, 2000).

Muitas heterogeneidades de sequência ocorrem na região controlo (Bendall et al.,

1996), onde foram identificados locais que constituem hot spots heteroplásmicos e que

incluem algumas das posições reportadas como mais polimórficas em HVS-I, por

exemplo 16294 e 16311 (Grzybowski, 2000), ou traços homopoliméricos com

interrupções como, em HVS-I, o traço de policitosinas entre 16184 e 16193

interrompido por T em 16189 (Anderson, 1981) e, em HVS-II, o traço de policitosinas

entre 303 a 315 interrompido por T em 309; em ambos os casos a heteroplasmia

envolve uma transição de T para C, sugerindo que ocorra por slippage replicativo.

Pelas implicações na casuística forense, heteroplasmia e suas consequências,

constituem actualmente um dos tópicos de debate entre a comunidade forense (Budowle

et al., 2002; D’Eustachio, 2002), mas apesar de poderem ser factores perturbadores de

algumas análises, não comprometem a utilidade do mtDNA nessa área de aplicação.

1.3.2.5 - Filogenia de linhagens de mtDNA

Tal como acontece em NRY, as mutações são a única fonte de variação no mtDNA e as

novas combinações haplotípicas que vão sendo geradas também só são quebradas por

outras mutações. Assim, é igualmente possível recuperar em grande extensão, a

filogenia das linhagens femininas.

Comparativamente ao Y, analisam-se, habitualmente, muito mais posições

nucleotídicas no mtDNA o que, aliado à elevada taxa de substituição deste genoma,

Page 60: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

30

permite discriminar um elevadíssimo número de sequências mitocondriais. Por isso se

considera que o mtDNA proporciona uma elevada resolução em estudos evolutivos e

populacionais. Mas pelo facto de a taxa de mutação para além de elevada, ser muito

variável de posição para posição, nem todas as posições são igualmente informativas na

reconstrução filogenética, em particular aquelas muito ou hipervariáveis. Conjuntos de

sequências molecularmente relacionadas e que compartilham núcleos específicos de

mutações em posições relativamente estáveis, são designados por haplogrupos. A

filogenia dos principais haplogrupos do mtDNA humano está hoje bem estabelecida e

existe um conhecimento razoável dos respectivos espectros de distribuição geográfica

(bastante mais completo que o de haplogrupos do Y).

Comparando os esqueletos filogeográficos das linhagens masculinas e femininas

humanas (ver, por exemplo, Fig. 4 de Cavalli-Sforza e Feldman, 2003) sobressai a

grande semelhança das estruturas gerais, o que só reforça a validade da informação

filogenética que se pode extrair do mtDNA e do cromossoma Y.

1.3.3 - Padrões de diversidade do cromossoma Y e do mtDNA em África

1.3.3.1 - A Expansão do Homem Moderno

O estudo de populações africanas no contexto da Antropologia molecular, começou por

ser estimulado para tentar esclarecer algumas etapas mal documentadas do passado

evolutivo remoto das populações humanas contemporâneas. O género Homo iniciou a

expansão para fora de África há cerca de 1.8 milhões de anos (m.a.) e progressivamente,

em função da acessibilidade e condições climáticas, foi colonizando outras regiões do

Velho Mundo. Esta primeira grande migração humana está bem patenteada no registo

fóssil: há vestígios de Homo erectus na Geórgia (Cáucaso) e em Java (Sudeste Asiático)

desde ∼1.8 - 1.6 m.a. atrás, e na Europa os vestígios mais antigos, representados por

Homo heidelbergense, datam de há ∼800 000 anos.

As características anatómicas de homem moderno mais antigas aparecem no

registo fóssil de África de leste, em espécimes com ∼160 000 anos. Do Paleolítico

Superior surge no registo arqueológico uma utensilagem que indica que populações de

Homo sapiens estavam já dispersas por toda a Europa, Ásia e Oceânia, desde os ∼60

000 - 40 000 anos atrás, ocupação que os achados fósseis também documentam. Sobre a

Page 61: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

31

origem destas populações de homem moderno, existem visões discordantes que, num

exercício de simplificação, se costumam apresentar em dois modelos. Segundo um, elas

descendem das populações locais de homens arcaicos de quem receberam uma

contribuição genética significativa; fluxo migratório inter-populacional, teria evitado

uma diferenciação regional acentuada - hipótese multiregional. O outro modelo, reclama

que a população ancestral de homens modernos, surgida em África, protagonizou uma

segunda grande expansão para fora do continente, iniciada na primeira metade dos

últimos 100 000 anos, e em sucessivas vagas migratórias foi substituindo as populações

instaladas nas regiões que ia alcançando; a contribuição genética destas para as

populações de homens modernos poderá ter sido nula ou irrelevante - hipótese “out of

Africa”.

Para este debate, as evidências da Antropologia Física têm suscitado

interpretações pouco conclusivas. Tem havido mais consenso interpretativo (ainda que

não unanimidade, ver, entre outros, Relethford, 1998) quanto às achegas obtidas com

estudos de mtDNA ou cromossoma Y, dado que em muitos aspectos parecem favorecer

o segundo modelo. A primeira grande divisão nas filogenias das linhagens do

cromossoma Y ou do mtDNA, separa sequências africanas de não-africanas, indicando

que as primeiras são as mais divergentes e, portanto, as mais antigas. Por outro lado,

estimativas do tempo decorrido desde o ancestral comum mais recente (TMRCA) das

linhagens mitocondriais apontam para datas não inferiores a ~230 000 anos (Cavalli-

Sforza e Feldman, 2003), não obstante a margem de incerteza e dispersão dos valores

obtidos (é de referir o trabalho pioneiro de Cann et al., 1987, que obtêm para TMRCA a

idade de 190 mil anos, muito criticada devido a algumas irregularidades estatísticas e,

quanto a trabalhos mais recentes, Ingman et al., 2000, 171 mil anos, com base em

sequências completas de mtDNA, ou Tang et al., 2002, 238 ou 190 mil anos, assumindo

25 ou 20 anos por geração, respectivamente). Estimativas correspondentes para a região

NRY, indicam que o ancestral comum mais recente das linhagens masculinas actuais

tem menos de 100 000 anos (Cavalli-Sforza, 2003), ainda que a gama de estimativas

também seja ampla (por exemplo, Thomson, et al., 2000, obtêm uma estimativa de

TMRCA para linhagens definidas por SNPs de 59 mil anos; Tang et al., 2002; 91 ou

109 mil anos, assumindo 25 ou 20 anos por geração, respectivamente, e baseando-se

também em SNPs; ou Pritchard et al., 1999, 46 mil anos, com base em STRs do Y).

Page 62: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

32

Portanto, mtDNA e cromossoma Y, convergem na indicação de que as linhagens

femininas e masculinas actuais surgiram em África, e apesar das diferenças quanto ao

TMRC dos dois genomas, o intervalo de valores revela que o início da diversificação de

ambas as linhagens foi recente, caindo num período que se afasta muito do previsto

assumindo a hipótese multirregional da origem do homem moderno, que deveria

remeter para a primeira grande expansão geográfica do género Homo há cerca de 1.8

milhões de anos. Os resultados referidos são muito mais consistentes com a hipótese

“out of Africa” segundo a qual uma população ancestral subsariana originou todas as

populações de homens modernos através de uma cadeia de migrações para o Médio

Oriente, Europa, Ásia, Oceânia e, por último, América.

No mesmo sentido apontam resultados de DNA autossómico ou do cromossoma

X, que indicam que as populações africanas são as mais diversas, ancestrais e possuem

maior número de haplótipos comparativamente a populações não-africanas, tendendo

estas a conter sub-conjuntos da diversidade genética presente em África, como é de

esperar por efeitos de bottlenecks ocorridos durante a recente expansão para fora de

África (ver revisão de Tishkoff e Williams, 2002).

1.3.3.2 - A expansão Bantu

Muito depois da migração do homem para fora de África, teve início uma extraordinária

movimentação humana no interior do continente africano, que iria redesenhar

profundamente o respectivo mapa da distribuição da variabilidade genética. Durante o

Holoceno, o clima estável e ameno permitiu o desenvolvimento da agricultura que

muitas populações adoptariam como estilo de vida. Em África, a transição para este

padrão de subsistência parece ter ocorrido lentamente, sobretudo na forma

sedentarizada, mas entre os 8 000 - 5 000 anos A.C. aparecem vestígios que atestam a

sua dispersão, bem como a de práticas pastorícias (por vezes antecedendo as agrícolas)

primeiro pelo Nordeste africano (que é comparável, em termos de vestígios

arqueológicos, à região do Próximo oriente) e depois por toda a savana sariana do Norte

de África. A agricultura (de savana) chegou mais tarde às zonas subsarianas de floresta

tropical, e pensa-se ter sido levada por vagas migratórias de povos que falavam línguas

Bantu. A migração teve início cerca de 3 000 A.C. a partir dum território que

compreende actualmente a região sudeste da Nigéria e noroeste dos Camarões. Alguns

Page 63: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

33

grupos deslocaram-se lentamente para leste, ao longo da orla setentrional da floresta

equatorial, na direcção dos Grandes Lagos da África Oriental, onde chegaram cerca de 1

000 A.C., inflectindo então para Sul. A partir do núcleo original de dispersão, uma outra

vaga desloca-se pela faixa ocidental da floresta, chegando ao rio Congo cerca de 400

A.C., e continua até atingir o Norte da actual Namíbia, onde se presume ter sido detida

pela aridez do Calaári. Alguns grupos desviam-se então para leste, seguindo o curso dos

rios, e acabam por convergir com a vaga cuja rota de dispersão fora o leste africano

(Iliffe, 1995). Nesta migração milenar, os povos Bantu juntam a cultura de cereais à

agricultura de floresta pré-existente e, pelo menos quando atingem a região dos Grandes

Lagos, tinham já incorporado uma outra técnica - o trabalho do ferro.

A expansão Bantu e a disseminação da sua cultura, tiveram um impacto

profundo sobre as populações de caçadores-recolectores preexistentes. A contribuição

desses povos para o fundo genético masculino dos Pigmeus estimou-se em >50%, dos

!Kung em 45% e dos Khwe em 58% (Underhill, 2002). Algumas linhagens do

cromossoma Y retiveram bem os sinais desta expansão: (a) o haplogrupo E, a que

pertence a maioria das linhagens africanas, tem um gradiente de frequência e

diversidade decrescente no sentido Sul do continente, e os haplogrupos mais antigos, A

e B, são raros em África e apenas se encontram entre grupos actuais de caçadores-

recolectores, onde se encontram bem representados (Jobling e Tyler-Smith, 2003); (b)

relativamente a linhagens definidas por STRs do cromossoma Y, Thomas et al. (2000),

identificam nos padrões de dispersão, frequência e diversidade de um haplótipo definido

por 5 STRs e seus derivados por um passo mutacional, sinais diagnósticos da expansão

Bantu, interpretação posteriormente reforçada pelos resultados de Pereira et al. (2002).

Também ao nível das linhagens femininas, as análises filogeográficas sugerem que pelo

menos a dispersão subsariana dos haplogrupos L3b (Watson et al., 1997), L1a2

(Soodyall et al., 1996; Salas et al., 2002) e L3e1a (Bandelt et al., 2001), está fortemente

associada às migrações e expansões demográficas dos povos de línguas Bantu ocorridas

nos últimos milénios.

1.3.3.3 - Afinidades com a Península Ibérica e a Península Arábica

Outros acontecimentos da história ou pré-história de África, que envolveram

movimentações intra-continentais ou com populações de regiões geograficamente

Page 64: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

34

próximas, deixaram marcas firmes nos padrões de diversidade genética. As afinidades

do Norte de África com a Europa peri-mediterrânea têm merecido considerável atenção,

em particular com a Península Ibérica, onde a barreira geográfica entre os continentes é

mais ténue, sendo apenas ~15 km no estreito de Gibraltar.

No entanto, a análise molecular indica que o fluxo genético entre o Norte de

África e a extremidade atlântica da Europa parece ter sido bastante moderado e

envolveu aportes bidireccionais desiguais. Bosch et al. (2001), recorrendo a uma

aproximação filogeográfica, estimam que a contribuição de cromossomas Y europeus

para o fundo genético norte africano rondará 4%, enquanto que o Noroeste de África

contribuiu com cerca de 7% para os cromossomas Y ibéricos. Os mesmos resultados

sugerem que pelo menos a introdução da maioria de cromossomas africanos na

Península Ibérica resultou de fluxo genético relativamente recente, remetendo para um

intervalo temporal (~700 anos) coincidente com as invasões muçulmanas da Península.

Dados de mtDNA apontam igualmente para fluxo genético restrito entre as regiões,

havendo indicações de que muitas linhagens europeias no Norte de África poderão ter

sido introduzidas na sequência da expansão demográfica do Neolítico (Rando et al.,

1998). Quanto ao componente africano nas linhagens femininas da Península Ibérica,

existe alguma dúvida sobre o impacto relativo das contribuições mediadas por

migrações pré-históricas ou da história mais ou menos recente (Pereira et al., 2000c;

González et al., 2003).

Também devido à proximidade geográfica, estreitos contactos foram

estabelecidos entre África e a Península Arábica. Actualmente, cerca de 10 - 15% das

linhagens femininas em populações árabes têm origem subsariana, havendo indicações

que o fluxo genético mais intenso ocorreu nos últimos ~2 500 anos (Richards et al.,

2003). Pelo contrário, é menos expressivo o vestígio de linhagens masculinas

subsarianas nas mesmas populações. Tudo indica que a presença de linhagens africanas

na Arábia é o resultado, a longo prazo, do intenso tráfico de escravos negros controlado

pelos árabes que, desde tempos remotos, se estabeleceu em corredores ligando a África

de Leste, o Sara e a Península Arábica. Por outro lado, a diferença detectada no fluxo

genético feminino e masculino reflecte, consistentemente, as características deste

comércio intra e intercontinental de escravos. Normalmente era constituído por mais

mulheres e crianças do que viria a acontecer posteriormente durante o mercado atlântico

de escravos (Klein, 1999). Os homens negros, entre os quais muitos eunucos, eram

Page 65: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

35

essencialmente recrutados para o trabalho manual ou para reforçar o potencial humano

em expedições militares e, por conseguinte, o seu sucesso reprodutivo era quartado

(Richards et al., 2003). Era diferente o interesse comercial na importação de escravas

negras, sendo muito de natureza sexual e daí estimular-se o seu potencial reprodutivo. A

assimilação de mulheres africanas na população árabe, está bem patenteada pela

representatividade actual de linhagens femininas subsarianas.

Migrações recentes e mais localizadas, que trouxeram linhagens de origem não-

africana para o continente, podem também ser parcialmente recuperadas mesmo quando

o arquivo documental é vago ou virtualmente inexistente. Os Lemba, também chamados

“judeus negros” do Sul de África, vivem em clãs dispersos pelo território do actual

Malawi, Zimbabwe e África do Sul. Presentemente, as suas práticas religiosas são muito

sincretistas e diversificadas mas com pouco a ver com o judaísmo usualmente praticado,

embora outras práticas culturais evoquem costumes judaicos. De acordo com uma

tradição oral dos Lemba, persistente mas de antiguidade incerta, seriam de origem

judaica tendo vindo de “Sena do Norte” num processo migratório acidentado iniciado há

mais de 2000 anos. Sena é imprecisamente localizado no Yemen, Judeia, Egipto ou

Etiópia. Apesar de não haver qualquer registo que clarifique a sua origem, pelo menos a

tradição oral é consistente com os dados da análise genética que indicam que cerca de

67.7% de linhagens do Y de indivíduos que se auto-identificam como Lemba são de

origem semita e os restantes de origem Bantu ou outra (Thomas et al., 2000). Os

mesmos dados indicam, porém, que pelo menos algumas linhagens semitas poderão ter

sido introduzidas em sequência de episódios migratórios mais recentes que a

antiguidade conjecturada na tradição oral.

1.3.3.4 - África e as descobertas quinhentistas

Finalmente, é de referir o impacto genético de acontecimentos da história moderna

muito recente, protagonizados em África mas com extensas e complexas repercussões

não só no modelo de desenvolvimento do continente mas também do Novo Mundo:

trata-se das descobertas quinhentistas e do subsequente intenso fluxo de movimentação

de pessoas que se iria prolongar durante quase cinco séculos. A partir do século XV,

com a chegada dos exploradores e comerciantes europeus, o mapa de distribuição

populacional em África iria sofrer uma enorme reconfiguração. Nas viagens de

Page 66: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

36

navegação pela (ou em direcção à) orla atlântica do continente africano, iriam ser

descobertas muitas ilhas até então desabitadas. Os portugueses, pioneiros nas

explorações transatlânticas, viram nestas ilhas pontos estratégicos para o

desenvolvimento das suas actividades económicas e comerciais, e empenharam-se no

seu povoamento. As estratégias e trajectórias de povoamento, muito condicionadas pela

posição geográfica e pela disponibilidade em recursos humanos, foram tão

diversificadas como as molduras populacionais que actualmente existem em

arquipélagos como Açores, Madeira, Cabo Verde ou São Tomé e Príncipe, todos

descobertos em quinhentos.

Mas, ao contrário das expectativas atendendo ao facto de serem episódios

recentes, a documentação sobre as respectivas histórias de povoamento, é por vezes

vaga e repleta de lacunas. Por isso, a análise do mtDNA e do cromossoma Y, constitui

uma importante fonte de informação, complementar a outras igualmente importantes,

que em conjunto podem proporcionar um entendimento mais cabal da origem e

evolução das populações dos arquipélagos.

É neste contexto que se insere o estudo que agora se apresenta sobre São Tomé e

Príncipe e outros similares sobre os Açores (Oliveira, 2001; Santos et al., 2003) e Cabo

Verde (Brehm et al., 2002; Gonçalves et al., 2003). Quanto aos Açores, a análise do

mtDNA e do cromossoma Y revela a existência de um fundo de linhagens ibérico com

traços de outros contributos europeus, particularmente do Norte da Europa. Uma

fracção pequena de linhagens é de origem africana, reflectindo o envolvimento de

mouros e negros no povoamento de algumas ilhas, e há também vestígios de linhagens

presumivelmente introduzidas por judeus.

Em Cabo Verde o panorama é completamente diferente. Há grandes afinidades

entre o espectro geral de linhagens femininas e o registado na faixa atlântica de África a

Norte do Equador, e apenas cerca de 2% de sequências de mtDNA parecem ter sido

directamente introduzidas por mulheres europeias. Porém, quanto às linhagens paternas,

mais de metade (53.5%) pertencem a haplogrupos característicos de populações

europeias ou do Médio Oriente (Gonçalves et al., 2003). Isto significa que a população

de Cabo Verde, na visão correntemente assumida como paradigma de população

crioula, resultou de um padrão de miscigenação muito específico, em que

marcadamente predominou o cruzamento entre homens europeus e mulheres africanas.

Page 67: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

37

Estas e outras histórias de povoamento ou colonização, processaram-se em

paralelo com a expansão marítima dos portugueses que iriam transformar África em

centro de abastecimento para o tráfico transatlântico de escravos, actividade que teria

um desenvolvimento imprecedente e que cedo atrairia a concorrência de outras

potências europeias. Os primeiros escravos da África Ocidental foram sobretudo para a

Península Ibérica e para os arquipélagos em fase de povoamento. Na primeira metade de

quinhentos, os portos de Lisboa e Sevilha eram os centros de um próspero comércio a

partir dos quais os escravos africanos eram amplamente distribuídos pelo Mediterrâneo

Ocidental. Estes escravos eram utilizados sobretudo em actividades tradicionais, mas foi

em alguns arquipélagos outrora desabitados que seria iniciado um novo modelo de

trabalho escravo, com a utilização pelos europeus de escravos africanos nas plantações.

O modelo expandiu-se rapidamente e logo nas primeiras décadas do século XV, iriam

começar os carregamentos directos de escravos para as Américas, em especial para o

Brasil, onde as plantações floresciam e a necessidade de mão-de-obra acabaria por

absorver grande fracção do tráfico negreiro. Sobre o volume de tráfico, baseado em

registos de escravos que desembarcaram nas Américas, Curtin (1969) calcula que entre

1451 e 1870 chegaram às Américas cerca de 9 400 000 escravos e num estudo posterior

Eltis et al. (1999), reavalia em aproximadamente 11 milhões os escravos africanos que

atravessaram o Atlântico entre 1519 e 1867. Quase dois terços dos escravos exportados

para as Américas eram do sexo masculino.

Os locais de origem dos escravos deslocaram-se a pouco e pouco para o Sul. Os

primeiros vinham essencialmente da Senegâmbia, da costa da Alta Guiné (entre a

Guiné-Bissau e a Libéria actuais). Em meados do século XVII, os escravos partiam

também da Costa do Ouro e da baía de Benin. No século XVIII, estenderam-se à baía do

Biafra (sobretudo o delta do Níger), Congo, Angola e finalmente Moçambique (Iliffe,

1995).

O comércio atlântico de escravos africanos, teve um papel fundamental no

repovoamento pós-quinhentista das Américas, como se poderá ilustrar com o exemplo

brasileiro. Entre 1500 e 1972, 58% dos imigrantes que entraram no Brasil eram

europeus, 40% africanos e 2% asiáticos (Callegari-Jacques e Salzano, 1999, citado em

Alves-Silva et al., 2000). Com base no estudo de mtDNA e cromossoma Y, Pena et al.

(2000), procuram traçar o “retrato molecular” da população branca brasileira, e os

resultados que obtêm indicam que a grande maioria das linhagens masculinas (~90%)

Page 68: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

38

dos brancos brasileiros é de origem europeia, enquanto a maioria das linhagens

femininas (~60%) é ameríndia ou africana. A distribuição das patrilinhagens europeias é

muito semelhante à registada em Portugal (que contribuiu com a fracção maioritária dos

imigrantes europeus) e as diferenças mais acentuadas são relativas a haplótipos

sobretudo frequentes na região mediterrânea o que parece testemunhar a expressiva

entrada no Brasil de italianos, espanhóis e sírio-libaneses. Não detectaram a presença de

linhagens paternas ameríndias e as subsarianas representam apenas uma pequena

fracção das patrilinhagens da população branca. As linhagens de mtDNA revelam

proporções gerais de 33% de linhagens ameríndias, 28% africanas e 39% europeias, mas

com variações consideráveis de região para região do Brasil de acordo com o padrão

esperado dada a história de colonização de cada uma.

Na Europa, o influxo de escravos africanos foi incomparavelmente menor, mas

com alguma relevância na Península Ibérica onde, no século XV em algumas cidades

portuárias portuguesas e castelhanas, os africanos podiam representar 10% ou mesmo

15% da população (Klein, 1999). Se os vestígios dessa presença são virtualmente

inexistentes no fundo de linhagens masculinas de populações ibéricas actuais, estão

ainda bem marcados ao nível das linhagens maternas em que, no caso da população

portuguesa, cerca de 7% são de origem subsariana e de presumida introdução recente

(Pereira et al., 2000c).

Sugestivamente, em relação a essas e outras linhagens subsarianas encontradas

por toda a Europa, a esmagadora maioria dos matches detectados é com sequências de

mtDNA presentes em populações da África Ocidental, enquanto que as sequências

subsarianas encontradas em populações americanas também apresentam matches com

outras do sudeste do continente africano (Pereira et al., 2001). Esta observação é o

reflexo da dinâmica de desenvolvimento do comércio de escravos. A grande maioria

dos escravos trazida para a Europa, veio durante as fases iniciais do estabelecimento da

rota triangular de escravos, altura em que o recrutamento ainda não tinha chegado à

costa índica. Só bem mais tarde é que escravos traficados em Moçambique iriam

engrossar o mercado negreiro, numa fase em que se destinava quase exclusivamente às

Américas, compreendendo-se, assim, a quase ausência de partilha de sequências de

mtDNA entre a Europa e o leste africano.

Page 69: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

I-Introdução

39

1.4 - OBJECTIVOS

Face ao potencial da análise do mtDNA e do cromossoma Y em estudos antropológicos

e ao incipiente estado de caracterização genética de São Tomé e Príncipe no geral e, em

particular, dos grupos populacionais que a percepção comum sãotomense de alguma

forma hierarquiza, entendeu-se ser relevante:

- estudar em Angolares, Forros e Tongas, o padrão de distribuição de linhagens

definidas por:

- STRs e marcadores bialélicos do cromossoma Y e;

- variações de sequência em HVS-I e HVS-II do mtDNAtendo em vista:

- avaliar o nível de subestruturação populacional actualmente existente em São

Tomé e Príncipe;

- entender como se geraram os padrões de distribuição de diversidade das linhagens

masculinas e femininas no arquipélago e inferir dos factores de maior impacto nesses

padrões;

- estudar as afinidades de São Tomé e Príncipe com populações africanas e outras

que pudessem contribuir para o esclarecimento do passado genético do arquipélago;

e, numa perspectiva mais ampla:

- contribuir para a caracterização fina da diversidade genética no continente

africano.

Page 70: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de
Page 71: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

II - MATERIAL E MÉTODOS ___________________________________

Page 72: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de
Page 73: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

43

2.1 - AMOSTRAS

Todas as amostras foram obtidas sob consentimento informado. Solicitou-se aos

voluntários que respondessem a um breve inquérito, com o objectivo de recolher

informações sobre identidade, naturalidade, residência, sexo e naturalidade dos pais,

avós e bisavós. Colheu-se um total de 239 amostras, ou de sangue obtido por punção

venosa anticubital e armazenado em tubos contendo como anticoagulante EDTA (ácido

etilenodiaminotetracético 10% p/v) na proporção de 0.1ml por 5ml de sangue, ou de

manchas sanguíneas em retalhos de tecido de algodão, secos à temperatura ambiente e

armazenados individualmente em saquetas devidamente identificadas.

As colheitas foram efectuadas em laboratórios de análises clínicas dos Centros

de Saúde dos Distritos de Caué, Lobata e Mézochi, no Hospital de São João dos

Angolares, ou directamente em roças agrícolas, nomeadamente, Dr. Agostinho Neto,

Morro Peixe, Poiso Alto, Boa Entrada e Monte Café. Todos os indivíduos envolvidos

neste estudo eram do sexo masculino, não aparentados e naturais e residentes em São

Tomé e Príncipe. Na Figura 2.1, indica-se os locais onde se procedeu à recolha das

amostras. A colheita contou com a colaboração dos Delegados de Saúde e Técnicos

laboratoriais e as deslocações às roças foram efectuadas sob coordenação de Técnicos

de Saúde.

O enquadramento num de três grupos populacionais foi feito com base nos

seguintes critérios:

- Angolares - indivíduos cuja família directa descendia há pelo menos três

gerações de Angolares; teve-se em conta a auto-identificação no grupo e a língua ou

actividades culturais dominantes nas comunidades visitadas;

Page 74: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

II-Material e Métodos

44

- Forros - descendentes de naturais de São Tomé e Príncipe há pelo menos três

gerações;- Tongas - indivíduos descendentes de serviçais oriundos de Cabo-Verde,

Moçambique e Angola.

Figura 2.1 – Mapa da Ilha de São Tomé com os locais de recolha de amostras. Angolares ( ), Forros ( ) e Tongas ( )

2.2 - EXTRACÇÃO DE DNA

O DNA foi extraído a partir de sangue total ou manchas em tecido, usando o método de

Chelex ou de fenol-clorofórmio. As amostras de DNA extraído, foram conservadas a 5 0C, para posterior utilização.

2.2.1 - Extracção a partir de sangue total

2.2.1.1 - Extracção por Chelex

Previamente ao processo de extracção de DNA, promovia-se a lise dos glóbulos

vermelhos por choque osmótico, efectuando-se o seguinte procedimento:

Page 75: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

II-Material e Métodos

45

- adição de 1 ml de água desionizada a 20 μl de sangue total e incubação à

temperatura ambiente durante 30 minutos;

- centrifugação a 12 000 g durante 4 minutos;

- rejeição do sobrenadante para a obtenção da fracção sedimentar contendo os

glóbulos brancos e DNA livre.

A extracção do DNA foi efectuada segundo o método descrito por Lareu et al. (1994) e

consistiu basicamente no seguinte:

- adição de 200 μl de uma solução de Chelex a 5%;

- incubação a 56 0C durante 30 minutos;

- vortex a alta velocidade durante 5-10 segundos;

- incubação a 100 0C durante 8 minutos;

- vortex a alta velocidade durante 5-10 segundos;

- centrifugação a 12 000 g durante 4 minutos.

2.2.1.2 - Extracção por fenol-clorofórmio

Antes da extracção, a lise das células foi obtida do seguinte modo:

- descongelação de alíquotas de sangue a temperatura ambiente;

- ressuspensão de 100 μl de coágulos em 500 μl de tampão de lise DLB (ver Tabela

2.1);

- adição de 50 μl de SDS a 10% e 5 μl de proteinase K (20 mg/ml);

- incubação a 56 0C durante toda a noite com agitação suave.

O método de extracção por fenol-clorofórmio utilizado foi o descrito em Valverde et al.

(1993), e compreendeu os passos:

- adição de 20 μl de NaCl 5 M e de 575 μl de fenol: clorofórmio: álcool isoamílico

(25:24:1);

- homogeneização dos tubos por inversão, durante cerca de 1 hora a temperatura

ambiente;

- centrifugação durante3 minutos a 12 000 rpm;

- trasladação da fase superior para outro tubo;

- adição de 575 μl de clorofórmio: álcool isoamílico (24:1);

Page 76: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

II-Material e Métodos

46

- homogeneização dos tubos por inversão, durante cerca de 1 hora a temperatura

ambiente centrifugação 3 minutos a 12 000 rpm;

- trasladação da fase superior para outro tubo;

- adição 1 ml de etanol a 96% a -20 0C e misturar suavemente por inversão;

- precipitação de DNA durante 15 minutos a - 80 0C;

- centrifugação durante 15 minutos a 12 000 rpm;

- rejeição do sobrenadante e secagem por evaporação do pellet;

- ressuspensão em 100 μl de água ou TE (ver Tabela 2.1) a 56 0C, entre 2 - 16 horas

até a completa homogeneização dessa solução.

Tabela 2.1 - Composição de soluções utilizadas no processo de extracção de DNA.

Tampão Composição DLB 10mM Tris-HCl, pH=7.4; 10mM EDTA, pH=8.0; 5 M NaCl

TE 10 mM Tris-HCl, pH=7.5; 1 mM EDTA, pH=8.0

2.2.2 - Extracção a partir de manchas

No caso de extracções de DNA a partir de manchas, os procedimentos foram idênticos,

(ao ponto 2.2.1), substituindo-se o sangue total por cerca de 1 cm2 de tecido cortado em

pequenos pedaços.

2.3 - MARCADORES DO CROMOSSOMA Y

Neste trabalho estudaram-se 7 STRs e 14 marcadores bialélicos do cromossoma Y.

Todos foram analisados por técnicas de PCR e as reacções de amplificação foram

efectuadas nos termocicladores Stratagene 40 ou “Biometra UNO II”.

Page 77: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

II-Material e Métodos

47

2.3.1 - Microssatélites

Foram os seguintes os STRs analisados: DYS19, DYS389I, DYS389II, DYS390,

DYS391, DYS392 e DYS393. Os respectivos GeneBank accession numbers, estão

indicados na tabela 2.2.

2.3.1.1 - Condições de amplificação

Os STRs foram amplificados individualmente ou em sistemas multiplex. Neste caso

recorreu-se a um pentaplex para co-amplificar DYS19, DYS389I, DYS389II, DYS390 e

DYS393 de acordo com as condições descritas em Gusmão et al. (1999) e a um duplex

para a co-amplificação de DYS391 e DYS392 segundo condições descritas em Brión et

al. (2000). Na tabela 2.2, encontra-se a sequência dos primers e marcações utilizados

nas amplificações.

Em cada reacção foram amplificados cerca de 10 ng de DNA genómico.

A reacção pentaplex consistiu de12.5 μl de uma solução final contendo:

- 1.25 μl de tampão 10x PCR (concentração final de 50 mM KCl, 1.5 mM MgCl2 e

10 mM Tris-HCl, pH 9.0);

- 0.5 unidades de Taq Gold Polimerase (Perkin - Elmer);

- 200 μM de cada um dos quatros desoxinucleótidos trifosfatados (dNTPs), (dATP,

dCTP, dGTP e dTTP).

Tabela 2.2 - Sequência e marcação dos primers utilizados na amplificação de sete STRs do cromossoma Y

Locus STR Gene Bank accession

Sequência de primers (5´-3´) Referência

DYS19 X77751 TET- cta ctg agt ttc tgt tat agt atg gca tgt agt gaa gga ca Kayser et al. (1997)

*DYS389I/II G09600 TET - cca act ctc atc tgt att atc tat tct tat ctc cac cca cca ga Kayser et al. (1997)

DYS390 G09611 6FAM - tat att tta cac att ttt ggg cc tga cag taa aat gaa cac att gc Kayser et al. (1997) pe

ntap

lex

DYS393 G09601 HEX - gtg gtc ttc tac ttg tgt caa tac aac tca agt cca aaa aat gag g Kayser et al. (1997)

DYS391 G09613 6FAM - cta ttc att caa tca tac acc ca gat tct ttg tgg tgg gtc tg Kayser et al. (1997)

dupl

ex

DYS392 G09867 HEX - tca tta atc tag ctt tta aaa aca a aga ccc agt tga tgc aat gt Kayser et al. (1997)

*marcador bilocus em que o mesmo par de primers amplifica os loci DYS389I e YS389II

Page 78: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

II-Material e Métodos

48

As concentrações dos primers foram:

- 0.4 μM DYS19;

- 0.12 μM DYS389I e II;

- 0.12 μM DYS390;

- 0.2 μM DYS393.

Para a amplificação do sistema duplex, usou-se cerca 10 ng de DNA num volume de

reacção de 12.5 μl contendo:

- 1.25 μl de tampão 10x PCR (concentração final de 50 mM KCl, 1.5 mM MgCl2 e

10 mM Tris-HCl, pH 9.0);

- 0.5 unidades de Taq DNA polimerase;

- 200 μM de cada dNTP;

- 0.25 μM de cada primer.

Após reacções de PCR, foi feita a separação electroforética dos produtos amplificados

recorrendo ou a sistemas automáticos de separação e leitura de fragmentos ou a

sistemas manuais.

Tabela 2.3 - Condições de amplificação dos STRs do cromossoma Y

Condições de amplificação

Locus STR Desnaturação inicial Desnaturação Annealing Extensão Extensão

final Número de

ciclos

pent

aple

x DYS19 DYS389I/II

DYS390 DYS391

94 0C - 5´ 94 0C - 1´ 55 0C - 1´30´´ 72 0C - 2´ 72 0C - 10´ 35 Ciclos

dupl

ex

DYS392 DYS393 95 0C - 5´ 95 0C - 1´ 56 0C - 1´30´´ 72 0C - 2´ 72 0C - 10´ 30 Ciclos

2.3.1.2 - Separação automática de fragmentos de DNA amplificados

A análise automática de fragmentos efectuou-se num ABI PRISM® 377 Genetic

Analyser (AB Applied Biosystems) seguindo as instruções do Manual do Utilizador. O

pellet foi ressuspenso em formamida desionizada e azul de dextrano (25 mM EDTA, pH

8.0 e 50 mg/ml de azul de dextrano) e TAMRA 500, o padrão interno de tamanho, na

Page 79: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

II-Material e Métodos

49

proporção 1:5. Antes da corrida, as amostras foram desnaturadas por aquecimento a 95 0C durante 30 minutos, sendo de imediato colocadas em gelo.

As amostras foram então aplicadas em gel PAGE a 6% e corridas em

sequenciador automático ABI PRISM 377 DNA Sequencer. As condições

electroforéticas foram Pré-Run: 1 kV; 35mA, 50mW de laser power, 60´; Run: 3 kV;

60mA, 40mW de laser power; 5 horas. Os resultados foram analisados usando uma

matriz (Set C) gerada com as matrizes padrão 6-FAM, TET, HEX, e TAMRA. O

tamanho dos fragmentos foi determinado automaticamente pelo programa GeneScan®

Analysis Software v.2.1.

2.3.1.3 - Separação não-automática de fragmentos de DNA amplificados

Os produtos de PCR foram submetidos a electroforese horizontal em géis de

poliacrilamida e utilizando a diacrilpiperazina como crosslinker. Usou-se o sistema de

tampões descrito por Luís e Caeiro (1995).

O tampão das pontes e o do gel eram constituídos por 0.125 M Tris/HCl e 0.375

M Tris/Glicina a pH 8.8, respectivamente. Directamente sobre o gel, foram aplicadas

tiras de papel (10 cm x 1.5 cm) “Whatman” (Cat. Nº 3017915) embebidas em tampão

das pontes. Para controlo de migração, adicionou-se à solução electrolítica catódica

algumas gotas de solução do corante azul de bromofenol em corridas de fragmentos de

DNA pequenos, e xileno de cianol em corridas de fragmentos maiores. A separação

electroforética decorreu sob uma diferença de potencial constante de 150 V/cm, numa

placa de arrefecimento, durante 2 a 3 horas à temperatura de 8 0C (a corrida era

interrompida quando o corante atingia o ânodo).

2.3.1.4 - Método de visualização do DNA amplificado

Quando se usaram sistemas não-automatizados, após a separação electroforética os

fragmentos de DNA foram visualizados usando a coloração com nitrato de prata,

segundo o método descrito por Budowle et al. (1991). O método consistia na passagem

sequencial do gel pelas soluções e com os tempos de incubação que se descrevem na

Tabela 2.4.

Page 80: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

II-Material e Métodos

50

Tabela 2.4 - Soluções utilizadas e tempos de incubação na técnica de coloração com nitrato de prata.

Soluções utilizadas Tempo de incubação Etanol 10% 10 minutos Ácido nítrico 1% 5 minutos Água desionizada 30 segundos (2 vezes) Nitrato de prata 0.2% 20 minutos Água desionizada 30 segundos (2 vezes) Carbonato de sódio 0.28 M e Formaldeído 0.02% Até visualização das bandas Ácido acético 10% 30 segundos Água desionizada Várias lavagens

2.3.1.5 - Genotipagem de STRs

Para determinar, automática ou manualmente, o tamanho dos fragmentos amplificados,

foram usados como referências ladders alélicos sequenciados. Procurou-se usar ladders

contendo pelo menos os alelos mais comuns reportados para populações europeias e

africanas. Os alelos foram designados de acordo com o número de repetições, segundo

as recomendações da DNA Commission of the International Society of Forensic

Genetics (ISFG), 2001. A nomenclatura usada foi a proposta por de Knijff et al. (1997),

excepto para DYS389I e DYS389II em que se utilizou a recomendada pelo Forensic Y-

User Group (http://ystr.org).

Atendendo a que com o mesmo par de primers se amplificavam dois fragmentos

incluindo DYS389I e DYS389I + DYS389II, para inferir o tamanho dos alelos de

DYS389II subtraiu-se ao tamanho do maior fragmento o número de repetições

correspondente a DYS389I.

2.3.2 - Marcadores bialélicos

Estudaram-se por PCR-RFLPs, 14 marcadores bialélicos do cromossoma Y que se

apresentam na Tabela 2.5, bem como as sequências dos primers e respectivas condições

de amplificação.

Page 81: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

II-Material e Métodos

51

Tabela 2.5 - Primers, condições de amplificação e tamanho dos fragmentos obtidos para cada marcador

Condições de amplificação Locus Y-BM

Sequência de Primer (5´- 3´) Desnatura

ção Inicial Desnaturação Annealing Extensão Nº Ciclos

Fragmentos(pb)

YAP cag ggg aag ata aag aaa ta act gct aaa agg gga tgg at 940C-30´´ 540C-30´´ 720C-30´´ 33 ↓ -150

+455 Hammer e

Horai (1995)

SRY 8299

aca gca cat tag ctg gta tga c tct ctt tat ggc aag act tac g 940C-30´´ 620C-30´´ 720C-60´´ 33

509 Santos et al.

(1999a)

sY81 agg cac tgg tca gaa tga ag aat gga aaa tac agc tcc cc 940C-30´´ 60 0C-30´´ 720C-60´´ 32

209 Seielstad et al.

(1994)

12f2 tct tct aga att tct tca cag aat tg ctg act gat caa aat gct tac aga tc 940C-30´´ 590C-30´´ 720C-30´´ 33 ↓ ±500

0 Rosser et al.,

(2000)

SRY 1532

tcc tta gca acc att aat ctg g aaa tag caa aaa atg aca caa ggc 940C-30´´ 590C-30´´ 720C-30´´ 34 167 Kwok et al.

(1996)

LLy22g cca ccc agt ttt atg cat ttg ata gat ggc gtc ttc atg agt 940C-30´´ 550C-60´´ 720C-60´´ 33 850 Jobling e

Tyler-Smith (2000)

Tat gac tct gag tgt aga ctt gtg a gaa ggt gcc gta aaa gtg tga a 940C-30´´ 600C-30´´ 720C-30´´ 33 112 Zerjal et al..

(1997)

92R7 gac ccg ctg tag acc tga ct gcc tat cta ctt cag tga ttt ct 940C-30´´ 620C-30´´ 720C-60´´ 33 709 Hurles et a.l.

(1999)

SRY 2627

agg tct ttt ttg cct tct ta atg cac ggt ttc ttt tga

940C-30´´ 540C-30´´ 720C-120´´ 33 1242 Veitia et al. (1997)

M9 gca gca tat aaa act ttc agg aaa acc taa ctt tgc tca agc 940C-30´´ 580C-30´´ 720C-30´´ 33 341 Hurles et al.

(1998)

M109 ggg tat caa atg tct tca acc t ggg aat ttc ctg cta ctt gc

950C-2´ 940C-30´´ 580C-30´´ 720C-30´´ 32 312 Underhill et al. (2001)

M112 act ttt tcc aac agt tat ttt tga cct act ttc ccc ctc ttc tg

950C-2´ 940C-30´´ 580C-30´´ 720C-30´´ 32 445 Underhill et al. (2001)

M150 gca gtg gag atg aag tga gac ccta ctt tcc ccc tct tct g

950C-2´ 940C-30´´ 580C-30´´ 720C-30´´ 32 289 Underhill et al. (2001)

M168 agt ttg agg tag aat act gtt tgc t aat ctc ata ggt ctc tga ctg ttc

950C-30´´ 600C-30´´ 720C-60´´ 35 473 Underhill et al. (2001)

2.3.2.1 - Condições de amplificação

Cada reacção de amplificação, excepção de M109, M112 e M150, foi realizada num

volume final de 12.5 μl que continha:

- 200 μM de cada desoxinucleotídeo trifosfato (dATP, dCTP, dGTP e dTTP);

- 0.25 μM de cada primer;

- 1.25 μl de tampão 10x PCR (concentração final de 50 mM KCl, 1.5 mM MgCl2

e 10 mM Tris-HCl, pH 9.0);

- 0.5 unidades de Taq DNA polimerase (DNA polimerase de Thermus aquaticus -

Perkin-Elmer);

- 1-3 μl do DNA extraído (5-10 ng/μl).

Page 82: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

II-Material e Métodos

52

No caso de M109, M112 e M150 a reacção de amplificação foi realizada num volume

final de 25 μl que continha:

- 200 μM dNTPs

- 1.5 mM MgCl2

- 1x tampão

- 0.5 unidades de Taq DNA polimerase recombinante (Invitrogene).

O marcador 12f2 foi amplificado juntamente com o sY81, que serviu de controlo

positivo nas amostras que apresentavam a delecção 12f2, permitindo confirmar se

ocorreu amplificação.

Dado que em YAP, o polimorfismo envolve uma inserção/delecção Alu, e em

12f2 possivelmente uma inserção/delecção de um segmento de DNA, para estes dois

marcadores a discriminação dos alelos era imediatamente dada pelo tamanho dos

fragmentos amplificados. Nos restantes marcadores, as variações polimórficas afectam

locais de reconhecimento de enzimas de restrição, pelo que se recorreu à análise dos

padrões de digestão com enzimas apropriadas (também indicadas na Tabela 2.6) para a

detecção dos dois estados alélicos.

2.3.2.2- Digestão enzimática e separação dos fragmentos digeridos

Nas reacções de digestão, adicionou-se a 2 μl de produto amplificado, 5 unidades de

enzima de restrição em tampões recomendados pelos fabricantes, de forma a perfazer

um volume final de 5 μl. As reacções decorreram a 37 0C, durante um período mínimo

de 60 minutos.

Os produtos de amplificação ou digestão foram separados por electroforese

horizontal, usando o procedimento descrito no ponto 2.3.1.3 em géis de poliacrilamida

T:9%, C:5%, à excepção do que se utilizou para o sistema SRY2627 que foi T:6%,

C:4%. Para a visualização dos fragmentos de DNA recorreu-se ao método descrito no

ponto 2.3.1.4. A classificação das amostras foi feita por comparação com controlos

previamente tipados.

Page 83: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

II-Material e Métodos

53

Tabela 2.6 - Condições da digestão enzimática, substituição nucleotídica e fragmentos resultantes para cada SNP

Digestão

Marcador Enzima de restrição Buffer BSA

Sequência de reconhecimento

(5´-3´) Polimorfismo Fragmentos

(bp)

SRY-8299 BsrBI 1 U 1x - GAG▼CGG ↓ G A

362 + 147 509

sY81 NlaIII 2 U 2x 2x CATG▼ ↓ A G

68 + 102 + 39 68 + 141

SRY-1532 DraIII 1 U 1x 1x CACNNN▼TG ↓ A G

167 112 + 55

LLy22g HindIII 1 U 1x - A▼AGCTT ↓ C A

500 + 230 + 120 650 + 500 + 230 + 120

Tat NlaIII 2 U 1x - CATG▼ ↓ T C

85 + 27 112

92R7 HindIII 2 U 1x - A▼AGCTT ↓ C T

197 + 512 709

SRY-2627 BsiHKAI 1 U 1x 1x

C T

1242 298 + 944

M9 HinfI 1 U 1x - G▼ANTC ↓ C G

67 + 181 + 92 248 + 92

M168 HinfI 1 U 1x - G▼ANTC ↓ C T

289 + 81 + 103 289 + 184

Quanto aos marcadores M109, M112 e M150, foram analisados por sequenciação. As

reacções de sequenciação foram efectuadas usando o Kit de sequenciação dRodamina

Terminator Cicle (AB, Applied Biosystems) seguindo as instruções do Manual do

Utilizador. A detecção e análise desses marcadores foram efectuadas num ABI 3100

Genetic Analyser (AB Applied Biosystems).

2.3.2 - Classificação dos haplogrupos

Em conjunto, os 14 marcadores bialélicos analisados permitem definir os haplogrupos

indicados na Figura 2.2, que passarão a ser referidos de acordo com a nomenclatura

recomendada pelo Y Chromosome Consortium, 2003.

Page 84: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

II-Material e Métodos

54

The Y Chromosome Consortium

Underhill et al., (2000)

Jobling and Tyler-Smith

(2000) A

Y*(xBR) I 7 e 27

B*(xB2a,b)

B M150 B2a*(xB2a1)

C→ T M109 C →T

B2a1

Y M112 G → A

B2b

II 2 e 6

C

CR*(xDE,J,K) V e VI 2, 10, 15, 35 e 36

D

D IV 4

SRY-1532 YAP

SRY-10831ª A→ G

M1 DYS287 Alu- → Alu+

SRY-8299

E*(xE3a) 21 e 25

M168

M40 SRY4064 G → A sY81

C→ T

E M2 DYS271 A→G

E3a

III

8

12f2 J Presente→Ausente

J VI 9

K*(xN,P) VII e VIII 5, 13, 20, 23,

24, 26 e 28 LLY22g

N*(xN3) 12

M9 C → A N Tat

C→ G K

M46 T→C

N3

VIII

16

P*(x R1a,R1b3f) IX e X 1 e 18

SRY1532

92R7 SRY10831b G → A

R1a 3 e 29

G → A P SRY2627

M167 C→T

R1b3f

IX

22

R

Figura 2.2 - Haplogrupos possíveis de discriminar com 14 marcadores do Y. A nomenclatura de acordo com a recomendação do YCC, (2003) e equivalência com outros sistemas previamente utilizados encontram-se nas três últimas colunas. A negrito encontram-se os marcadores estudados e em itálico os respectivos sinónimos. A vermelho assinalam-se as alterações nucleotídicas.

Page 85: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

II-Material e Métodos

55

2.4 - DNA MITOCONDRIAL

2.4.1 - Amplificação e sequenciação

Após a amplificação das regiões HVS-I e HVS-II do mtDNA, os produtos de PCR

foram purificados em colunas MicrospinTM S-300 HR (Pharmacia), de acordo com as

instruções do fabricante. Este procedimento tinha como finalidade remover restos de

Taq, primers, dNTPs e fragmentos curtos de DNA parcialmente amplificados, que

podiam interferir com a reacção de sequenciação. As sequências dos primers e as

condições de amplificação e de sequenciação estão indicadas nas Tabela 2.7 e Tabela

2.8, respectivamente.

Tabela 2.7 - Sequência dos primers utilizados na análise das regiões HVS-I e II do DNA mitocondrial

Locus

mitocondrial Sequência de Primers

(5´- 3´) Referência

HVS-I L15997 (cac cat tag cac cca aag ct) H16401 (tga ttt cac gga gga tgg tg ) Pereira et al. (2000b)

HVS-II L48 (ctc acg gga gct ctc cat gc) H408 (ctg tta aaa gtg cat acc gcc a) Pereira et al. (2000b)

De forma a testar o sucesso da amplificação, os produtos de PCR foram corridos

em gel de poliacrilamida T9C5, e visualizados com coloração de prata, segundo

procedimentos já descritos em 2.3.1.3 e 2.3.1.4, respectivamente.

Efectuou-se de seguida a reacção cíclica didesoxinucleotídica de sequenciação,

usando o Kit de sequenciação Big -DyeTM Terminator (AB Applied Biosystems) e cada

um dos primers mencionados na Tabela 2.7, de forma a obter para ambas as regiões

sequências com direcção directa e reversa.

Tabela 2.8 - Condições das reacções de amplificação e de sequenciação das regiões HVS-I e HVS-II

Condições Desnaturação inicial

Desnaturação Annealing Extensão Extensão final

Número de ciclos

Amplificação 95 0C - 1´ 95 0C - 10´´ 60 0C - 30´´ 72 0C - 30´´ 15 0C - 10´ 35

HV

S-I

HV

S-II

Sequenciação 96 0C - 4´ 96 0C -15´´ 50 0C - 9´´ 60 0C -2´ 60 0C - 10´ 30

Page 86: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

II-Material e Métodos

56

Após reacção de sequenciação, os produtos de extensão foram purificados recorrendo a um protocolo baseado em precipitação por MgCl2 e etanol. O pellet foi ressuspenso em formamida ou formamida desionizada e azul de dextrano, conforme o sequenciador utilizado. As amostras foram então aplicadas em gel PAGE a 6% e corridas em sequenciador automático ABI PRISM 377 DNA Sequencer, ou ABI 3100 Genetics Analyser, e a análise de sequências foi efectuada recorrendo a software específico de aparelho, respectivamente ABI PRISM 377 - 18 Data Collection Software e DNA sequencing Analysis 3.7 software. 2.4.2 - Classificação de sequências Na Figura 2.3, apresenta-se compilada a informação relativa a HVS-I e HVS-II, no esqueleto filogenético de sequências L, que representa uma adaptação do apresentado por Salas et al. (2002).

Figura 2.3 - Esqueleto filogenético mostrando as sequências de HVS-I e HVS-II do mtDNA

L 2 /3 *

L 1 *

L 3 *

L 3 gL 3 f

L 3 f1

L 3b 1L 3 b 2

L 3b

L 3 d 1

L 3 d 2

L 3 d L 3 d 3

L 3 e 4

L 3 e

L 3 e 1

L 3 e 3

L 3 e 1 b

NM

L 2 *

L 2 b

L 2b 1L 2 a 1b

L 2 a 1

L 2 a 1a

L 2 a

L 2 d

L 2 c

L 2 c 1

L 2 c 2

L 2 d 2

L 2 d 1

L 1 dL 1 d 1

L 1d 2L 1 f

L 1 k

L 1k 1

L 1a

L 1a 2

L 1 a 1

L 1a 1 a

L 1 b

L 1b 1

L 1 c

L 1 c 2

L 1 c 3L 1c 1

L 1 c 1 a

L1c1a1

L 1 e 2

L 1 e 1

L 1 e

1 6 3 62

1 6 2 13

1 61 1 4 A

1 61 2 9

1 6 29 0

1 63 0 916 2 8 6

16 2 9 416 1 1 4 A1 6 1 4 51 6 2 391 6 2 9 216 3 5 5

1 6 1 8 91 6 1 2 9

16 2 3 3

1 6 35 41 63 0 0

1 6 3 9 9

1 63 1 8

16 1 2 916 1 4 81 6 16 6

1 6 2 94

1 6 2 5 4 1 6 1 1 11 6 31 1

1 6 36 21 6 35 5

1 6 2 64

1 6 23 4

1 6 2 43 1 6 1 2 91 6 1 69

1 6 3 2 7 1 6 1 481 6 12 9

16 2 3 0

1 6 1 72

16 1 8 9

1 61 2 6

16 1 8 7

16 3 1 1

1 6 2 09 1 6 2 64

1 6 1 2 91 6 29 4

1 6 36 0

1 6 2 701 62 1 4

1 62 9 1

1 6 3 9 0

1 63 6 2

1 63 1 11 6 2 93 T

1 63 5 5

1 6 2 92

1 6 3 1 1

1 62 0 9

16 1 2 4

1 6 3 62

16 2 7 8

1 61 2 4 1 6 3 11

16 3 1 91 6 2 56

1 6 1 8 91 6 2 7 81 6 3 0 41 6 3 1 1

16 2 6 5T

16 2 6 4

L 3e 2

L 3e 2 b

1 63 2 0

16 1 7 216 1 8 9

1 62 7 8

16 2 7 4

1 6 29 3

1 6 2 93

1 6 26 5 C1 62 8 6 G

16 1 8 71 6 2 15

16 2 1 41 6 2 231 62 3 41 6 2 49

1 6 2 78

1 61 6 6 C

1 6 3 20

1 61 2 9

16 1 6 8

1 6 2 78

1 6 1 8 8G1 6 1 72

18 5 T

18 6 A18 9 C

31 6

0 7 31 8 9

2 3 6

2 4 7

L 3 e 1a

1 6 1 85

1 6 32 7

16 3 2 5D

1 8 92 0 03 2 5

L 3 e 2 a

19 8

L 3L 2

L 1

Page 87: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

II-Material e Métodos

57

A classificação de sequências de mtDNA em haplogrupos foi feita de acordo com o

descrito por Watson et al. (1997), Rando et al. (1998), Macaulay et al. (1999), Richards

et al. (2000); Bandelt et al. (2001), Pereira et al. (2001) e Salas et al. (2002).

2.5 - ANÁLISE ESTATÍSTICA

Utilizou-se o programa ARLEQUIN versão 2.000 (Schneider et al., 2000), para:

- estimar, pelo método de contagem directa, frequências génicas ou haplotípicas e

respectivos desvios padrões;

- calcular índices de diversidade genética;

- obter medidas de distância genética inter-populacional e efectuar testes exactos

de diferenciação populacional;

- estimar médias e distribuições de pares de diferenças entre haplótipos definidos

por marcadores bialélicos do Y ou variações de mtDNA;

- efectuar análise de variância molecular - AMOVA;

- testar desvios ao modelo de equilíbrio populacional e/ou neutralidade selectiva

pela aplicação das estatísticas “Tajima´s D” e “Fu´s Fs” em amostras de

mtDNA.

Para avaliar afinidades populacionais com base em microssatélites do Y, usaram-se

RSTs, considerando o quadrado do somatório das diferenças de tamanho entre

haplótipos. Os valores obtidos foram agrupados pelo método de Neighbour-Joining

(Saito e Nei, 1987), utilizando a rotina Neighbour do pacote de programas PHYLIP 3.5c

(Felsenstein, 1993). A robustez da árvore foi avaliada por 1000 bootstraps de iteração e

recorreu-se ao programa Treeview (Page, 1996) para a sua visualização. Ainda quanto a

microssatélites, para calcular média e distribuição de diferenças entre pares de

haplótipos, contou-se cada alteração de uma unidade de repetição entre microssatélites

como uma diferença.

Para marcadores bialélicos do Y, as distâncias genéticas foram obtidas por FSTs

ponderando diferenças mutacionais entre pares de haplótipos.

As networks dos haplótipos definidos por STRs do Y, foram construídas com o

algorítmo mediam joining e ω =0, do pacote de programas NETWORK4.0.0.0

(http://www.fluxus-engineering.com).

Page 88: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

II-Material e Métodos

58

Relativamente ao mtDNA, nas análises restritas ao arquipélago mobilizou-se

toda a informação obtida quanto a variação de sequência, que incluiu a registada entre

as posições nucleotídicas 16 051 a 16 390 para HVS-I, e 73 a 349 para a HVS-II,

referenciando de acordo com a CRS de Anderson et al. (1981). Nas comparações com

outras populações, apenas se considerou a informação relativa a HVS-I entre as

posições 16 090 a 16 365, por ser muito reduzido o número de trabalhos com dados

sobre segmentos mais extensos de HVS-I ou sobre HVS-II. As distâncias genéticas

entre populações foram avaliadas com base em valores de FSTs obtidos após 1000

permutações da informação introduzida. Para obter uma aproximação à filogenia das

sequências de mtDNA encontradas em São Tomé e Príncipe, utilizou-se a rotina Dnadis

do pacote PHYLIP 3.5c para calcular distâncias moleculares entre sequências

assumindo o modelo “Kimura 2-parâmetros” e considerando a proporção de 15:1 de

transições e transversões. De seguida usou-se a rotina Neighbour do mesmo pacote para

obter a representação filogenética e a árvore foi visualizada com o Treeview.

Os dados sobre outras populações foram compilados da bibliografia.

Entre outros estudos comparativos, e para SNPs do Y e mtDNA, os dados foram

mobilizados para proceder à análise de componentes principais, que se efectuou

recorrendo ao programa POPSTR, com o objectivo de se inferir as afinidades entre as

populações. Nesta abordagem, usaram-se ou frequências de todos os haplogrupos em

diferentes populações ou, alternativamente no caso do mtDNA, frequências relativas

dentro do lote de haplogrupos de tipo L.

O nível de significância considerado para rejeitar hipóteses nulas, foi sempre

P<0.05.

Page 89: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III - RESULTADOS E DISCUSSÃO ______________________________________________

Page 90: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de
Page 91: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

61

3.1 - STRs DO CROMOSSOMA Y

3.1.1 - Análise locus a locus

Neste trabalho estudaram-se sete STRs do cromossoma Y, DYS19, DYS389I,

DYS389II, DYS390, DYS391, DYS392 e DYS393. Para cada um, as estimativas de

frequências alélicas registadas em Angolares, Forros, Tongas e na amostra global de

São Tomé e Príncipe estão apresentadas na Tabela 3.1.

Em seis dos STRs estudados, o padrão de distribuição das frequências alélicas

era unimodal, observando-se relativamente ao alelo preponderante uma diminuição

gradativa da frequência de alelos que diferiam entre si por uma unidade de repetição.

Muitos STRs com padrões unimodais bastante regulares, apresentam alelos

predominantes distintos em diferentes grandes grupos populacionais humanos, o que

lhes confere grande utilidade em estudos de Genética populacional, em particular

quando se pretende investigar misturas entre populações. É o caso do STR DYS390, o

único no conjunto dos STRs agora estudados em São Tomé e Príncipe, em que no

padrão de variação se desenhava uma certa bimodalidade. Como irá ser discutido mais à

frente, na amostra global de São Tomé, referindo a amostra numericamente mais bem

representada, DYS390*21 era o alelo preponderante, mas registou-se um segundo pico

de frequência, ainda que bastante inferior, ao nível do alelo DYS390*24.

Comparando as distribuições alélicas nos 7 STRs entre Angolares, Forros e

Tongas, podem constatar-se as semelhanças dos padrões de variação, particularmente

entre Forros e Tongas. Os Angolares tendem a apresentar jogos de frequências um

pouco diferenciados dos dois outros grupos populacionais sãotomenses. Note-se, por

exemplo, que para DYS389II o alelo mais comum nos Angolares é DYS389II*18, logo

Page 92: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

62

seguido de DYS389II*17, alelos que Forros e Tongas compartilham como segundo e

primeiro mais frequentes, respectivamente. Uma inversão idêntica de frequências

observa-se em DYS391.

Tabela 3.1 - Estimativas de frequências alélicas para sete STRs em Angolares Forros, Tongas e amostra global de São Tomé Príncipe.

Locus Alelo Angolares (N=21) Forros (N=38) Tongas (N=44) São Tomé (N=103)

DYS19 12 0.048±0.048 - - 0.010±0.010 13 0.048±0.048 0.053±0.037 0.091±0.044 0.068±0.025 14 0.190±0.088 0.184±0.064 0.136±0.052 0.165±0.037 15 0.619±0.109 0.421±0.081 0.500±0.076 0.495±0.050 16 0.048±0.048 0.158±0.060 0.136±0.052 0.126±0.033 17 0.048±0.048 0.158±0.060 0.136±0.052 0.126±0.033 18 - 0.026±0.026 - 0.010±0.010

DYS389I 8 - - 0.068±0.038 0.029±0.017 9 0.238±0.095 0.132±0.056 0.114±0.048 0.146±0.035 10 0.762±0.095 0.579±0.081 0.659±0.072 0.650±0.047 11 - 0.289±0.075 0.159±0.056 0.175±0.038

DYS389II 15 - - 0.114±0.048 0.049±0.021 16 0.095± 0.066 0.184±0.064 0.159±0.056 0.155± 0.036 17 0.381±0.109 0.500±0.082 0.477±0.076 0.466±0.049 18 0.429± 0.111 0.263±0.072 0.250±0.066 0.291±0.045 19 0.095±0.066 0.053±0.037 - 0.039±0.019

DYS390 20 - - 0.023±0.023 0.010± 0.010 21 0.714±0.101 0.684±0.076 0.591±0.075 0.650±0.047 22 0.286±0.101 - 0.045±0.032 0.078±0.027 23 - 0.026±0.026 0.159±0.056 0.078±0.027 24 - 0.184±0.064 0.159±0.056 0.136±0.034 25 - 0.079±0.044 0.023±0.023 0.039±0.019 26 - 0.026±0.026 - 0.010± 0.010

DYS391 9 - - 0.023±0.023 0.010± 0.010 10 0.429±0.111 0.632±0.079 0.659±0.072 0.602±0.048 11 0.524±0.112 0.316±0.076 0.318±0.071 0.359±0.048 12 0.048±0.048 0.053±0.037 - 0.029±0.017

DYS392 10 0.048±0.048 - 0.023±0.023 0.019±0.014 11 0.857±0.078 0.737±0.072 0.750±0.066 0.767±0.042 12 - 0.079±0.044 0.091±0.044 0.068±0.025 13 - 0.105±0.050 0.091±0.044 0.078±0.027 14 0.095±0.066 0.079±0.044 0.023±0.023 0.058±0.023 15 - - 0.023±0.023 0.010±0.010

DYS393 12 - 0.079±0.044 0.068±0.038 0.058±0.023 13 0.571±0.111 0.526±0.082 0.614±0.074 0.573±0.049 14 0.286±0.101 0.289±0.075 0.227±0.064 0.262±0.044 15 0.143±0.078 0.079±0.044 0.091±0.044 0.097±0.029 16 - - - - 17 - 0.026±0.026 - 0.010±0.010

Page 93: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

63

Por outro lado, para a maioria dos STRs, o número de alelos por locus encontrado em

Angolares é inferior ao encontrado em Forros e Tongas. Avaliada por este parâmetro, a

redução de diversidade em Angolares é particularmente acentuada para o locus

DYS390, já que no grupo apenas foram encontrados 2 dos 7 alelos detectados na

amostra global de São Tomé e Príncipe. O valor mais elevado quanto à média de alelos

por locus registou-se nos Forros.

Na Figura 3.1, as estimativas de frequências génicas para os sete STRs agora

obtidas nos grupos populacionais sãotomenses, são confrontadas com as reportadas para

outras populações utilizadas como referência, nomeadamente, do Centro e Norte de

Portugal e de outras ex-colónias portuguesas em África. Como a figura ilustra, quatro

dos sete STRs estudados, DYS19, DYS389II, DYS390 e DYS392, têm uma elevada

capacidade para diagnosticar populações europeias e africanas, na medida em que os alelos

mais comuns nas primeiras são, em geral, bastante menos frequentes nas segundas, e vice-

versa. DYS19*14, DYS389II*16, DYS390*24 e DYS392*13 têm frequência muito

elevada em populações europeias mas baixa ou intermédia em populações africanas. Pelo

contrário, nas últimas predominam os alelos DYS19*15, DYS389II*17, DYS390*21 e

DYS392*11, alelos que em europeus não ultrapassam valores intermédios de frequência.

Os restantes três marcadores, DYS389I, DYS391 e DYS393, são bastante menos

informativos na discriminação de populações europeias das africanas. Assim, se se

atender, em particular, aos primeiros quatro STRs referidos, verifica-se que as

distribuições alélicas agora registadas nas amostras de São Tomé e Príncipe diferem

muito das encontradas nas populações portuguesas do Norte e Centro, e se enquadram

bem melhor nos padrões registados em Angola, Moçambique e Guiné-Bissau, e de um

modo geral, na gama de valores reportados para populações africanas (de Knijff et al.,

1997).

No entanto, há também sinais de que a contribuição europeia para o gene pool

masculino da população actual de São Tomé e Príncipe não terá sido irrelevante.

DYS390 parece ser o STR que, individualmente, melhor reflecte essa influência. Como

já se referiu, apresenta na amostra global de São Tomé uma distribuição bimodal. O

alelo mais frequente, DYS390*21, é-o também noutras populações africanas. Porém, o

segundo alelo mais frequente, DYS390*24, que na amostra global de São Tomé chega

aos 13.6%, é muito raro em populações africanas subsarianas, mas muito frequente em

Page 94: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

64

europeus, nomeadamente no Norte e Centro de Portugal, como se pode ver na Figura

3.1.

Figura 3.1 - Distribuição de frequências alélicas de sete STRs em amostras populacionais de São Tomé e Príncipe, outras populações africanas e populações portuguesas. Eixo do X: número de unidades de repetição. Eixo do Y: frequências alélicas.

DYS19

0

0.2

0.4

0.6

0.8

12 13 14 15 16 17 18

DYS389I

00.20.40.60.8

1

8 9 10 11 12

DYS389II

0

0.2

0.4

0.6

0.8

14 15 16 17 18 19

DYS390

0

0.2

0.40.6

0.8

1

20 21 22 23 24 25 26 27

DYS391

0

0.2

0.4

0.6

0.8

1

9 10 11 12

DYS392

0

0.2

0.4

0.6

0.8

1

10 11 12 13 14 15

DYS393

00.20.40.60.8

1

11 12 13 14 15 16 17

Angolares Forros T ongas São T omé Angola NorteCabo Verde Guiné Bissau Moçambique Portugal Centro Portugal Norte

Page 95: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

65

Assim, a elevada frequência que atinge em São Tomé e Príncipe, representa, a

par de outros que irão ser apresentados, um bom indicador do impacto europeu no

componente genético masculino da população actual de São Tomé e Príncipe.

Da análise da Figura 3.1, sobressai ainda o padrão de distribuição de frequências

de Cabo Verde. As características são intermédias entre os padrões típicos de

populações europeias e africanas, o que reflecte o elevado grau de miscigenação que

ocorreu durante o processo de povoamento deste arquipélago.

Na Tabela 3.2, podem comparar-se os valores de heterozigotia, locus a locus ou

médios, registados nas amostras estudadas com os reportados para outras populações.

Nas amostras sãotomenses, os loci DYS19 e DYS389II foram aqueles que apresentaram

diversidade génica mais elevada, à semelhança do que tende a verificar-se nas restantes

populações africanas que constam da tabela. Em contrapartida, DYS392 foi o STR em

que se registou nível de heterozigotia mais baixo, o que também acontece nas restantes

populações africanas e que contrasta com o que se observa nas duas amostras

portuguesas que, para este locus, se caracterizam por elevada diversidade.

Tabela 3.2 - Diversidade génica relativa a sete STRs em amostras de São Tomé e Príncipe e outras populações.

Diversidade Génica População DYS

19 DYS 389I

DYS 389II

DYS 390

DYS 391

DYS 392

DYS 393

Média dos 7 STRs

Angolares 0.600 0.381 0.686 0.429 0.567 0.267 0.600 0.504±0.298Forros 0.755 0.579 0.661 0.504 0.512 0.445 0.643 0.586±0.332Tongas 0.702 0.535 0.687 0.611 0.475 0.429 0.572 0.573±0.324Angola 0.602 0.554 0.653 0.356 0.450 0.040 0.533 0.455±0.266

Cabo Verde 0.766 0.643 0.681 0.772 0.578 0.498 0.508 0.635±0.354Guiné-Bissau 0.716 0.636 0.587 0.644 0.307 0.117 0.617 0.518±0.299Moçambique 0.722 0.658 0.697 0.653 0.503 0.158 0.589 0.568±0.323

Portugal Centro 0.642 0.457 0.576 0.607 0.649 0.660 0.571 0.595±0.334Portugal Norte 0.494 0.597 0.554 0.500 0.510 0.560 0.374 0.517±0.295

Relativamente à média de diversidade considerando a informação conjunta dos

sete STRs, a gama de valores que constam da Tabela 3.2 não indicia a existência de

diferenças marcadas de variabilidade entre populações europeias e africanas. No mesmo

sentido apontam os resultados obtidos por Pritchard et al. (1999), num estudo alargado a

um leque mais vasto de populações humanas, sobre o padrão de variabilidade de STRs

do cromossoma Y.

Page 96: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

66

Quanto aos três grupos populacionais de São Tomé e Príncipe, é nos Angolares

que se detecta o valor mais baixo de heterozigotia média (0.504±0.298), enquanto que

em Forros e Tongas os níveis de heterozigotia média são mais elevados e semelhantes

entre si (0.586±0.332 e 0.573±0.324, respectivamente). Assim, este resultado reforça o

sinal, já anteriormente referido, de que os Angolares se caracterizam por uma certa

redução de diversidade genética relativamente aos dois outros grupos populacionais do

arquipélago.

No sentido de obter uma primeira aproximação ao grau de heterogeneidade

genética entre Angolares, Forros e Tongas, foram calculados valores de FST

considerando os três grupos populacionais sãotomenses. Os resultados por locus e

média relativa aos sete STRs apresentam-se na Tabela 3.3.

Tabela 3.3 - Valores de FST por locus e médios, relativos a sete STRs do cromossoma Y.

DYS loci Grupo Populacional DYS

19 DYS 389I

DYS 389II

DYS 390

DYS 391

DYS 392

DYS 393

Média nos 7 STRs

Sãotomenses -0.008 0.026 -0.002 0.042* 0.017 -0.006 -0.020 0.006

Africanos 0.017* 0.016 0.007 0.099* 0.017 0.057* 0.005 0.029*

O grupo sãotomense inclui os Angolares, Forros e Tongas; o africano

compreende adicionalmente Angola, Cabo Verde, Guiné-Bissau e Moçambique. * P<

0.05.

Com excepção do valor de FST obtido para o locus DYS390, que era

estatisticamente significativo, os valores de FST registados nos restantes STRs e o valor

médio considerando os sete loci (0.006), eram muito baixos, e não atingiam nível de

significância estatística. Este resultado indica que, entre os três grupos populacionais de

São Tomé e Príncipe, não existe heterogeneidade genética acentuada.

Para possibilitar uma certa contextualização da magnitude dos valores

registados, calcularam-se novos valores de FST considerando adicionalmente as

amostras de Angola, Cabo Verde, Guiné-Bissau e Moçambique, e os resultados também

constam na Tabela 3.3. Como se pode verificar, mesmo incluindo um conjunto de

populações africanas geograficamente muito dispersas, o valor médio de FST, apesar de

Page 97: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

67

estatisticamente significativo, pode ainda considerar-se baixo (0.029) o que significa

que será relativamente reduzido o nível médio de diferenciação genética entre as

populações africanas consideradas nesta análise. Esta dedução, é absolutamente

consistente com os resultados de Jorde et al. (2000), obtidos num estudo envolvendo

populações à escala mundial, que lhes permitiu concluir que, em média, as populações

africanas são menos diferenciadas ao nível de STRs do cromossoma Y, do que

populações de outros continentes.

3.1.2 - Análise haplotípica

Na tabela 3.4, discriminam-se os haplótipos definidos pelos sete STRs (DYS19,

DYS389I, DYS389II, DYS390, DYS391, DYS392 e DYS393) e frequências absolutas

registadas em Angolares, Forros e Tongas. Por sua vez, na Tabela 3.5, apresentam-se

diversos parâmetros de diversidade haplotípica referentes às amostras sãotomenses

investigadas e a outras populações de referência.

No conjunto, as amostras dos três grupos populacionais, representam um total de

103 cromossomas Y da população de São Tomé e Príncipe, entre os quais se

encontraram 79 haplótipos distintos. A maioria constitui ocorrências únicas num dos

três grupos populacionais, o que se reflecte nos elevados valores de diversidade

haplotípica observados em Angolares, Forros ou Tongas.

Índices de diversidade haplotípica muito elevados são, aliás, comuns na maioria

das populações, incluindo todas as que constam da Tabela 3.5. Apesar de tudo, o nível

de variabilidade haplotípica nos Angolares (0.967) é o mais baixo não apenas dos

grupos populacionais de São Tomé, como também das outras populações que aparecem

na Tabela 3.5, exceptuando Angola que regista um valor de diversidade idêntico ao dos

Angolares. Em contrapartida, os Forros apresentam o mais elevado nível de diversidade

haplotípica (0.994) entre os sãotomenses, e um dos mais elevados entre as restantes

populações de referência.

Ao contrário do que se referiu no ponto anterior sobre os níveis médios de

variabilidade inferidos com base em STRs do Y, em populações africanas a variância do

número médio de repetições para os mesmos marcadores, é, em geral, superior à de

populações não-africanas (Pritchard et al., 1999). Os dados apresentados na Tabela 3.2

também corroboram essa tendência.

Page 98: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

68

Tabela 3.4 - Haplótipos de STRs do cromossoma Y encontrados em Angolares, Forros, e Tongas, e número de matches com outras populações africanas, duas portuguesas, com registos contidos numa base de dados Caucasóides (http://ystr.charite.de) -[∴]- e com a amostra de indivíduos africanos de Pritchard et al., 2000 (http://www.stats.ox.ac.uk/) -[∴ ∴].

Loci Populações/ Matches

DY

S 19

DY

S 38

9I

DY

S 38

9I

DY

S 39

0

DY

S 39

1

DY

S 39

2

DY

S 39

3

Ang

olar

es

Forr

os

Tong

as

Ang

ola

Cab

o-V

erde

Gui

né-B

issa

u

Moç

ambi

que

Portu

gal C

entro

Portu

gal N

orte

Afr

ican

os∴∴

Cau

casó

ides

H1 12 10 18 21 11 11 13 1 H2 13 9 17 24 10 11 13 1 3 2 5 H3 13 10 17 21 11 13 13 1 H4 13 10 17 24 10 11 13 1 40 H5 13 10 17 24 11 11 13 1 1 5 H6 13 10 18 21 10 11 13 1 H7 13 10 18 21 11 11 13 1 1 H8 13 10 18 24 11 11 12 1 H9 14 9 16 24 10 13 13 1 8 H10 14 9 16 24 11 13 12 1 2 H11 14 9 16 25 10 14 13 1 3 H12 14 9 17 22 10 11 14 1 5 H13 14 9 17 22 11 11 14 2 H14 14 9 17 22 11 14 14 1 H15 14 10 16 24 10 14 13 1 1 8 H16 14 10 16 24 11 12 13 1 1 1 7 H17 14 10 16 24 11 13 13 1 4 4 5 191 H18 14 10 17 21 10 13 14 1 H19 14 10 18 24 10 11 13 1 5 4 H20 14 11 17 23 9 11 13 1 1 H21 14 11 17 23 10 11 12 1 H22 14 11 17 23 10 15 12 1 7 H23 14 11 17 24 11 13 13 1 1 1 4 H24 14 11 17 25 10 14 13 1 H25 15 8 15 21 10 13 13 1 H26 15 8 15 23 10 12 13 2 H27 15 9 15 21 11 11 13 1 H28 15 9 16 21 10 11 13 1 1 H29 15 9 17 21 10 11 14 1 1 1 1 H30 15 9 18 23 12 11 14 1 H31 15 9 19 21 10 11 13 1 H32 15 10 16 21 10 11 14 1 H33 15 10 16 22 10 11 14 1 1 H34 15 10 16 24 10 11 14 1 1 H35 15 10 16 24 10 13 13 1 2 2 22 H36 15 10 17 21 10 10 13 1 H37 15 10 17 21 10 11 12 1 1

Page 99: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

69

Tabela 3.4. - Continuação.

H38 15 10 17 21 10 11 13 1 5 1 2 H39 15 10 17 21 10 11 14 1 3 3 5 1 2 1 1 H40 15 10 17 21 10 11 15 1 2 1 3 H41 15 10 17 21 10 11 17 1

H42 15 10 17 21 11 11 13 1 2 1 1

H43 15 10 17 21 12 11 13 1

H44 15 10 17 22 10 11 15 1

H45 15 10 17 22 12 11 15 1

H46 15 10 18 21 10 11 13 1 1 2 7 2 2 4 1

H47 15 10 18 21 10 11 14 1 1 2 1

H48 15 10 18 21 11 11 13 4 3 3 2 6 1

H49 15 10 18 21 11 14 13 1

H50 15 10 19 21 10 11 13 1 1

H51 15 10 19 21 11 11 13 1

H52 15 11 17 21 10 11 13 1 1 1 1 1 1

H53 15 11 17 21 10 11 14 1 2 1

H54 15 11 17 21 10 11 15 1

H55 15 11 18 25 10 11 13 1 1

H56 16 9 17 21 10 11 14 1 1

H57 16 9 17 22 11 11 13 1

H58 16 10 16 21 10 11 15 1 1

H59 16 10 16 24 10 11 13 1 18

H60 16 10 16 26 11 12 13 1

H61 16 10 17 21 10 11 13 1 1 1

H62 16 10 17 21 11 11 14 1 1 1

H63 16 10 18 20 11 12 13 1

H64 16 10 18 21 11 11 13 1 1 1

H65 16 10 18 25 11 11 14 1 3

H66 16 11 15 23 10 11 13 1

H67 16 11 18 21 10 11 13 1

H68 17 10 16 21 10 11 15 1

H69 17 10 16 21 11 11 12 1

H70 17 10 17 21 10 11 14 1 1 1 3 1

H71 17 10 17 21 10 12 14 1

H72 17 10 17 21 11 10 15 1

H73 17 10 18 21 11 11 13 1

H74 17 10 18 23 10 14 13 1

H75 17 11 17 21 10 11 14 2 1

H76 17 11 17 21 10 11 15 1 1 5

H77 17 11 17 21 10 12 14 1

H78 17 11 17 21 11 11 14 1

H79 18 11 17 21 10 11 14 1

Page 100: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

70

A variância do número médio de repetições em Forros e Tongas enquadra-se na gama

dos valores mais elevados que constam da Tabela 3.5 e que se referem a populações

africanas. Mais uma vez, no que respeita aos grupos sãotomenses, distinguem-se os

Angolares já que também quanto a este parâmetro se caracterizam por menor

variabilidade.

Tabela 3.5 - Índices de diversidade haplotípica em São Tomé e Príncipe e outras populações.

População N Nº

haplótipos diferentes

Diversidade haplotípica

Diversidade Génica*

Variância do número médio de repetições*

1. Angolares [a] 21 17 0.967±0.030 0.504±0.298 0.554

2. Forros [a] 38 35 0.994±0.008 0.586±0.332 1.043

3. Tongas [a] 44 37 0.991±0.008 0.573±0.324 0.863

São Tomé (1-3) 103 79 0.987±0.006 0.566±0.316 0.886

4. Angola [b] 50 32 0.967±0.014 0.455±0.266 0.637

5. Cabo Verde[b] 47 34 0.978±0.011 0.635±0.354 0.925

6. Guiné-Bissau [b] 33 27 0.977±0.018 0.518±0.299 0.497

7. Moçambique [b] 37 30 0.987±0.010 0.568±0.323 1.058

África (1-7) 270 167 0.989±0.002 0.566±0.314 0.866

África [c] 229 154 0.995±0.001 0.620±0.340 1.135

8. Portugal C [d] 50 43 0.992±0.007 0.595±0.334 0.685

9. Portugal N [e] 55 39 0.980±0.009 0.517±0.295 0.527

Portugal (8 + 9) 105 77 0.990±0.004 0.556±0.312 0.602

Europeus [c] 46 37 0.985±0.010 0.503±0.289 0.505 [a]: este estudo; [b]: Corte Real et al. (2000); [c]: Pritchard et al. (1999); [d]: Carvalho et al. (2000); [e]: González-Neira et al. (2000). * médias dos 7 STRs.

Na amostra global de São Tomé, sobressai a frequência relativamente elevada - 9.7% -

do haplótipo H48. Aparece nos três grupos populacionais, mas é entre Angolares que

está mais bem representado atingindo o valor de 19%. Os segundos haplótipos mais

comuns em São Tomé e Príncipe são H39 e H46, representando, cada um, 3.9% dos

cromossomas Y sãotomenses. Estes três haplótipos, e outros que se encontraram com

menor frequência na amostra analisada, fazem parte de um conjunto com grandes

afinidades moleculares, e que se tem admitido ser um marcador da expansão Bantu em

África sub-equatorial. Thomas et al. (2000), verificam que em populações Bantu do

Page 101: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

71

leste de África, são preponderantes os haplótipos 15-21-10-11-13, ou os seus derivados

por um passo mutacional, definidos pelos STRs DYS19, DYS390, DYS391, DYS392 e

DYS393, o que os leva a deduzir que esse núcleo de haplótipos representa a assinatura da

expansão Bantu em direcção ao leste africano. O mesmo conjunto de haplótipos, sinaliza

igualmente a rota de dispersão de povos faladores de línguas Bantu via ocidente africano

(Pereira et al., 2002). Em São Tomé e Príncipe, aquele que é considerado o haplótipo

fundador nessa expansão populacional (15-21-10-11-13), representa 10.7% da amostra

analisada. Se considerarmos os 5 haplótipos detectados que diferem daquele por uma

mutação (15-21-10-10-13, 15-21-10-11-12, 15-21-10-12-13, 15-21-10-11-14 e15-21-11-

11-13), no total representam 35% dos cromossomas Y de São Tomé e Príncipe, e ambos os

valores são da ordem dos registados em populações fortemente marcadas pela expansão

Bantu. Por conseguinte, este resultado indica que para o povoamento de São Tomé e

Príncipe foi muito significativo o contributo de populações do continente africano com

manifesta influência Bantu, influência que, indirectamente, a população sãotomense

incorporou.

3.1.3 - Padrão de Partilha

Com o objectivo de se investigar a origem dos haplótipos detectados em São Tomé e

Príncipe, fez-se a análise do padrão de partilha haplotípica (a) com as populações de

referência já mencionadas, e, adicionalmente, (b) com 20 populações de origem

europeia que, em 2001, constavam da base de dados de STRs do Y -

http://ystr.charite.de - contendo na altura 3589 registos haplotípicos, e (c) com a amostra

populacional de escala mundial estudada por Pritchard et al. (1999), que continha 229

haplótipos africanos e cujos resultados estavam acessíveis em

http://www.stats.ox.ac.uk/~pritchard/data. O exercício de análise foi efectuado tendo em

consideração a grande desproporção numérica entre linhagens masculinas Caucasóides

e Africanas comparadas. Nas últimas colunas da direita da Tabela 3.4, está discriminado

o número de matches entre haplótipos detectados em São Tomé e Príncipe e os das

amostras atrás referidas.

Relativamente aos grupos sãotomenses, os Tongas partilham o maior número de

haplótipos com outras populações: 43% dos seus 37 haplótipos são partilhados por

homens de origem europeia e 49% também se encontram em outras populações

Page 102: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

72

africanas. Em contrapartida os Angolares são os que partilham menos haplótipos:

apenas 4 dos 17 haplótipos aparecem também em Caucasóides e/ou Africanos.

Entre os haplótipos sãotomenses partilhados, destaca-se o elevado número de

matches que H4, H17, H35 e H59 apresentam. Quanto a H4 e H17, presentes apenas

nos Tongas, encontraram-se 40 e 191, respectivamente, registos iguais na base de dados

de linhagens Caucasóides, e na mesma base de dados, para os haplótipos H35 e H59,

presentes nos Forros, registaram-se, por ordem respectiva, 22 e 18 matches. Dois destes

quatro haplótipos - H17 e H35 - apresentam matches múltiplos com linhagens do norte

e centro de Portugal. Por outro lado, os 4 haplótipos estão ausentes nas amostras

africanas consideradas, à excepção de H17 que aparece em Cabo Verde mas que se

pode explicar pela intensa miscigenação que ocorreu neste arquipélago. Assim, apenas

pelo padrão de partilha, pode deduzir-se que os 4 haplótipos são bastante específicos de

populações europeias, pelo que é de admitir que a sua presença em São Tomé e Príncipe

seja o resultado de introgressão, mediada, muito provavelmente, por homens

portugueses. De origem europeia parecem ser também os haplótipos H2, H5, H9, H10,

H11, H12, H15, H16, H22 e H23. Embora apresentem um número menor de matches

com linhagens europeias, se se atender aos alelos que contêm nos STRs DYS390 e/ou

DYS392 (muito informativos como auxiliares na discriminação de populações

europeias e africanas) e à ausência de haplótipos idênticos nas amostras africanas

(exceptuando, novamente, Cabo Verde), afigura-se bastante improvável serem de

origem africana. Quanto aos outros haplótipos não exclusivos de São Tomé e Príncipe, a

maioria apresenta matches com linhagens de Angola, Guiné-Bissau, Cabo Verde,

Moçambique ou com as da amostra de africanos de Pritchard et al. A origem africana

desses haplótipos também não deixa grandes dúvidas.

Para aqueles haplótipos que apresentavam apenas um ou outro match e, por

vezes, simultaneamente com amostras africanas e europeias, não foi possível inferir,

com segurança aceitável, a sua mais provável origem geográfica.

3.1.4 - Distribuição de diferenças entre pares de haplótipos

Na Figura 3.2, estão graficamente representadas as distribuições do número de

diferenças observadas entre pares de haplótipos - mismatch distributions - registadas em

Page 103: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

73

Angolares, Forros, Tongas, na amostra global de São Tomé e nas amostras africanas

que se usaram como referência.

Ao contrário do que acontece nas outras amostras, em que as distribuições de

diferenças entre os pares de haplótipos são tendencialmente unimodais, em

Moçambique observa-se um afastamento deste padrão já que se registam várias modas e

apenas se esboça um ligeiro pico de frequência ao nível de um número elevado de

diferenças entre haplótipos.

Mpd =4.69±2.39 Mpd=6.74±3.25

Mpd=6.23±3.02 Mpd=6.19±2.97

Mpd=4.63±2.33 Mpd=6.85±3.29

Mpd=6.59±3.18 Mpd=4.62±2.30

Figura 3.2 - Distribuição do número de diferenças entre pares de haplótipos definidos por STRs do Y e média das diferenças entre pares de haplótipos (Mpd). Eixo dos X: número médio de diferenças entre os haplótipos. Eixo dos Y: frequências.

Tongas

00,050,1

0,150,2

0,25

0 2 4 6 8 10 12 14

Cabo Verde

0

0,05

0,1

0,15

0,2

0,25

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Angolares

0

0,05

0,1

0,15

0,2

0,25

0 2 4 6 8 10 12 14

Forros

00,050,1

0,150,2

0,25

0 2 4 6 8 10 12 14

S.Tomé e Príncipe

00,050,1

0,150,2

0,25

0 2 4 6 8 10 12 14 16

Moçambique

-0.05

0.05

0.15

0.25

0 2 4 6 8 10 12 14

Guiné Bissau

00.050.1

0.150.2

0.25

0 2 4 6 8 10 12 14

Angola

00,050,1

0,150,2

0,25

0 2 4 6 8 10 12 14

Page 104: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

74

A análise populacional de mismatch distributions tem sido sobretudo aplicada

em estudos envolvendo SNPs. Para este tipo de marcadores, existem modelos bastante

robustos que permitem antever como acontecimentos demográficos passados afectam a

quantidade e a distribuição da diversidade molecular em populações actuais

(Harpending et al., 1998; Schneider e Excoffier, 1999).

Porém, a dinâmica populacional da variação de microssatélites só tem sido alvo

de atenção mais recente (Kimmel et al., 1998; Gonser et al., 2000) e ainda não há

modelos bem estabelecidos para prever distribuições de pares de diferenças no contexto

evolutivo de STRs do cromossoma Y.

Relativamente a SNPs, espera-se que populações que registaram no passado

expansões demográficas acentuadas apresentem curvas de mismatch distribution

unimodais e regulares, enquanto que, pelo contrário, distribuições de pares de diferenças

multi-modais e irregulares são uma assinatura previsível para aquelas que se

mantiveram relativamente estáveis em termos de tamanho populacional. A adequação

destas previsões tem sido demonstrada com os resultados obtidos em populações

africanas para o mtDNA. Populações em que a agricultura ou pastorícia constituem o

modo de subsistência típico, são caracterizadas por distribuições de pares de diferenças

entre sequências de mtDNA em forma de “sino” (bell-shaped), enquanto que padrões

muito irregulares (ragged) só se têm encontrado em populações actuais de caçadores-

recolectores (Watson et al., 1996).

Assim, efectuando para mismatch distributions de STRs um paralelismo

interpretativo idêntico ao aplicado para SNPs, os padrões unimodais detectados em

Angola e Guiné-Bissau indicam tratarem-se de populações que registaram expansões

consideráveis das linhagens masculinas definidas por STRs.

Os padrões de distribuição observados em Cabo Verde ou na amostra global de

São Tomé e Príncipe são muito parecidos. Ambos são unimodais e regulares, à

semelhança dos de Angola ou Guiné-Bissau, no entanto, o número médio de diferenças

entre pares de haplótipos é, comparativamente, muito superior. Este padrão entende-se

dada a história de povoamento dos dois arquipélagos. Em ambos, pouco depois da

descoberta quinhentista, foi iniciado um processo de povoamento que envolveria intensa

mistura populacional.

Em Cabo Verde, a miscigenação entre europeus e africanos, e em particular a

que decorreu do cruzamento de homens europeus com mulheres africanas, atingiria

Page 105: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

75

níveis muito significativos, explicando-se assim que em média dois haplótipos

caboverdianos sejam muito diferentes entre si. Em São Tomé e Príncipe, a contribuição

europeia foi bastante menor mas, em contrapartida, o aporte africano foi originário de

áreas de recrutamento mais dispersas sendo, pois, de admitir maior heterogeneidade no

pool de linhagens africanas e, daí, o elevado valor médio observado quanto a diferenças

entre haplótipos sãotomenses.

A mismatch distribution encontrada em Moçambique é a mais difícil de explicar.

Um simples efeito amostral ou a existência de marcada subestruturação populacional

poderiam traduzir-se em distribuições como a registada. No entanto, o desconhecimento

da composição étnica da amostra moçambicana não permite mais avanços para além das

hipóteses adiantadas.

3.1.5 - Diferenciação genética entre populações

Na Tabela 3.6, apresentam-se as estimativas de distâncias genéticas entre os três grupos

sãotomenses e outras populações usadas como referência. São distâncias avaliadas por

valores de RSTs corrigidos e calculados com base na soma de quadrados de diferenças de

tamanhos.

Tabela 3.6 - Valores de RST entre pares de populações.

População Angolares Forros Tongas Angola Cabo- Verde

Guiné-Bissau Moçambique Portugal

Centro Forros 0.916* Tongas 0.853* -0.067 Angola 0.488* 0.153 0.179 Cabo Verde 2.903** 0.924** 0.734** 2.164** Guiné-Bissau 1.410** 0.539* 0.834** 0.137 3.479** Moçambique 1.202** -0.013 0.038 0.212 0.749** 0.811** Portugal Centro 8.243** 4.489** 4.484** 7.233** 1.332** 8.928** 4.539** Portugal Norte 10.048** 6.090** 5.925** 9.052** 2.079** 11.076** 5.889** 0.005

* P < 0.05 ** P < 0.01

Se se excluir Cabo Verde, a distância genética média entre pares de populações

africanas é de 0.524. Tomando este valor como referência para o nível médio de

diferenciação entre populações africanas, podem considerar-se relativamente elevados

os valores de distância registados entre Angolares/Forros (0.916) ou Angolares/Tongas

(0.853), que atingem mesmo níveis de significância estatística (P=0.036 e P=0.018,

Page 106: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

76

respectivamente). Pelo contrário, não há sinais de diferenciação genética entre Forros e

Tongas. Por conseguinte, entre os grupos sãotomenses, os Angolares distinguem-se pelo

nível já significativo de diferenciação genética. De igual forma, todas as distâncias

genéticas entre Angolares e as outras populações com que foram confrontados,

incluindo todas as africanas, eram estatisticamente significativas, o que também

contrasta com os resultados das comparações envolvendo Forros ou Tongas. Tal como

os Angolares, os outros dois grupos sãotomenses diferenciam-se claramente das

populações portuguesas, mas relativamente às populações africanas não manifestam

diferenças significativas com Angola ou Moçambique.

No que respeita às amostras do Norte e Centro de Portugal, sobressai a grande

homogeneidade genética ao nível dos STRs do Y, o que está de acordo com o que tem

sido reportado para as regiões, e fazendo a média das distâncias obtidas nos pares de

comparações envolvendo as duas amostras portuguesas e as africanas, chegou-se ao

valor de 7.166. Para este cálculo, também não foi considerada a amostra de Cabo Verde,

dadas as suas peculiaridades genéticas. De facto, a distância média de Cabo Verde

relativamente às restantes populações do continente africano é de 1.825, e relativamente

às duas amostras portuguesas é de 1.705. São valores indicativos de que, se se atender à

variação de STRs do cromossoma Y, o arquipélago está geneticamente equidistante,

grosso modo, de populações africanas e europeias. A par de outros, este resultado

constitui um claro testemunho genético da intensa miscigenação entre europeus e

africanos de que é fruto a população actual de Cabo Verde.

Na Figura 3.3, representam-se graficamente as relações genéticas, inferidas pela

análise de STRs do Y, entre as populações comparadas. Trata-se de uma árvore

filogenética construída por neighbour-joining, que se obteve após 1000 iterações de

bootstrap.

A topologia da árvore discrimina inequivocamente o grupo de populações

africanas do grupo que contém as duas populações portuguesas. A posição intermédia

que Cabo Verde ocupa, reflecte bem a ancestralidade mista dos caboverdianos, sendo

até impossível distinguir, com este tipo de abordagem, qual dos contributos, europeu ou

africano, teve mais impacto no gene pool masculino do arquipélago.

Finalmente é de destacar, no grupo africano, o pequeno tamanho dos ramos,

sugerindo um nível apenas moderado de divergência entre populações, e o facto de

Angola, Guiné-Bissau e Angolares estarem posicionados na extremidade da árvore.

Page 107: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

77

Figura 3.3 - Árvore neighbour-joining dos três grupos populacionais sãotomenses e outras populações africanas e portuguesas.

Esta posição parece resultar dos níveis de diversidade relativamente reduzidos que

caracterizam as três populações, já que são aquelas que apresentam os valores mais

baixos em diversos parâmetros, nomeadamente, número médio de diferenças entre pares

de haplótipos, diversidade haplotípica e diversidade génica.

3.1.6 - Estruturação genética em São Tomé e Príncipe inferida com STRs do Y

Com o objectivo de avaliar pormenorizadamente a estrutura populacional de São Tomé

e Príncipe, aplicou-se AMOVA de quatro modos diferentes:

- tratando Angolares, Tongas e Forros como um único grupo; ou

- confrontando cada grupo populacional com o grupo que continha os dois restantes,

o que permite 3 possibilidades, a saber:

- Angolares versus Forros + Tongas

- Forros versus Angolares + Tongas

- Tongas versus Angolares + Forros.

Os resultados desta análise estão apresentados nas Tabela 3.7 e da sua

interpretação decorre, como seria de esperar, que a percentagem de variação atribuível a

Angolares Angola

Tongas Forros

Guiné - Bissau

Moçambique

Cabo Verde

Portugal Centro

Portugal Norte

Page 108: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

78

diferenças no seio das populações é extremamente elevada, suplantando de longe a que

se pode atribuir as diferenças entre grupos ou entre populações dentro de grupos.

Entre grupos, a percentagem de variação assume valores negativos, excepto

quando se separa Angolares de não-Angolares (Tongas + Forros). Neste caso, a

percentagem de variação devida a diferenças entre populações é a mais baixa observada

(-1.02%) mas, em contrapartida, a fracção devida a diferenças entre grupos (3.24%)

atinge nível de significância estatística.

Com o objectivo de avaliar se para este resultado não estaria a contribuir, em

excesso e de forma aleatória, algum STR em particular, fixámos a hierarquia Angolares

versus Tongas + Forros, e efectuámos uma espécie de jacknifing correndo

repetidamente AMOVA, mas excluindo de cada vez um ou mais STRs. O valor relativo

à percentagem de variação entre grupos (FCT) só deixou de ser estatisticamente

significativo quando os STRs DYS389I, DYS390 e DYS391 foram simultaneamente

excluídos da análise, o que nos levou a concluir que embora aqueles três STRs sejam os

que concorrem com contribuições parciais mais importantes, apenas o seu efeito

combinado explica a diferenciação genética observada entre Angolares e os outros dois

grupos sãotomenses.

Assim, os resultados de AMOVA indicam que ao nível das linhagens definidas

por STRs do Y, existe subestruturação populacional em São Tomé e Príncipe, que é

determinada pelo padrão de diversidade registado nos Angolares.

Tabela 3.7 - Percentagem de variação produzida por AMOVA com diferentes níveis de hierarquização dos grupos populacionais sãotomenses.

Variação (%) Comparação To vr An+Fo Fo vr An+To An vr To+Fo An+To+Fo

Dentro das populações 99.98 99.84 97.78 99.36 Entre populações 2.67 1.93 -1.02 0.64

Entre grupos -2.65 -1.77 3.24* -

An: Angolares; Fo: Forros; To: Tongas. *Nível de significância: 5%.

Page 109: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

79

3.1.7 - Considerações globais sobre o estudo de STRs do Y em São Tomé e

Príncipe

Expostos e parcialmente discutidos os resultados obtidos em São Tomé e Príncipe com

STRs do cromossoma Y, procuraremos agora analisá-los globalmente e enquadrá-los no

contexto de diversidade do continente africano e depois, no da micro-escala geográfica

do arquipélago em estudo.

Pelas características do padrão de distribuição de frequências dos STRs DYS19,

DYS389I, DYS389II, DYS390, DYS391, DYS392 e DYS393, observado em São Tomé e

Príncipe, pode concluir-se que o arquipélago se caracteriza por um fundo substancial de

linhagens africanas mas com sinais que evidenciam que o aporte europeu não foi, de

todo, discipiente.

As informações históricas sobre o povoamento de São Tomé e Príncipe apontam

para uma considerável dispersão geográfica quanto à origem das linhagens africanas

que entraram no arquipélago. Seria de admitir, portanto, que um fundo dominante e

diversificado de linhagens africanas acrescido de fracção razoável de linhagens

europeias, se traduzisse num inequívoco excesso de diversidade genética. Ora, ao nível

dos STRs do Y, a maioria dos índices de diversidade registados em São Tomé,

enquadra-se, mas não ultrapassa, a gama dos valores mais elevados entre as populações

comparadas, gama onde se incluem populações europeias ou africanas.

Assim, estes resultados vão ao encontro dos obtidos por Pritchard et al. (1999),

que, ao analisar os níveis de diversidade de STRs do Y, constatam que populações

africanas não se caracterizam por um excesso marcado de variabilidade

comparativamente a populações de outros continentes, ao contrário do que se verifica

em outro tipo de marcadores genéticos.

Como o esquema amostral usado por Pritchard et al. era muito diferente do

nosso, e no sentido de avaliar melhor a consistência das deduções, calcularam-se

diversos índices de diversidade para uma amostra que designámos de “África” em que

amalgamámos os dados de São Tomé, Angola, Cabo Verde, Guiné-Bissau e

Moçambique. Os resultados constavam já da Tabela 3.5, tal como os obtidos por

Pritchard et al. e ainda os que se calcularam com base numa amostra mista de europeus

estudada por González-Neira et al. (2000).

Page 110: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

80

Comparando as duas amostras de África, a de Pritchard et al. apresenta índices

de diversidade ligeiramente mais elevados que a nossa, o que se entende dado tratar-se

de uma amostragem populacional ainda mais heterogénea, mas os valores, quer de

diversidade haplotípica, diversidade génica ou variância no número de repetições, são

de idêntica ordem de grandeza.

Se compararmos os mesmos índices com os registados nas amostras de

europeus, a única diferença clara entre europeus e africanos reside na variância média

do número de repetições, que tende a ser bastante mais elevada em africanos. Para

outros índices, nomeadamente diversidade haplotípica e génica, não há diferenças

nítidas entre populações europeias e africanas, que são igualmente caracterizadas por

grande diversidade ao nível de STRs do Y, à semelhança do que acontece na maioria

das populações humanas.

O padrão de diversidade de STRs do Y à escala mundial, compreende-se dada a

dinâmica evolutiva deste tipo de marcadores. Uma vez que associam elevada taxa de

mutação - responsável por convergência frequente do tamanho de novos alelos - a baixo

efectivo populacional, tendem a reter menos “memória” de acontecimentos do passado

evolutivo (Perez-Lezaun et al., 1999) que outro tipo de marcadores de transmissão

uniparental, como SNPs do Y ou mtDNA.

É pelos mesmos motivos que se explica a ausência de marcada subestruturação à

escala macrogeográfica para STRs do cromossoma Y (de Knijff et al., 1997; Kayser et

al., 2001b) e, consequentemente, a obtenção de valores de GSTs baixos a nível inter-

continental (África, Ásia, Europa) com esses marcadores, em oposição ao que acontece,

por exemplo, com SNPs do Y que produzem GSTs equivalentes elevados, traduzindo

uma grande especificidade geográfica (Hammer et al., 2003).

A reduzida subestruturação geográfica de STRs do Y, permite entender que

alguns haplótipos agora detectados em São Tomé e Príncipe tivessem sido igualmente

encontrados simultaneamente em populações europeias e africanas e em proporções que

não possibilitaram inferir com segurança a possível origem geográfica.

Foi por isso, e começando já a debruçarmo-nos sobre São Tomé Príncipe, que

optámos por não usar resultados de STRs do Y para tentar quantificar o grau de mistura

entre europeus e africanos, não obstante termos assumido como provável ou até muito

provável a origem europeia de muitos dos haplótipos detectados.

Page 111: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

81

Reservaremos esse exercício para haplogrupos definidos por marcadores

bialélicos que, tendo em vista essa finalidade, são muito mais informativos, conforme se

apresentará no ponto 3.2.

Não é de estranhar a presença de linhagens masculinas europeias no arquipélago.

Durante o período inicial de colonização, a miscigenação foi bastante incentivada

funcionando como uma estratégia de povoamento para promover o aumento rápido da

população. Por outro lado, várias fontes referem que os mulatos, que chegaram a

constituir uma fracção considerável da população, detinham um estatuto social

privilegiado e a par do grupo europeu dominante, sempre minoritário, desempenharam

um papel importante durante a primeira fase de colonização, em que o cultivo de cana-

de-açúcar e o “armazenamento” de escravos para o tráfico transcontinental, eram as

principais actividades das ilhas.

Porque foi sempre muito reduzido o número de mulheres europeias em São

Tomé e, sobretudo, devido ao forte condicionalismo cultural, a miscigenação foi quase

exclusivamente fruto do cruzamento entre homens europeus com mulheres africanas.

Este enviezamento sexual do padrão de cruzamentos, ficou bem registado no gene pool

de São Tomé e Príncipe, como se entenderá quando apresentarmos os resultados obtidos

com mtDNA.

Passando à análise dos grupos populacionais de São Tomé e Príncipe,

começaremos por destacar a semelhança entre Forros e Tongas quanto aos padrões de

variação nos sete STRs estudados. A ausência de sinais de heterogeneidade genética

entre os dois grupos indica que a percepção usual que continua a distinguir Forros e

Tongas, se baseia essencialmente numa construção social cujas raízes se prendem na

história recente do arquipélago.

A designação Forro atribui-se aos sãotomenses que se considera serem

descendentes dos “filhos da terra”, os antigos escravos libertos ao longo de séculos, ou

africanos desde sempre livres, que tiveram um papel fundamental no povoamento e nas

actividades de desenvolvimento das ilhas (Tenreiro, 1961; Henrique, 2000). Há poucas

fontes sobre a origem geográfica dos africanos que foram levados para São Tomé e

Príncipe. Mas é de admitir que os pontos de recrutamento se tenham deslocado

progressivamente para Sul, à medida que se expandiam as regiões que os portugueses

exploravam nas actividades comerciais. A bacia do Rio Níger e a região do Benin, terão

sido os primeiros locais de fornecimento de escravos para São Tomé, mas desde o início

Page 112: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

82

do século XVI até ao XVII, o Reino do Congo logo seguido de Angola, tornar-se-iam os

principais mercados a que os portugueses recorriam para o abastecimento negreiro. A

partir do século XVII, a influência de São Tomé e Príncipe no comércio de escravos

sofreu fortes restrições, só lhe sendo permitido o abastecimento no Golfo da Guiné, com

o Gabão como limite meridional. Assim, presume-se que os africanos que foram

chegando a São Tomé e Príncipe, fossem oriundos de uma faixa do litoral atlântico

africano que pode balizar-se entre Elmina, no actual Gana, e Angola.

A idealização de Forro como entidade social, começa apenas a moldar-se no

século XIX, altura em que principiaram a entrar no arquipélago vagas maciças de

trabalhadores contratados para as recém introduzidas culturas do cacau e do café. Já

tinha sido abolido o tráfico de escravos, e São Tomé vivia o rescaldo de dois séculos de

estagnação económica após o auge e declínio do período açucareiro. As novas culturas

iriam ter um desenvolvimento extraordinário, exigindo um esforço de mão-de-obra que

era impossível suprir entre os naturais do arquipélago. Recorreu-se então à contratação

de mão-de-obra exterior e em levas sucessivas entraram em São Tomé milhares e

milhares de indivíduos, recrutados essencialmente de Cabo Verde, Angola e

Moçambique. Findos os contratos de trabalho, muitos dos repatriamentos previstos

acabam por não se cumprir, e os serviçais que se fixam no arquipélago, e que

representam um estrato social e economicamente desfavorecido, começam a ser tratados

por Tongas, designação que os seus descendentes herdariam.

Assim, pode considerar-se que, num certo sentido, as linhagens africanas

actualmente presentes em Forros ou Tongas representam duas sub-amostragens do stock

de linhagens paternas do continente africano, efectuadas com bastante desfasamento

temporal. Ambas as sub-amostragens incorporaram conjuntos diversificados de

linhagens, mas pelo facto de em África haver pouca subestruturação quanto a STRs do

Y, compreende-se que Forros e Tongas não manifestem sinais de heterogeneidade, nem

entre si, nem relativamente a outras populações nomeadamente de África sub-equatorial

como Angola ou Moçambique.

Em suma, a hierarquização social que persiste em São Tomé e Príncipe quanto a

Forros e Tongas, não têm nenhum paralelo genético ao nível do pool de linhagens

masculinas definidas por STRs, relativamente ao qual os dois grupos compartilham

essencialmente o mesmo perfil.

Page 113: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

83

Pelo contrário, quando se avaliam as afinidades populacionais com a mesma

bateria de marcadores, os Angolares manifestam traços de alguma microdiferenciação

relativamente não só aos dois outros grupos sãotomenses mas também a qualquer das

restantes populações africanas comparadas. A diferenciação decorre essencialmente de

uma redução de diversidade que se observa no grupo. Foi nos Angolares que se

registaram os níveis mais baixos de variabilidade em STRs do Y quanto a diversos

parâmetros, como diversidade genética, diversidade haplotípica ou número médio de

diferenças entre pares de haplótipos.

Esta redução de diversidade, pode ser imputada a efeitos de deriva génica

induzidos pelo pequeno tamanho do efectivo populacional angolar, endogamia, efeito de

fundador, ou uma combinação de todos os factores. No fundo, são os sinais esperados

para qualquer grupo populacional pequeno e fechado, que manteve algum isolamento e

escassos contactos com grupos populacionais circunvizinhos.

O padrão de diversidade registado entre os Angolares é consistente com os

dados etnohistóricos sobre este grupo populacional. Como se referiu na Introdução, a

origem dos Angolares é uma questão que ainda permanece em aberto e sobre a qual

recapitularemos as duas hipóteses que têm merecido mais atenção. Uma delas poderá

representar o registo de uma lenda antiga que efabula os Angolares como os

descendentes de escravos sobreviventes de um naufrágio que terá ocorrido ainda

durante o Século XVI. Os náufragos ter-se-iam escondido na região mais inacessível da

ilha de São Tomé, onde fundaram um núcleo populacional que conseguiu escapar ao

controlo colonial. A credibilidade desta versão está fortemente comprometida pela

ausência, quer nos arquivos documentais da época quer nos posteriores, de qualquer

referência oficial ao suposto naufrágio. Pelo contrário, desde muito cedo que há relatos

de fugas de escravos dos engenhos de açúcar que se refugiavam nas zonas mais

recônditas do sudeste da ilha de São Tomé. É muito provável que seja nestes foragidos,

cujo número ia progressivamente aumentando, que esteja a origem duma comunidade a

que mais tarde se passou a designar de Angolares. Quando atingiram um nível de

organização mínimo, desencadeavam ataques ás plantações, instigando rebeliões e

contribuindo para criar um clima de instabilidade que as autoridades da ilha não

conseguiram dominar. A insubordinação e resistência dos Angolares tornaram-se

temidas e, face à incapacidade do regime colonial para os desintegrar, a comunidade

Page 114: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

84

foi-se consolidando mantendo-se relativamente isolada dos outros habitantes de São

Tomé.

Foi esse isolamento que permitiu que entre os Angolares se estabelecesse uma

identidade de grupo que, ainda hoje, apesar de viverem dispersos por comunidades

radicadas no litoral de São Tomé e do Príncipe de estarem razoavelmente integrados no

tecido social e económico da ilha, ainda está patente nas tradições culturais, nas

actividades a que preferencialmente se dedicam, e até na própria língua. Terá sido

certamente a história marcada por algum isolamento de outros sãotomenses, que

resultou na redução de diversidade no gene pool definido por STRs dos Y dos

Angolares, e que de algum modo os diferencia geneticamente de Forros e Tongas.

3.2 - MARCADORES BIALÉLICOS

3.2.1 - Perfil de haplogrupos e comparação com outras populações

Com os 14 marcadores de tipo bialélico examinados, nomeadamente YAP, SRY8299,

92R7, SRY1532, SRY2627, Tat, sY81, M9, LLy22g, 12f2, M109, M112, M150 e

M168 seria possível identificar, em princípio, 16 haplogrupos distintos. Destes,

encontraram-se 7 em São Tomé e Príncipe, conforme está apresentado na Figura 3.4

onde também consta a distribuição de frequências em Angolares, Forros, Tongas e na

amostra global do arquipélago.

Quatro dos sete haplótipos detectados, E3a, B2a1, B2b e B*(xB2a,b), são

considerados altamente específicos de África subsariana e no conjunto representam a

fracção maioritária das linhagens presentes em Angolares, Forros, Tongas e,

consequentemente, na amostra total analisada.

Neste conjunto, sobressai o haplogrupo E3a. Representa 69.1% dos

cromossomas Y sãotomenses e, discriminando por grupo populacional, atinge o valor

mais elevado entre os Angolares, onde se encontra em 78.6% dos indivíduos, e o mais

baixo entre os Tongas onde ocorre com frequência de 59.1%.

E3a, é definido pelo alelo derivado em sY81, num fundo genético que inclui as

mutações derivadas em SRY-1532, M168, YAP e SRY-8299. O haplogrupo apresenta

uma localização geográfica muito restrita pois está praticamente confinado a África,

Page 115: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

85

sendo especialmente frequente em populações subsarianas, sobretudo da região

ocidental, onde é de longe o haplogrupo mais comum atingindo frequências superiores a

65% (Cruciani et al., 2002; Scozzari et al., 1999, Gonçalves et al., 2003).

Figura 3.4 - Distribuições de frequências de haplogrupos definidos pelos marcadores biallicos do Y observadas em Angolares, Forros, Tongas e na amostra total de São Tomé e Príncipe.

Em populações do Burkina Faso ou do Sul dos Camarões, E3a chega mesmo aos 90%

(Cruciani et al., 2002). O padrão actual de distribuição geográfica de E3a, sugere ter

resultado de uma expansão populacional relativamente recente, e tem-se associado a

dispersão do haplogrupo à difusão da agricultura por povos de língua Bantu (Underhill

et al., 2001), num movimento com foco na região Centro-Ocidental e direccionado para

o Sul do continente africano via dois corredores, um pela faixa ocidental e outro pela

oriental.

Por conseguinte, os valores de E3a agora detectados em São Tomé e Príncipe

são os comuns em populações da região geográfica, em que o arquipélago se localiza.

Os três outros haplogrupos tipicamente subsarianos detectados no arquipélago, B2a1,

B2b e B*(xB2a,b), pertencem a um dos grupos - B - mais divergentes, e portanto mais

P*(x

R1a

,R1b

3f)

E3a

E*(x

E3a)

CR

*(xD

E,J,

K)

B2b

B2a

1

B*(

xB2a

,b)

4148109616139São Tomé

1144426444Tongas

2426739Forros

32244556Angolares

N

R1b3f R1a N3 N*(xN3)

K*(xN,P)

J

B2a

*(xB

2a1)

Y*(xBR)

DP*

(xR

1a,R

1b3f

)

E3a

E*(x

E3a)

CR

*(xD

E,J,

K)

B2b

B2a

1

B*(

xB2a

,b)

4148109616139São Tomé

1144426444Tongas

2426739Forros

32244556Angolares

N

R1b3f R1a N3 N*(xN3)

K*(xN,P)

J

B2a

*(xB

2a1)

Y*(xBR)

D

Page 116: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

86

antigos, na árvore filogenética de marcadores bialélicos do cromossoma Y. Em conjunto

representam 6.5% dos cromossomas Y sãotomenses, estando ausentes nos Forros,

presentes em 5.4% dos Angolares e chegando aos 13.7% nos Tongas.

A distribuição de haplogrupos B em África, permanece ainda num estado

bastante incipiente de caracterização, mas parece não obedecer a um padrão de

contornos muito claros.

B*(xB2a,b), é um haplogrupo muito raro e até agora apenas foi encontrado em

poucas populações subsarianas, nomeadamente entre os Bamileke, do Sul dos

Camarões, os Mossi, de Burkina Faso (Cruciani et al., 2002) e num indivíduo de uma

amostra de 303 moçambicanos (Sánchez-Diz, 2003).

Comparativamente, os subgrupos B2a ou B2b são bastante mais comuns e

disseminados em África, e existem, quanto aos dois, diferenças marcadas de frequência

entre, por um lado, os Khoisan (Khwe e San) e povos das florestas da África Central

(i.e., Biaka, Mbuti e Lisongo), e por outro, as restantes populações africanas onde foram

detectados. Entre os primeiros (Khoisan e povos das florestas) são predominantes

haplogrupos que compartilham o alelo derivado em M112 e que define o subgrupo B2b

(Cruciani et al., 2002). A frequência de B2b na maioria destes grupos populacionais

ronda os 20 - 30% e o valor mais elevado até hoje encontrado foi entre os Hadzabe, um

grupo de caçadores-recolectores do Norte-Centro da Tanzânia (Knight et al., 2003). Em

oposição, nas outras populações africanas estudadas, B2b está ausente e os

cromossomas do grupo B apresentam maioritariamente a mutação M150, que define o

subgrupo B2a e que ocorre, em geral, com frequências muito mais moderadas que B2b.

Dentro do subgrupo B2a, a presença do alelo derivado em M109 discrimina o

haplogrupo B2a1 que constitui, dentro do subgrupo, o haplogrupo mais comum tendo

sido encontrado em diversos grupos populacionais dos Camarões (Cruciani et al., 2002),

do leste africano e em populações Bantu do Sul do continente (Underhill et al., 2000).

Em populações do Senegal, da Guiné-Bissau e de Cabo Verde, não foram

encontrados quaisquer cromossomas do grupo B (Semino et al., 2002; Gonçalves et al.,

2003).

É interessante constatar que entre os Angolares, 5.4% dos cromossomas sejam

de tipo B*(xB2a,b). Constitui a frequência mais elevada até agora registada para este

haplogrupo, o que pode ser consequência de efeitos de deriva no seio deste grupo

populacional, representando assim mais uma marca genética de um certo isolamento

Page 117: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

87

que caracterizou a história dos Angolares. Entre os Bamileke, do Sul dos Camarões, o

haplogrupo ocorre com frequência de 4%, e mais para Sul, numa amostra da população

de Cabinda, não foi detectada a sua ocorrência (Leonor Gusmão/Sandra Beleza,

comunicação pessoal). Assim este resultado, pode indicar que as regiões que

correspondem actualmente aos Camarões e sua vizinhança, podem ter constituído locais

importantes de recrutamento de escravos que participaram no povoamento de São Tomé

e Príncipe.

É ainda de sublinhar a elevada frequência (13.7%) com que haplogrupos de tipo

B aparecem entre os Tongas. Como já se referiu, são considerados Tongas os

descendentes dos serviçais que a partir do século XIX foram contratados para trabalhar

nas roças do cacau e do café. Angola, Moçambique e Cabo Verde, foram os grandes

fornecedores destes imigrantes forçados. Dado que em Cabo Verde não há

cromossomas do grupo B (Gonçalves et al., 2003), a sua presença actual em São Tomé

e Príncipe só pode ter sido mediada por Angolanos ou Moçambicanos. Em

Moçambique, a frequência de B*(xB2a,b) e B2a* estimou-se em 0.33% para cada, de

B2a1 em 9.24% e de B2b em 4.62% (Sánchez-Diz, 2003), o que totaliza 14.52% de

haplogrupos tipo B. Embora não haja, de momento, dados sobre a distribuição do grupo

B em Angola, é de admitir que também possa estar aí relativamente bem representado.

Para além de haplogrupos de tipo B, que se consideram altamente específicos de

regiões subsarianas, foram ainda detectados em São Tomé e Príncipe representantes dos

grupos P*(xR1a,R1b3f), CR*(xDE,J,K) e E*(xE3a). O primeiro, P*(xR1a,R1b3f), que

na amostra global de São Tomé se encontrou em 11.5% dos indivíduos, é um

haplogrupo muito vulgar na Europa. As frequências mais elevadas registam-se na

Europa Ocidental (na Irlanda atinge mesmo os 98.5%) e observa-se um gradiente

decrescente de frequência em direcção ao Oriente, havendo fortes indicações de que o

haplogrupo possa ser representativo do gene pool europeu pré-Neolítico (Semino et al.,

1996; Rosser et al., 2000).

O segundo, CR*(xDE,J,K), é um grupo heterogéneo que contém alguns

haplogrupos (C, F*, G, H e I) com relações filogenéticas pouco estreitas mas que se

caracterizam por, em geral, estarem ausentes do continente africano. Inclui tipos de

haplogrupos que estão praticamente confinados à Europa (F*, G, I), a par de outros,

como os do grupo C, muito comuns e disseminados na Ásia mas virtualmente ausentes

da Europa Ocidental. Assim, o padrão de distribuição geográfica de CR*(xDE,J,K) não

Page 118: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

88

passa de uma amálgama dos individualmente apresentados pelos seus constituintes e

que, em conjunto, fazem com que CR*(xDE,J,K) seja especialmente frequente e

disperso na Ásia, e na Europa se encontre apenas com frequências moderadas ou baixas,

sendo o último o caso da Península Ibérica.

Atendendo à filogeografia de P*(xR1a,R1b3f) e CR*(xDE,J,K), a sua presença

na população actual de São Tomé e Príncipe só pode ter sido introduzida por indivíduos

masculinos de origem europeia, o que nos permite estimar o valor mínimo do

componente genético europeu em São Tomé e Príncipe em 17.3%, que representa a

soma da frequência com que ocorrem P*(xR1a,R1b3f) e CR*(xDE,J,K).

Heterogéneo, incluindo no padrão de distribuição geográfica, é também o último

grupo de haplogrupos detectado em São Tomé - E*(xE3a). Em termos globais,

encontra-se espalhado por toda a África, apresentando frequências muito elevadas em

populações do Norte do continente (superior a 65% nos Berberes), Bosch et al., 2001.

Também aparece no Médio Oriente e Europa onde as frequências tendem a diminuir no

sentido Sul-Norte (Rosser et al., 2000). Na faixa ocidental da Península Ibérica detecta-

se um claro gradiente decrescente desde o Sul de Portugal (24.5%) até ao Norte na

Galiza (9.6%), Pereira et al., 2000c. Contudo, o grupo contém tipos de sequências com

padrões de distribuição geográfica muito distintos, nomeadamente E1, E2 e E3b. Os

dois primeiros, aparecem essencialmente em África subsariana mas com

representatividade muito diferente de população para população (Cruciani et al., 2002).

E3b2(xE3b2a,b) é o grupo característico do Norte de África. Outros haplogrupos de tipo

E3b observam-se no leste africano e alguns estão até bem representados entre os

Khoisan (Semino et al., 2002, Cruciani et al., 2002).

Face a esta diversidade, é difícil inferir a origem geográfica dos cromossomas

E*(xE3a) de São Tomé e Príncipe sem recorrer a uma caracterização molecular mais

fina destes haplogrupos e sem dispor de dados equivalentes relativos a populações

africanas que pudessem ter contribuído para o povoamento do arquipélago. Porém, é de

admitir que os portugueses tenham sido um dos veículos de introdução, já que em

Portugal E*(xE3a) ocorre com uma frequência relativamente elevada.

No sentido de obter uma aproximação grosseira à proporção de cromossomas

E*(xE3a) sãotomenses de origem europeia, recorremos à extrapolação apresentada em

Pereira et al., 2002: se 17.3% de cromossomas P*(xR1a, R1b3f) + CR*(xDE,J,K)

correspondem a 22.76% de componente português, já que em Portugal os dois grupos

Page 119: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

89

totalizam 76% (0.173/0.760=0.2276), é provável que tivesse entrado no arquipélago

proporção equivalente de linhagens E*(xE3a); dado que ocorrem com frequência de

0.135 em Portugal (Pereira et al., 2002) espera-se que tenha entrado no arquipélago

cerca de 3.1% deste tipo de sequências. Adicionando este valor à frequência dos dois

haplogrupos europeus, chega-se ao valor de 20.7%, que representa a estimativa da

fracção de linhagens masculinas de origem europeia actualmente existentes em São

Tomé e Príncipe. A soma da frequência de cromossomas E3a e do grupo B é de 77.5%,

que corresponderá à proporção de equivalentes de origem subsariana. Assim, restam 1 -

(0.207+0.775) = 0.018, ou seja 1.8% de sequências que não foram alocadas no

componente europeu ou subsariano. Iterou-se a extrapolação para Angolares, Forros e

Tongas e os resultados das estimativas obtidas da proporção de mistura entre europeus e

africanos em cada grupo bem como na amostra total de São Tomé apresentam-se na

Figura 3.5.

Figura 3.5 - Perfil de haplogrupos em Angolares, Tongas, Forros e na amostra total de São Tomé e Príncipe e estimativas de componentes europeu (direita superior dos círculos) e subsariano (esquerda inferior dos círculos) nas quatro amostras populacionais. O complementar à soma dos valores apresentados, corresponde à frequência de sequências que não se alocaram nos componentes europeu ou subsariano.

P*(xR1a,R1b3f)CR*(xDE,J,K)E*(xE3a)E3aB2a1B2bB*(xB2a,b)

14.7% 27.2% 21.4%

20.4%

São Tomé e Príncipe

83.9% 66.7% 72.7%

75.5%

Angolares Forros Tongas

P*(xR1a,R1b3f)CR*(xDE,J,K)E*(xE3a)E3aB2a1B2bB*(xB2a,b)

P*(xR1a,R1b3f)CR*(xDE,J,K)E*(xE3a)E3aB2a1B2bB*(xB2a,b)

14.7% 27.2% 21.4%

20.4%

São Tomé e Príncipe

83.9% 66.7% 72.7%

75.5%

Angolares Forros Tongas

Page 120: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

90

Os Angolares são os que apresentam menor proporção - 14.7% - de mistura com

europeus, distinguindo-se também quanto a este aspecto dos Tongas e Forros. Mais um

sinal do isolamento relativo que caracterizou a história inicial deste grupo e que terá

proporcionado menos contactos com europeus. No entanto, o valor obtido é por si

suficientemente elevado, e mesmo admitindo que os cromossomas europeus entre os

Angolares resultem essencialmente de ligações com outros sãotomenses já

miscigenados, o resultado é indiciador das fortes interacções dos Angolares com outros

habitantes do arquipélago, ainda que estabelecidas numa fase posterior àquela do

isolamento mais cerrado durante a qual se gerou a identidade de grupo.

Nos Forros, o componente europeu é quase o dobro - 27.2% -, e nos Tongas

apenas um pouco mais baixo - 21.4%. Cremos que o valor detectado nos Forros é a

melhor aproximação ao grau de miscigenação que ocorreu no arquipélago. São

considerados Forros todos os naturais do arquipélago (exceptuando os Angolares) que

não sejam descendentes das vagas mais recentes de imigrantes que entraram em São

Tomé e Príncipe oriundos de Cabo Verde, Angola e Moçambique. Por conseguinte,

reflectirão melhor a história da mistura populacional entre europeus e africanos que

São Tomé e Príncipe registou. Até porque miscigenação recente entre Tongas e

Portugueses deve ter sido insignificante já que os serviçais que entraram em São Tomé

como contratados para os trabalhos nas roças eram essencialmente do sexo masculino

(Nascimento, 2002). De facto, a quota de mulheres moçambicanas e angolanas que

entrou nessa vaga rondaria os 7 - 10% e 4 - 6%, respectivamente, e embora o ratio de

sexos para os caboverdianos se aproximasse mais dos 50%, no global o número de

mulheres nas plantações era francamente minoritário comparativamente ao de homens

(Carreira, 1982).

Ora o processo de miscigenação caracterizou-se sempre por um enorme

enviezamento no padrão de sexos, sendo muito vulgar o cruzamento entre homens

europeus e mulheres africanas e apenas esporádico o recíproco. O número de mulheres

que chegou a São Tomé na vaga de serviçais foi muito reduzido, sendo pois pouco

provável que a miscigenação ocorrida nesta fase tivesse tido impacto relevante no gene

pool dos Tongas.

O componente europeu que se detecta neste grupo, foi essencialmente o mediado

pelos trabalhadores contratados de origem cabo-verdiana, dado que em Cabo Verde a

miscigenação foi muito intensa como atesta a presença de 53.5% de linhagens

Page 121: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

91

masculinas de origem não-subsariana no arquipélago (Gonçalves et al., 2003). A par de

caboverdianos, também entraram massivamente em São Tomé e Príncipe angolanos e

moçambicanos, mas com eles a entrada de cromossomas europeus deve ter sido

reduzida, já que em Moçambique a sua frequência é muito baixa (∼7%, segundo Pereira

et al., 2002, com base numa amostra de 103 moçambicanos, ou 1.65%, segundo

Sánchez-Diz, 2003, num estudo que incluiu 303 indivíduos), e em Angola é de prever

um cenário semelhante.

No sentido de enquadrar o padrão de haplogrupos observado em São Tomé e

Príncipe num contexto de diversidade geograficamente mais amplo, efectuou-se uma

análise de componentes principais com base nas frequências agora registadas e as

reportadas para outros grupos populacionais. Os dados utilizados apresentam-se no

Apêndice 1. A projecção dos dois componentes principais, que condensam 66.7% da

variação total, está ilustrada na Figura 3.6.

Como se pode observar, definem-se nitidamente quatro grupos de populações: as

do Norte de África, as duas europeias, as dos Khoisan e um grupo mais heterogéneo que

inclui as restantes populações consideradas com excepção da de Cabo Verde.

O grupo de linhagens com mais influência na posição das amostras de Khoisan

(Ju|´hoansi e Khwe), é o de tipo A, o grupo mais antigo na árvore filogenética de

haplogrupos do Y. Apenas se encontrou com frequências relativamente elevadas em

grupos isolados de caçadores-recolectores, como é caso dos Ju|´hoansi e Khwe, e alguns

grupos populacionais da Etiópia e do Sudão, distribuição que indica tratarem-se de

linhagens muito antigas que sobreviveram a acontecimentos populacionais mais

recentes (Underhill et al., 2001; Semino et al., 2002).

Para a posição das populações norte-africanas, o mais determinante é a elevada

frequência de sequências E*(xE3a), enquanto que o grupo P é o que mais pesa no

posicionamento de Portugal e Galiza. As populações que compartilham elevada

frequência de E3a agrupam-se na parte centro/esquerda do diagrama, sobressaindo neste

conjunto Angolares, Forros e Tongas que, pela comparativamente elevada frequência de

CR*(xDE,J,K) e P, são arrastados para uma posição mais inferior. Neste conjunto,

incluem-se populações muito diversas, Biaka, Moçambique ou populações insulares ou

continentais da faixa ocidental de África. A incapacidade de resolver com mais precisão

as afinidades genéticas entre estas populações, poderá resultar de para esta análise, pela

ausência de dados disponíveis para todas as amostras, não ter sido possível lidar com

Page 122: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

92

informação molecular mais pormenorizada sobre alguns haplogrupos, nomeadamente os

contidos na classe E3a ou E*(xE3a).

Figura 3.6 - Projecção dos dois componentes principais obtidos com frequência de haplogrupos definidos por marcadores bialélicos do Y. Abreviaturas e fontes dos dados: An: Angolares (este trabalho); Fo: Forros (este trabalho); To: Tongas (este trabalho); Ar: Árabes, Marrocos (Scozzari et al., 2001); Be: Berberes, Marrocos (Scozzari et al., 2001); Bi: Biaka, Pigmeus (Underhill et al., 2000); CV: Cabo Verde (Gonçalves et al., 2003); Ga: Galiza (Brion et al., 2003); Gui: Guiné-Bissau (Gonçalves et al., 2003); Ju: Ju|´hoansi/Sekele/!Kung (Underhill et al., 2000); Kh: Khwe (Cruciani et al., 2002); Ma: Maghrebis, Marrocos (Brion et al., 2003); Mo: Moçambique (Sánchez-Diz, 2003); Po: Portugal (Sandra Beleza, comunicação pessoal); Se: Senegal (Semino et al., 2002).

Finalmente é de referir a posição destacada de Cabo Verde que fica projectada

numa posição isolada e exterior a qualquer dos 4 conjuntos populacionais mencionados,

o que denuncia a intensa mistura populacional que ocorreu neste arquipélago.

3.2.2 - Padrão de diversidade e comparação entre Angolares, Tongas e Forros Na Tabela 3.8 apresentam-se vários parâmetros de diversidade inferidos com base nos

perfis de haplogrupos do Y detectados em Angolares, Forros, Tongas e na amostra

global de São Tomé e Príncipe.

-0.3

-0.2

-0.1

0.1

0.2

0.3

-0.3 -0.2 -0.1 0.1 0.2 0.3

Ma

ArBe

Ju

Kh

CV

Ga

Po

AnFo

To

Bia

Gui

Mo

Se

Page 123: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

93

Tabela 3.8 - Parâmetros de diversidade em Angolares, Forros, Tongas e na amostra

global de São Tomé e Príncipe.

N Número de haplogrupos

diferentes (%)

Diversidade de

haplogrupos

Diversidade génica

Número médio de pares de diferenças entre haplogrupos

Angolares 56 5 (8.93) 0.376±0.080 0.098±0.068 1.375±0.860

Forros 39 4 (10.26) 0.524±0.082 0.128±0.084 1.789±1.057

Tongas 44 7 (15.91) 0.631±0.076 0.159±0.099 2.222±1.250

São Tomé e Príncipe 139 7 (5.04) 0.503±0.048 0.127±0.082 1.777±1.035

Quanto aos níveis de diversidade registados no seio de cada grupo populacional,

mais uma vez os Angolares se distinguem dos Forros ou Tongas. Os primeiros

apresentam uma nítida redução de diversidade, quer no que respeita à proporção de

haplogrupos diferentes quer nos níveis de diversidade de haplogrupos ou génica. Estes

valores, comparativamente baixos de diversidade, reflectem o facto de o perfil de

haplogrupos nos Angolares ser claramente dominado por linhagens de tipo E3a, que

representam 78.6% dos cromossomas Angolares. Reforçam-se assim os indícios de que

nos Angolares existem marcas que caracterizam grupos populacionais que são, ou foram

- como melhor se aplicará ao grupo em causa, relativamente fechados e com escassos

contactos com populações vizinhas.

Em oposição, os níveis de diversidade mais elevados encontram-se entre os

Tongas. Os sete haplogrupos distintos detectados neste estudo estão presentes no grupo,

com jogos de frequências que resultam nos valores mais elevados de diversidade de

haplogrupos ou génica. É provável que este resultado se explique pela grande dispersão

geográfica de onde foram originários os ancestrais dos Tongas. Como já se referiu,

Angola, Cabo Verde e Moçambique foram as grandes fontes de origem dos serviçais.

Assim, e de certa forma, os Tongas representam uma sub-amostragem da região

subsariana de África geograficamente bastante mais abrangente que a representada

pelos Forros, cujo recrutamento se restringiu essencialmente à faixa continental

atlântica entre os actuais Benin e Angola, compreendendo-se assim algum excesso de

diversidade dos Tongas relativamente aos Forros.

Em conformidade, é entre os Tongas que em média os haplogrupos diferem mais

entre si (número médio de diferenças entre haplótipos = 2.222±1.250) e, pelo contrário,

Page 124: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

94

entre os Angolares os haplogrupos são os que divergem menos uns dos outros

(1.375±0.860). Na Figura 3.7, estão representadas as distribuições de diferenças entre

pares de linhagens registadas nas amostras investigadas.

Mpd=1.375±0.860 Mpd=1789±1.057

Mpd=2.222±1.250 Mpd=1.777±1.035

Figura 3.7 - Distribuição de pares de diferenças e média das diferenças entre pares de haplogrupos (Mpd). Eixo dos X: número de diferenças entre haplogrupos. Eixo dos Y: frequências.

Em consonância com o seu perfil de haplogrupos, os Angolares registam a

percentagem mais elevada de haplogrupos idênticos entre si (número de diferenças = 0).

A respectiva curva de distribuição de pares de diferenças é bimodal, com picos de

frequência em 0 e 5 diferenças, distinguindo-se do que se observa nos Forros, Tongas

ou na amostra global de São Tomé e Príncipe, cujas curvas de distribuição apresentam

semelhanças manifestas pela trimodalidade com picos de frequência em 0, 3 e 5

diferenças. Nestas três amostras, o acentuado pico de frequência no último valor, resulta

de compartilharem uma razão entre sequências europeias e subsarianas muito mais

elevada do que a que se observa entre os Angolares.

Forros

0

0,2

0,4

0,6

0 1 2 3 4 5 6

Angolares

00,20,40,60,8

0 1 2 3 4 5 6

Tongas

0

0,2

0,4

0 1 2 3 4 5 6 7

São Tomé

00,20,40,6

0 1 2 3 4 5 6 7

Page 125: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

95

3.2.3 - Avaliação da diferenciação genética entre Angolares, Tongas e Forros

No sentido de avaliar o grau de diferenciação genética entre os três grupos

populacionais de São Tomé e Príncipe quanto aos haplogrupos detectados com

marcadores bialélicos do Y, calcularam-se valores de FST entre pares de populações mas

não se encontraram distâncias genéticas estatisticamente significativas. O valor de FST

entre Forros e Tongas foi de 0.008 (P=0.27), entre Forros e Angolares de 0.003

(P=0.26) e entre Tongas e Angolares de 0.032 (P=0.09).

Apesar da ausência de heterogeneidades genéticas significativas, efectuou-se a

análise de subestruturação populacional aplicando AMOVA hierarquicamente segundo

o procedimento descrito e efectuado para os STRs. Os resultados obtidos estão

sumariados na Tabela 3.9.

Tabela 3.9 - Percentagem de variação em diferentes níveis hierárquicos de agrupamentos populacionais produzido por AMOVA.

Variação (%)

Comparação To vr An+Fo Fo vr An+To An vr To+Fo An+To+Fo

Dentro das populações 97.62 99.43 98.29 98.41

Entre as populações 0.03 3.25 1.23 1.59

Entre os grupos 2.35 -2.68 0.48 -

An: Angolares; Fo: Forros; To: Tongas. Nível de significância: 5%.

Nenhum dos valores de partição de diversidade obtidos por AMOVA era

estatisticamente significativo. No entanto, os resultados produzidos com os marcadores

bialélicos podem sugerir uma certa contradição com os obtidos na análise equivalente

com STRs. De facto, o valor mais elevado de percentagem de variação entre grupos

(FCT) foi agora registado quando se considerou os Tongas separadamente dos

Angolares+Forros, enquanto que com STRs o valor mais elevado (e até estatisticamente

significativo) se detectou quando os Angolares eram separados de Forros+Tongas.

Os resultados de AMOVA obtidos com os marcadores bialélicos indicam que, a

maior diferenciação se observa quando os Tongas são confrontados com

Angolares+Forros, o que naturalmente traduz o facto da maior distância genética se ter

Page 126: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

96

encontrado entre Tongas e Angolares e a menor entre Forros e Angolares. No fundo, o

que parece estar a pesar mais neste conjunto de resultados, é a presença nos Tongas de

um leque de haplogrupos mais alargado e com maior variabilidade do que os que se

observam nos Angolares ou Forros.

Porém, o número de haplogrupos definidos por marcadores bialélicos é

muitíssimo mais restrito do que o que é possível obter com STRs (ou mtDNA, como se

apresentará no ponto 3.3) e, por isso, os primeiros são potencialmente bastante menos

informativos para detectar diferenças entre populações que compartilham fortes laços de

ancestralidade, como de resto parece evidenciar o facto de não se detectarem quaisquer

valores significativos com marcadores bialélicos, ao contrário do que se registou com

STRs.

3.2.4 - Análise conjunta de SNPs e STRs

Relativamente a uma sub-amostra dos indivíduos tipados para os marcadores bialélicos,

foi possível conjugar a informação relativa aos haplótipos definidos por STRs. Os

haplótipos (definidos pelos STRs) encontrados em diferentes haplogrupos (definidos

pelos marcadores bialélicos) encontram-se discriminados no Apêndice 2.

Efectuámos então uma análise filogenética dos haplótipos de STRs, utilizando o

algorítmo Median Joining, com ε=0 e peso=0 em DYS389I e II. Num primeiro ensaio,

utilizaram-se todos os haplótipos detectados num total de 88 indivíduos, mas não se

considerou o grupo populacional onde se encontraram. Num segundo, restringimos a

análise a haplótipos dentro do haplogrupo E3a, o único com representatividade

numérica suficiente para permitir a individualização, e incluímos a informação do grupo

populacional em que se observaram.

Os resultados apresentam-se na Figura 3.8. Na network representada na Figura

3.8A, distinguem-se perfeitamente os haplótipos pertencentes ao haplogrupo E3a dos

que se incluem no haplogrupo P*(xR1a,R1b3f). Assim, independentemente do

background definido pelos marcadores bialélicos, os STRs permitem delimitar estes

dois grupos, contendo sequências, de uma forma geral, filogeneticamente bastante

relacionadas no interior de cada um, mas muito afastadas entre os dois grupos. Esta

observação traduz, no fundo, o facto de tanto o haplogrupo E3a como o P*(xR1a,

R1b3f) se caracterizarem por elevado nível de subestruturação geográfica, com o

Page 127: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

97

primeiro estando virtualmente confinado a África subsariana, onde surgiu e diversificou

o espectro de haplótipos de STRs, enquanto que o cenário evolutivo de P*(xR1a,

R1b3f) se desenrolou na Eurásia.

Figura 3.8 - Median-joining networks de haplótipos definidos por STRs. A - haplótipos de 88 sãotomenses. B - haplótipos dentro do haplogrupo E3a de 15 Angolares, 23 Forros e 24 Tongas. O comprimento dos ramos é proporcional ao número de mutações e a área dos círculos proporcional ao número de indivíduos. Círculos assinalados com *, apresentam a combinação de STRs associada ao haplótipo Bantu

Quanto às 5 linhagens de tipo B incluídas nesta análise, com representantes

B*(xB2a,b), B2a1 e B2b, caracterizam-se por haplótipos de STRs molecularmente

muito heterogéneos e apesar de, tal como as E3a, serem também tipicamente

Page 128: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

98

subsarianas, não compartilham afinidades marcadas com este grupo de cromossomas.

Tal compreende-se pelo facto de o grupo B representar um conjunto de linhagens

africanas muito antigas, que foi em grande extensão substituído pelo das linhagens que

estiveram associadas à expansão Bantu.

A maioria dos haplótipos de STRs dos 8 cromossomas E*(xE3a) considerados,

tende a agrupar-se filogeneticamente, mas há também haplótipos molecularmente muito

afastados, o que constitui o reflexo de em E*(xE3a) estarem, como já se referiu,

incluídos diversos subgrupos que manifestam considerável descontinuidade geográfica,

mas que não foi possível discriminar com a resolução molecular utilizada neste

trabalho.

Finalmente no que se refere aos 5 haplótipos de tipo CR*(xDE,J,K), destaca-se a

grande dispersão quanto à localização na network, apesar de dois apresentarem o

mesmo fundo de STRs. Dos restantes 3, um compartilha o mesmo haplótipo com um

cromossoma P*(xR1a, R1b3f), outro com um cromossoma E3a e o terceiro é bastante

divergente no conjunto dos outros haplótipos.

Esta heterogeneidade molecular é consistente com a observação de Brion et al.,

2003, que detectam para este grupo o nível mais elevado de diversidade haplotípica

comparativamente a outros haplogrupos presentes em populações ibéricas e magrebinas,

o que se explica por CR*(xDE,J,K) conter subgrupos muito antigos (Bosch et al., 1999,

Brion et al., 2003), pelo que, consequentemente, puderam acumular muita divergência

molecular quanto ao painel de STRs.

Na Figura 3.8B, apresenta-se uma network obtida apenas com haplótipos de

cromossomas E3a encontrados em Angolares, Tongas e Forros, que se construiu com o

objectivo de avaliar se havia alguma especificidade na distribuição dos haplótipos por

grupo populacional sãotomense. Como a figura ilustra, o haplótipo mais comum é um

derivado por um passo mutacional do haplótipo Bantu, este é o segundo mais comum e

o terceiro é um outro seu derivado também por uma única mutação. Os três são

compartilhados por Angolares, Forros e Tongas. Outros haplótipos são aleatoriamente

compartilhados apenas por dois dos três grupos populacionais (sobretudo por Forros e

Tongas, o que decorrerá de estarem numericamente mais bem representados), e ainda

outros aparecem isoladamente ou em Angolares ou Forros ou Tongas. O haplótipo mais

divergente de tipo E3a foi encontrado num Angolar.

Page 129: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

99

Numa visão global, não se vislumbra, pois, qualquer conjunto particular de

haplótipos que prevaleça nalgum dos três grupos populacionais de São Tomé e Príncipe,

observação que vai ao encontro do resultado apresentado no ponto 3.1, que indica que,

no arquipélago, a variação ao nível dos STRs do Y se caracteriza apenas por um

moderado grau de estruturação entre Angolares, por um lado e, por outro, Forros e

Tongas.

3.2.5 - Considerações globais sobre o estudo de marcadores bialélicos do Y em São Tomé e Príncipe

Neste ponto, iremos fazer um breve balanço dos resultados obtidos com os marcadores

bialélicos do Y, confrontá-lo com o equivalente apresentado no capítulo anterior

relativo a STRs do mesmo cromossoma e, assim, apresentar a imagem global que

captámos sobre o panorama de diversidade das linhagens masculinas em São Tomé e

Príncipe.

O facto de os marcadores bialélicos, evoluírem a uma taxa bastante mais lenta

que a dos STRs, permite que as sequências definidas pelos primeiros, preservem melhor

os acontecimentos mutacionais do seu percurso evolutivo, proporcionando obter uma

robusta aproximação à filogenia de haplogrupos do Y. É também por isso que a

diversidade ao nível de marcadores bialélicos se caracteriza por um nível de

subestruturação geográfica bastante mais acentuado que a de marcadores de tipo STR,

em particular quando se está a considerar uma esfera de observação macro-geográfica.

Foi a marcada especificidade geográfica dos haplogrupos do Y, que permitiu

obter agora uma quantificação, que requer ainda algum refinamento, da proporção de

mistura entre componentes genéticos europeu e africano que se observa actualmente em

São Tomé e Príncipe. O valor obtido, quando se considera a amostra total analisada,

aponta para cerca de 75.5% de linhagens subsarianas e 20.4% de linhagens europeias.

Entre os Forros, o segmento populacional maioritário no arquipélago e que se foi

formando com o desenrolar da trajectória interna de povoamento, o componente

europeu chega mesmo aos 27.2%. É um valor que consideramos surpreendentemente

elevado e que leva a relativizar a noção generalizada de arquipélago “africanizado” que

se tem sobre São Tomé e Príncipe (Henriques, 2000). Assim, a expressão numérica do

Page 130: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

100

grau de miscigenação que ocorreu em São Tomé e Príncipe permite precisar o que as

fontes históricas referem sobre o assunto.

Apesar de os europeus serem a classe socialmente dominante, o seu peso

demográfico foi sempre muito reduzido e apenas terá tido algum relevo na fase inicial

do povoamento, isto é, entre finais do século XV e inícios do XVI, altura em que se deu

o maior afluxo de imigrantes europeus. Mesmo nesse período áureo, o seu número

nunca se terá aproximado sequer do milhar, e a partir daí, a fama negativa de São Tomé

e Príncipe gerada pela agressividade ambiental para os europeus, criou sérios obstáculos

à renovação da população europeia, pelo que esta regrediria permanentemente, de tal

modo que para meados do século XVIII, algumas estatísticas dão conta para São Tomé

da presença de apenas cerca de 80 brancos numa população total que rondaria os 10 500

habitantes (Caldeira, 1999). A dificuldade em atrair povoadores europeus, cedo levaria à

promoção da miscigenação como estratégia não só de expansão da população mas

também de colonização já que se procurava valorizar socialmente o grupo de mulatos

dela resultante. Sobre o número de mulatos, não obstante a ambiguidade da

classificação, terá tido a máxima expressão na fase inicial do povoamento e rondaria as

3 centenas no começo do século XVII, mas depois também tende a descer à medida que

os europeus abandonam o território (Caldeira, 1999).

Por outro lado, no contexto social da altura, o cruzamento entre homens

europeus e mulheres africanas era não só instigado como socialmente tolerado o que

resultaria numa introdução expressiva de linhagens masculinas europeias. De tal modo,

que a proporção desse tipo de linhagens actualmente presente em São Tomé e Príncipe,

supera substancialmente o que está documentado sobre a fracção de europeus

relativamente a africanos registada em diferentes períodos no arquipélago. Os europeus

constituíram sempre uma fatia muito reduzida da população sãotomense. O considerável

desfasamento entre a proporção de europeus e a proporção de linhagens que

introduziram no arquipélago reflecte bem a grande variância no sucesso reprodutivo dos

indivíduos que contribuíram para o povoamento de São Tomé e Príncipe.

Comparando a magnitude do componente europeu nos três grupos populacionais

sãotomenses, a proporção mais baixa foi encontrada entre os Angolares onde é apenas

cerca de metade (14.7%) da registada nos Forros. É um resultado que denuncia

contactos menos intensos com os habitantes europeus de São Tomé e que se explica

pela história de isolamento em que o grupo se manteve durante muito tempo.

Page 131: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

101

Apesar de relativamente às linhagens definidas por marcadores bialélicos do Y,

os Angolares não diferirem significativamente de Forros ou Tongas, os primeiros são os

que apresentam os níveis mais reduzidos de diversidade genética em todos os

parâmetros avaliados. Reforçam-se assim os resultados obtidos com STRs e portanto,

no global, quanto ao padrão de diversidade das linhagens masculinas, encontram-se nos

Angolares traços que caracterizam grupos populacionais pequenos e relativamente

fechados, embora no que respeita ao grupo sãotomense se tratem de sinais relativamente

moderados, o que se entende dado que desde há algum tempo que os Angolares têm

vindo a quebrar o isolamento em que outrora se mantiveram.

Por fim, é de comentar a ausência na amostra sãotomense de cromossomas do

grupo J, um haplogrupo particularmente frequente entre os Judeus. Diversas fontes

referem que, sobretudo na fase inicial do povoamento, chegaram às ilhas muitos judeus

expulsos de Portugal, havendo menção sistemática a uma importante leva única de cerca

de 2000 crianças órfãs de pais judeus. Sabe-se que desta leva, alguns anos após a

chegada, poucas terão sobrevivido, provavelmente em consequência de crises de

malária, que aliás era responsável por uma grande mortalidade entre os portugueses que

iam para São Tomé.

Não temos conhecimento sequer do número grosseiro dos judeus que terá

entrado em São Tomé, mas actualmente não encontramos quaisquer vestígios que

possam atestar do seu impacto no desenvolvimento demográfico do arquipélago.

3.3 - DNA MITOCONDRIAL

As sequências de HVS-I e HVS-II de 103 sãotomenses e respectiva distribuição em

Angolares, Forros e Tongas, encontram-se discriminadas no Apêndice 3.

3.3.1 - Pesquisa de mutações “fantasma”

No sentido de averiguar se artefactos ou erros sistemáticos, ainda que inadvertidos,

eventualmente ocorridos no decorrer do processo de sequenciação poderiam

comprometer a qualidade das sequências de mtDNA obtidas, aplicámos a estratégia de

controlo sugerida por Bandelt et al. (2002). A estratégia visa a detecção de mutações

Page 132: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

102

“fantasma”, designação atribuída a falsas mutações que constituam meros erros de

leitura e que é de admitir poderem ser cometidos em consequência de falhas diversas

inerentes ao procedimento técnico de obtenção de sequências de mtDNA. Parte-se do

princípio que esse tipo de mutações gera um padrão diferente do associado a

verdadeiras mutações. Sabe-se que a grande maioria das transições em HVS-I ocorre

num pequeno número de posições (Hasegawa et al., 1993), e os outros tipos de

mutações (fora de locais poli-C) são sistematicamente pouco frequentes. Por outro lado,

se uma mutação artificial for detectada numa posição mais que uma vez numa dada

amostra, é de esperar incompatibilidades com as bases detectadas em diversas outras

posições.

A presença de mutações fantasma pode tornar-se aparente se se construírem

median networks de sequências, filtrando as posições altamente variáveis (speedy

transitions), isto é, excluindo-as da análise, e considerando apenas o restante tipo de

mutações (weighty mutations). Desta forma, incompatibilidades mutacionais manifestar-

se-ão pela presença nas networks de muitos quadrados ou cubos, ao contrário do padrão

esperado na ausência de mutações fantasma em que é de prever reduzida homoplasia

nas networks geradas com o mesmo tipo de filtragem (Bandelt et al., 2002). Apenas se

aplicou esta estratégia para aferir a fiabilidade da variação observada em HVS-I, já que,

na altura, só havia dados disponíveis para essa região sobre as posições que se deveriam

considerar speedy transitions e quanto à diferenciação de peso a atribuir às weighty

mutations (http://www.stats.gla.ac.uk/~vincent/fingerprint/index.html).

Num primeiro ensaio, a network obtida para a variação em HVS-I apresentou

alguma reticulação secundária que era, basicamente, devida à presença de transversões

alternativas nos locais 114, 265 e 286. As duas transversões diferentes detectadas

naqueles três locais, já tinham sido anteriormente descritas em populações africanas

(Graven et al., 1995; Pereira et al., 2001; Salas et al., 2002) e, portanto, não são

privativas da amostra que analisámos. Quando estas três posições de variação não

binária foram tratadas como binárias, obteve-se a árvore que se apresenta na Figura 3.9,

e em que se pôde constatar que após a filtragem das speedy transitions, o haplótipo mais

frequente na amostra sãotomense correspondia à sequência de referência Cambridge. A

network apresentava ainda um triângulo, indicando ambiguidade na alteração

mutacional que envolve a posição 114, e um rectângulo envolvendo os locais 265/286.

Mas globalmente, é uma árvore bastante harmoniosa e não evidencia sinais de variação

Page 133: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

103

artificial em alguma posição nucleotídica particular. Portanto, a avaliar pelo padrão de

variação retido na network, não encontrámos indicações de que mutações fantasmas

pudessem estar a afectar os resultados de sequenciação obtidos.

Figura 3.9 - Network representando a weighty variation de sequências de mtDNA, entre as posições 16051 a 16365, detectadas na amostra de São Tomé e Príncipe. Cada unidade de comprimento de ligação entre sequências corresponde a uma weighty transition excepto quando assinalada por “ - “ que indica transversão ou “ = “que indica delecção. A área dos nós é proporcional ao número de haplótipos. n = tamanho da amostra; h = número de haplótipos atendendo às weighty mutations.

3.3.2 - Níveis de diversidade em HVS-I e HVS-II em São Tomé e Príncipe

Na Tabela 3.10 apresentam-se diversos índices de diversidade que foram calculados

para HVS-I e HVS-II nos três grupos populacionais de São Tomé e Príncipe e na

amostra global analisada. De acordo com o que tem sido sistematicamente reportado, os

valores de diversidade em HVS-I são, para a maioria dos índices, mais elevados que em

HVS-II.

Comparando os três grupos populacionais entre si, verifica-se que os Angolares

se distinguem novamente de Forros ou Tongas, pelos reduzidos níveis de diversidade,

particularmente no que se refere à heterozigotia média e à proporção de haplogrupos

diferentes.

n = 103h = 22n = 103h = 22

Page 134: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

104

No entanto, nos Angolares, o número médio de diferenças entre sequências é

ligeiramente mais elevado do que nos Forros ou Tongas, o que significa que a redução

de diversidade no grupo não corresponde a um aumento médio da afinidade molecular

entre as suas linhagens de mtDNA.

Tabela 3.10 - Índices de diversidade de sequências HVS-I e HVS-II em populações de São Tomé e Príncipe.

Locus População K(K/N) S(S/l) H(SE) M

Angolares 16 (53.3) 39 (11.4) 0.912±0.037 9.11 Forros 29 (82.9 46 (13.5) 0.988±0.010 8.25 Tongas 28 (73.7) 56 (16.5) 0.984±0.009 9.14

HVS-I

São Tomé 62 (60.2 70 (20.6) 0.985±0.004 8.94

Angolares 17 (56.7) 22 (8.2) 0.913±0.038 7.70 Forros 27 (77.1) 29 (10.8) 0.985±0.010 5.99 Tongas 22 (57.9) 24 (9.0) 0.967±0.012 6.27 HVS-II

São Tomé 52 (50.5) 32 (11.9) 0.979±0.005 6.75

Angolares 18 (60.0) 60 (9.9) 0.919±0.038 16.68 Forros 30 (85.7) 75 (12.3) 0.992±0.008 14.23 Tongas 29 (76.3) 80 (13.2) 0.986±0.009 15.41

HVS-I +

HVS-II São Tomé 70 (68.0) 102 (16.7) 0.988±0.004 15.67

K = número de sequências diferentes e, entre parêntesis, percentagem relativa ao tamanho da amostra (N) S = número de locais polimórficos e, entre parêntesis, percentagem relativa ao tamanho da sequência (l) H = diversidade de sequências ± desvio padrão M = média do número de diferenças entre pares de sequências

Esta particularidade ficou bem evidenciada quando se compararam os padrões

de mismatch distribution em Angolares, Forros e Tongas. Estão apresentados na Figura

3.10, e os perfis nela ilustrados referem-se à variação observada em HVS-I e HVS-I +

HVS-II. Para além das distribuições individuais em cada grupo populacional, também

se apresenta a da amostra total sãotomense. Observando a curva relativa a HVS-I, é

entre os Angolares que se encontra, simultaneamente, o número mais elevado de

sequências idênticas (nº de diferenças entre sequências=0), e uma outra moda ao nível

do número mais elevado de diferenças entre sequências.

O raggedness coefficient (RC) da distribuição em HVS-I nos Angolares é

elevado, 0.085, e difere estatisticamente do valor esperado assumindo um modelo de

expansão populacional (P< 0.001). Embora seja questionável se este modelo permite

formular uma hipótese nula apropriada face à história complexa de povoamento de São

Page 135: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

105

Tomé e Príncipe, é de alguma forma sugestivo que à luz do mesmo modelo, as

distribuições equivalentes em Forros, Tongas ou na amostra global de São Tomé não

apresentem, relativamente aos valores esperados, diferenças estatisticamente

significativas.

As distribuições em Forros ou Tongas, são bastante mais regulares (RC: 0.007 e

0.011, respectivamente), e o padrão registado na amostra global sãotomense é bell

shaped (RC: 0.005) e muito semelhante ao anteriormente encontrado por Mateu et al.

(1997), numa outra amostra populacional de São Tomé e Príncipe. Considerando a

informação simultânea de HVS-I e de HVS-II, de um modo geral a irregularidade das

distribuições tende a acentuar-se, mas diferenças significativas quanto às expectativas

assumindo o modelo de expansão populacional, também apenas se registam nos

Angolares.

Figura 3.10 - Distribuições do número de diferenças nucleotídicas entre pares de sequências em HVS-I e HVS-I + HVS-II de mtDNA, em Angolares, Forros, Tongas e na amostra total de São Tomé e Príncipe .

HVS-I

0

0.1

0.2

0.3

0 2 4 6 8 10 12 14 16 18 20

Freq

uenc

ia (%

)

HVS-I + HVS-II

0

0.05

0.1

0.15

0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32

Nº de diferenças nucleotídicas

Angolares Forros Tongas São Tomé

Page 136: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

106

3.3.3 - Perfil de haplogrupos em São Tomé e Príncipe

No total de 103 sãotomenses analisados, foram encontradas 71 sequências diferentes

que pertenciam a 32 haplogrupos distintos (ver Apêndice 3 e Figura 3.11). Todos eles

são específicos de regiões subsarianas e, portanto, não se detectou nenhuma sequência

de possível origem europeia.

Na amostra global de São Tomé e Príncipe, quatro tipos de haplogrupos, L1b,

L1c, L2a e L3e1*, ocorrem com frequência consideravelmente elevada (10%, foi o

limite mínimo assumido), e no conjunto representam 56 % do total das sequências. L1b,

é um grupo que se encontra particularmente concentrado na África Ocidental, mas

também se estende pelo Norte e Centro de África (Salas et al., 2002).

O padrão filogeográfico de L1c permanece ainda num estado bastante incipiente

de caracterização. Até agora, a maioria das sequências L1c foi encontrada na África

Central, e apenas umas poucas no sudeste e oeste do continente. Provavelmente devido

a efeitos de deriva génica, o haplogrupo atinge frequências muito elevadas entre os

Biaka (Pigmeus da região ocidental da República Centro Africana) e entre os Bubi do

Bioko.

Recentemente, Salas et al. (2002), constatam que mais de 1/3 de sequências L1c

contidas na sua base de dados pertenciam a Afro-Americanos e muito poucas

apresentavam matches com sequências de indivíduos do continente africano. Como o

tráfico de escravos para as Américas teve proveniência esmagadora de regiões da costa

ocidental de África, e atendendo a que sobre a faixa ocidental a Sul do Equador não

dispunham de caracterizações populacionais sobre mtDNA, dispondo já de dados sobre

a costa oriental, sugerem que a origem de L1c ocorreu, provavelmente, entre a África

Central e a costa ocidental atlântica do continente.

L2a1 é um subgrupo de L2a, a classe de haplogrupos mais frequente e

disseminada em África. O subgrupo está bem representado em africanos do sudeste mas

o seu local de origem parece ter sido África Ocidental (Salas et al., 2002).

Finalmente, o último dos haplogrupos mais frequentes em São Tomé e Príncipe,

L3e1*, trata-se do mais antigo e diverso grupo de sequências de mtDNA de tipo L3.

Encontra-se por toda a África subsariana, mas tem-se assumido que surgiu na África

Central/Ocidental e que a dispersão para as regiões meridionais do continente

acompanhou a expansão Bantu (Bandelt et al., 2001)

Page 137: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

107

Sete haplogrupos, representando no conjunto 33% da amostra analisada, surgem

com frequências entre os 3 e 7%: L1a, L2b, L2c, L3*, L3b, L3d e L3e2. Todos, à

excepção do primeiro, ou estão disseminados pelo continente ou são típicos de África

Ocidental. Pelo contrário, L1a tende a estar mais concentrado na África Oriental, região

onde presumivelmente surgiu.

O pacote de haplogrupos raros, aqueles que aparecem apenas uma ou outra vez

na amostra global sãotomense, é diverso e inclui, por exemplo, linhagens específicas da

costa atlântica ocidental (L3e4), da África Oriental (L1e), ou da região sul/oriental de

África (como L3e1a, um haplogrupo muito vulgar entre Bantus ou Khoisan, Bandelt et

al., 2001).

Figura 3.11 - Distribuição de haplogrupos de mtDNA em São Tomé e Príncipe.

Debruçando-nos agora sobre os perfis de haplogrupos detectados

individualmente em cada um dos três grupos populacionais sãotomenses (Figura 3.11),

o que apresenta mais singularidades comparativamente ao da amostra global é o

Page 138: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

108

registado nos Angolares. Caracteriza-se pela presença de uma redução considerável do

número de haplogrupos e pela frequência particularmente elevada de sequências L3e1*

e L1c, que, no conjunto, representam 60% do seu pool de linhagens mitocondriais. Pelo

contrário, é basicamente o mesmo o perfil de haplogrupos em Forros e Tongas.

Registam-se, naturalmente, diferenças menores quanto à frequência de haplogrupos

específicos, mas o leque e nível de diversidade de haplogrupos são muito semelhantes

nos dois perfis.

3.3.4 - Árvore filogenética de sequências de mtDNA

O conjunto de 71 linhagens distintas (considerando a informação das duas regiões

hipervariáveis) detectado na amostra global de São Tomé e Príncipe, foi utilizado para

construir, por neighbour joining, uma árvore de sequências de mtDNA, cuja

representação gráfica se apresenta na Figura 3.12A. Pode ser comparada com a obtida

por Mateu et al. (1997), Figura 3.12B, num estudo que envolveu uma amostra diferente

de São Tomé e Príncipe mas em que não se discriminaram Angolares, Forros e Tongas,

e que se baseou apenas na análise da variação em HVS-I.

A árvore que agora obtivemos é globalmente semelhante à publicada por Mateu

et al. (1997), ainda que a introdução de informação relativa a HVS-II tendesse a

produzir ramos de maior comprimento. Em contrapartida, possibilitou uma melhor

definição das diferentes classes e subclasses de haplogrupos.

Para além da clara estruturação de haplogrupos, a árvore que se ilustra na Figura

3.12 também mostra que o agrupamento das sequências de mtDNA agora detectadas em

São Tomé e Príncipe, ultrapassa amplamente a afiliação em grupos populacionais já que

sequências de Angolares, Forros e Tongas se encontram aleatoriamente dispersas pelas

classes de haplogrupos que se distinguem na árvore.

Page 139: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

109

Figura 3.12 - Árvores filogenéticas de sequências de mtDNA em amostras de São Tomé e Príncipe. A - Árvore baseada nos resultados obtidos neste trabalho incluindo informação de HVS-I e HVS-II. B - Árvore apresentada por Mateu et al. (1997), considerando apenas HVS-I. - Forros; ● - Tongas; ∆ - Angolares

L2a1 L2a1a L2c

L2c1 L2c2

L2b1

L2d2

L1c2

L1c1

L1c1a

L1c1a1

L1e

L1b

L1c3

L1a

L1a1

L1a1a

L3f L3f1

L3d L3d1

L3e1 L3e1a

L3e2a L3e2b L3e3

L3e4

L3*

L1b1

L3b L3b1 L3b2

A

B

Page 140: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

110

3.3.5 - Estruturação genética em São Tomé e Príncipe inferida com mtDNA

Calcularam-se os valores de FST entre pares dos três grupos populacionais sãotomenses,

tendo-se detectado diferenças estatisticamente significativas entre Angolares e Forros

(FST=0.037, P=0.04) e Angolares e Tongas (FST=0.030, P=0.04), mas não era

significativa a distância genética entre Forros e Tongas (FST =0.01, P=0.14).

Efectuou-se de seguida AMOVA aplicando o sistema de hierarquização de

grupos populacionais já descrito na apresentação dos resultados de STRs ou marcadores

bialélicos do Y, e os resultados produzidos com sequências de mtDNA constam da

Tabela 3.11.

Tabela 3.11 - Percentagem de variação produzida por AMOVA com diferentes níveis de hierarquização dos grupos populacionais sãotomenses.

Variação (%) Comparação To vr An+Fo Fo vr An+To An vr To+Fo An+To+Fo

Dentro das populações 97.95 97.76 96.55 97.45 Entre populações 3.78 3.23 1.01 2.55*

Entre grupos -1.73 -1.00 2.44 -

An: Angolares; Fo: Forros; To: Tongas. *Nível de significância: 5%.

Em consonância com os valores de pares de FST que em cima apresentámos,

quando Angolares, Forros e Tongas foram integrados num único grupo, o valor de FST

observado era baixo (0.0255) mas significativamente maior que zero (P=0.02), o que

indica que em São Tomé e Príncipe e quanto às linhagens de mtDNA, a proporção de

variação atribuída a diferenças entre grupos populacionais assume valores

estatisticamente já significativos.

Contudo, quando aplicámos AMOVA confrontando cada grupo populacional

com os restantes dois, a percentagem de variação entre grupos nunca atingiu níveis de

significância estatística, embora alcançasse o valor mais elevado (0.0244) quando os

Angolares eram confrontados com Forros+Tongas. Consequentemente, foi com esta

hierarquização que se registou o valor mínimo para a proporção de variação entre

grupos populacionais (0.0101).

Page 141: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

111

3.3.6 - Comparação com outras populações africanas

Na Tabela 3.12, estão indicados o código de designação, a proveniência, o tamanho

amostral e a fonte bibliográfica das populações africanas com as quais se compararam

os resultados agora obtidos. Nesse exercício comparativo, apenas foi considerada a

variação em HVS-I entre as posições 16090-16365, porque só para esse fragmento

havia dados disponíveis para todas as amostras.

Tabela 3.12 - Código, proveniência, tamanho das amostras e referências bibliográficas para as populações africanas consideradas neste estudo.

Código Proveniência das amostras Tamanho da amostra Referência África Norte

SAH Sahara Oeste 25 Rando et al. (1998) MA Mauritânia 30 Rando et al. (1998) MO Marrocos 32 Rando et al. (1998) BM Marrocos (Berber) 60 Rando et al. (1998) EGI Egipto 68 Krings et al. (1999)

MZB Algéria (Mozabite) 85 Côrte-Real et al. (1996) Macaulay et al. (1999)

África Ocidental HA+KA Niger (Hausa e Kanuri) 20+14 Watson et al. (1997)

FUL Nigéria (Fulbe) 60 Watson et al. (1997) SON+TU Nigéria (Songhai e Tuareg) 10+23 Watson et al. (1997)

YOR Nigéria (Yoruba) 21+14 Watson et al. (1997); Vigilant et al. (1991)

SEN Senegal 50 Rando et al. (1998) SER Senegal (Serer) 23 Rando et al. (1998) WO Senegal (Wolof) 48 Rando et al. (1998)

MAN Senegal (Mandenka) 119 Graven et al. (1995) CVNO Cabo Verde NO 108 Brehm et al. (2002) CVSE Cabo Verde SE 184 Brehm et al. (2002)

África Central MBU República Democrática do Congo (Mbuti) 20 Vigilant et al. (1991) BIA República Centro Africana (Biaka) 17 Vigilant et al. (1991) BIO Guiné Equatorial (Bubi) 45 Mateu et al. (1997) STM São Tomé e Príncipe 50 Mateu et al. (1997) ANG São Tomé e Príncipe (Angolares) 30 Este estudo FOR São Tomé e Príncipe (Forros) 35 Este estudo TON São Tomé e Príncipe (Tongas) 38 Este estudo ST São Tomé e Príncipe 103 Este estudo

África Oriental TK Quénia (Turkana) 36 Watson et al. (1997) KIK Quénia (Kikuyu) 25 Watson et al. (1997) SO Somália 27 Watson et al. (1997)

NUB Núbia 80 Krings et al. (1999) SUD Sudão Sul 76 Krings et al. (1999) MOÇ Moçambique 109 Pereira et al. (2001)

África Sul KNG1 Botsuana (!Kung) 25 Vigilant et al. (1991) KNG2 África do Sul (!Kung) 43 Chen et al. (2000) KWE África do Sul (Khwe) 31 Chen et al. (2000)

Page 142: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

112

3.3.6.1 - Diversidade molecular

Várias medidas de diversidade molecular foram estimadas para as diferentes amostras

populacionais em comparação, conforme se apresenta na Tabela 3.13.

Tabela 3.13 - Medidas de diversidade e neutralidade para sequências HVS-I (16090 a 16365) em populações de São Tomé e Príncipe e de outras regiões africanas.

População N K(K/N) S(S/l) H(SE) M Tajima´s D [p] Fu’s Fs [p]

África Norte

SAH 25 20 (80.0) 29 (10.5) 0.973±0.022 5.11 -1.25 [0.09] -12.41 [0]*** MA 30 22 (73.3) 28 (10.1) 0.970±0.018 5.83 -0.63 [0.29] -11.48 [0]*** MO 32 29 (90.6) 44 (15.9) 0.988±0.014 5.84 -1.70 [0.01]* -25.01 [0]*** BM 60 38 (63.3) 47 (17.0) 0963±0.015 4.44 -1.88 [0.02]** -25.74 [0]*** EGI 68 59 (86.8) 66 (23.9) 0.993±0.005 6.82 -1.70 [0.01]* -25.07 [0]*** MZB 85 29 (34.1) 35 (12.7) 0.942±0.010 4.73 -1.01 [0.15] -11.14 [0.002] ** África Ocidental

HA+KA 34 30 (88.3) 41 (14.9) 0.991±0.010 6.19 -1.38 [0.08] -24.70 [0]*** FUL 60 38 (63.3) 43 (15.6) 0.972±0.010 6.82 -0.87 [0.19] -23.15 [0]*** SON+TU 33 29 (87.9) 41 (14.9) 0.992±0.009 7.26 -1.02 [0.15] -21.30 [0]*** YOR 34f 32 (94.1) 44 (15.9) 0.996±0.008 7.31 -1.16 [0.10] -25.01 [0]*** Tabela SEN 50 42 (84.0) 41 (14.9) 0.987±0.008 6.24 -1.08 [0.15] -25.22 [0]*** SER 23 21 (91.3) 40 (14.5) 0.992±0.015 8.09 -0.98 [0.15] -11.98 [0]*** WO 43 39 (90.7) 42 (15.2) 0.991±0.006 7.50 -0.71 [0.27] -24.97 [0]*** MAN 110 a 46 (41.8) 47 (17.0) 0.963±0.008 6.23 -0.94 [0.17] -24.53 [0]*** CVNO 108 28 (25.9) 32 (11.6) 0.908±0.013 5.84 -0.13 [0.47] -5.58 [0.09] CVSE 184 101 (54.9) 69 (25.0) 0.984±0.003 6.29 -1.45 [0.04]* -24.85 [0]*** África Central

MBU 13 a 5 (38.5) 19 (6.8) 0.756±0.097 7.13 0.70 [0.78] 3.76 [0.95] BIA 17 8 (47.1) 20 (7.2) 0.890±0.043 7.81 1.27 [0.90] 1.67 [0.80] BIO 45 16 (35.6) 30 (10.9) 0.910±0.020 7.09 0.11 [0.60] -0.55 [0.46] STM 50 32 (64.0) 46 (16.7) 0.973±0.011 7.86 -0.80 [0.24] -14.52 [0] *** ANG 30 16 (53.5) 36 (13.0) 0.913±0.037 8.74 -0.14 [0.52] -1.34 [0.30] FOR 35 29 (82.9) 41 (14.9) 0.988±0.010 7.52 -0.88 [0.20] -18.66 [0] *** TON 38 28 (73.7) 52 (18.8) 0.984±0.009 8.55 -1.11 [0.13] -12.61 [0] *** ST 103 61 (59.2) 63 (22.8) 0.985±0.004 8.36 -0.99 [0.16] -24.68 [0] *** África Oriental

TK 36 32 (88.9) 54 (19.6) 0.991±0.010 9.66 -0.94 [0.17] -20.75 [0*** SO 27 24 (88.9) 41 (14.9) 0.992±0.013 6.90 -1.32 [0.08] -16.25 [0]*** KIK 25 23 (92.0) 45 (16.3) 0.993±0.013 7.96 -1.27 [0.09] -14.55 [0]*** NUB 80 50 (62.5) 64 (23.2) 0.974±0.008 7.88 -1.29 [0.08] -24.83 [0]*** SUD 76 63 (82.9) 73 (26.4) 0.993±0.004 8.33 -1.47 [0.04]* -24.77 [0] *** MOÇ 109 49 (45.0) 57 (20.6) 0.960±0.008 7.78 -0.89 [0.19] -23.62 [0] *** África Sul KNG1 24 a 9 (37.5) 16 (5.8) 0.830±0.053 2.97 -1.09 [0.13] -1.27 [0.25] KNG2 43 12 (27.9) 31 (11.2) 0.812±0.045 7.30 0.07 [0.63] 1.84 [0.79] KWE 31 10 (32.30) 34 (12.3) 0.884±0.028 8.75 0.10 [0.45] 3.00 [0.91] N = tamanho da amostra

K = número de sequências diferentes e, entre parêntesis , percentagem relativa ao tamanho amostral S = número de locais polimórficos e, entre parêntesis, percentagem relativa ao tamanho da sequência = l H = diversidade de sequências ± desvio padrão M = número médio de diferenças entre pares de sequências a (algumas sequências não foram consideradas na análise pela ausência de informação quanto a muitas posições) * P< 0.05 ** ***

Page 143: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

113

Repare-se que os elevados níveis de diversidade em Forros, Tongas e na

amostra global de São Tomé e Príncipe são semelhantes aos registados na maioria das

populações continentais de África da faixa atlântica Centro-Ocidental onde,

geograficamente, São Tomé e Príncipe se localiza.

Pelo contrário, e ainda na mesma faixa, os níveis mais reduzidos de diversidade

encontram-se entre os Angolares ou outras populações insulares como a do grupo NO

de Cabo Verde ou a do Bioko.

Assim, não é de estranhar, que os parâmetros Tajima´s D ou Fu’s Fs nos

Angolares, assumissem valores negativos baixos (não chegando a atingir nível de

significância estatística em Fu´s Fs), encaixando-se na gama de valores mais elevados

registados para estes parâmetros e que só se encontram ou em populações insulares

como, mais uma vez, a do grupo NO de Cabo Verde ou a do Bioko, ou em pequenos

grupos populacionais fechados como os Pigmeus da floresta central de África (BIA e

MBU) ou grupos Khoisan do sul do continente (KNG1, KNG2, KWE).

As restantes populações africanas, incluindo Forros e Tongas, são caracterizadas

por valores francamente negativos para Tajima´s D ou Fu´s Fs, o que tem sido

consensualmente interpretado como um sinal de populações que registaram expansões

demográficas.

Sinais de expansão demográfica, ou a sua ausência, também ficam retidos nos

padrões de distribuição de diferenças entre pares de sequências de mtDNA. Na Figura

3.13 apresentam-se essas distribuições para algumas populações aleatoriamente

escolhidas entre aquelas com valores situados nos extremos da gama de variação em

Tajima´s D ou Fu’s Fs. Populações com valores muito baixos, como a do Egipto (EGI),

dos Mandenka do Senegal (MAN), do Sudão (SUD) ou Moçambique (MOÇ),

caracterizam-se por curvas de distribuição bastante regulares e aproximadamente bell-

shaped, padrão previsível em populações que registaram expansões demográficas

acentuadas. Em contrapartida, em populações com valores elevados de Tajima´s D ou

Fu’s Fs, as mismatch distributions são muito mais irregulares, multi-modais, e

observam-se em grupos populacionais pequenos, relativamente fechados e que se têm

mantido demograficamente estáveis. Como a Figura 3.13 ilustra, é o que se verifica

entre os Pigmeus Mbuti (MBU) e Biaka (BIA), ou num grupo !Kung (KNG2).

Page 144: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

114

Figura 3.13 - Distribuição de diferenças entre pares de sequências de mtDNA em diferentes amostras populacionais. Eixo dos X: número de diferenças entre sequências. Eixo dos Y: frequências.

3.3.6.2. - Padrão de partilha de sequências de mtDNA

No sentido de procurar determinar a origem geográfica das linhagens de mtDNA que

entraram em São Tomé e Príncipe, efectuámos uma análise de matches entre as

sequências sãotomenses e as de uma base de dados construída com sequências HVS-I

das populações africanas referenciadas na Tabela 3.12. Contudo, para evitar demasiada

dispersão, agrupámos algumas amostras com base num critério de proximidade

geográfica, salvo para aquelas provenientes de áreas onde, de acordo com as fontes

históricas, pudesse ter ocorrido recrutamento de escravos para o arquipélago. Na Tabela

3.14, estão discriminados o tipo e número de vezes que sequências de sãotomenses

eram compartilhadas pelos grupos populacionais considerados. Na legenda indicam-se

os agrupamentos de amostras efectuados.

Atendendo à informação contida em HVS-I entre as posições 16090-16365, a

amostra total sãotomense continha 60 sequências diferentes, das quais 34 (56.7%) eram

partilhadas por outros africanos. Destas, 19 estavam presentes nos Forros,

ANG

0

0.1

0.2

0.3

0 2 4 6 8 10 12 14 16

TON

0

0.05

0.1

0.15

0 2 4 6 8 10 12 14 16 18

FOR

0

0.05

0.1

0.15

0 2 4 6 8 10 12 14 16 18

S.TOMÉ

0

0.05

0.1

0.15

0 2 4 6 8 10 12 14 16 18

EGI

00.050.1

0.150.2

0 2 4 6 8 10 12 14 16 18

MAN

0

0.05

0.1

0.15

0 2 4 6 8 10 12 14 16

SUD

0

0.05

0.1

0.15

0 2 4 6 8 10 12 14 16 18 20

MOÇ

0

0.05

0.1

0.15

0 2 4 6 8 10 12 14 16 18

MBU

00.050.1

0.150.2

0.250.3

0 2 4 6 8 10 12 14

KNG2

00.050.1

0.150.2

0.25

0 2 4 6 8 10 12 14

CVNO

0

0.05

0.1

0.15

0.2

0 1 2 3 4 5 6 7 8 9 10 11 12 13

BIA

0

0.05

0.1

0.15

0.2

0 2 4 6 8 10 12 14 16 18

Page 145: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

115

correspondendo a 65.5% dos seus distintos haplótipos, 17 (60.7%) em Tongas, e apenas

7 nos Angolares, o que significa que apenas 43.8% das matrilinhagens Angolares são

compartilhadas por indivíduos de outras populações não sãotomenses (ver 4 últimas

colunas da direita na Tabela 3.14). Portanto, confrontando os três grupos de São Tomé

e Príncipe, são os Angolares que apresentam a percentagem mais baixa de sequências

partilhadas e, consequentemente, a proporção mais elevada de linhagens privadas. Mais

um indicador de que o grupo registou um fluxo génico bastante mais limitado que

Forros ou Tongas.

Quanto aos matches registados, é de comentar a sua consistência com o padrão

de frequência e distribuição geográfica de haplogrupos específicos. Por exemplo, para

as 4 sequências sãotomenses partilhadas pertencentes ao haplogrupo L1a, um

haplogrupo frequente e de presumível origem no leste africano, registaram-se 101

matches, dos quais 93 com sequências contidas no grupo designado Este ou em

Moçambique.

Em contrapartida, uma sequência sãotomense de tipo L3e1a, um haplogrupo

geralmente bastante raro, era partilhada apenas por 8 africanos, 6 dos quais incluídos no

grupo Sul, zona onde o haplogrupo atinge a frequência mais elevada.

Relativamente às regiões/populações consideradas, aquela com a qual São Tomé

e Príncipe partilhava menos haplótipos era a do Norte de África. Apenas 5.2% dos

diferentes haplótipos contidos no conjunto de amostras da região, apresentavam

matches com sequências sãotomenses, e as sequências partilhadas pertenciam, em

geral, a haplogrupos amplamente distribuídos em África.

Relativamente às regiões/populações subsarianas, os Pigmeus e o Este (que

incluía as amostras do leste de África com excepção de Moçambique) eram as que

partilhavam menor proporção de sequências com São Tomé, logo seguida do grupo

referido como Sul, em que se juntaram as 3 amostras de Khoisan. Em comparação, os

restantes grupos considerados, apresentavam frequências de matches com São Tomé e

Príncipe bastante elevadas, sendo de destacar os valores particularmente altos

registados para o Bioko, que compartilhava 31.1% das suas sequências e 31.3% dos

haplótipos diferentes com sãotomenses, e para Cabo Verde NO, em que os valores

correspondentes eram 42.6% e 28.6%, respectivamente. Quanto a Cabo Verde, uma

análise mais detalhada permitiu constatar que dos sete haplótipos mais frequentes no

arquipélago, assim considerados quando a frequência amostral excedia 3% (Brehm et

Page 146: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

116

al., 2002), quatro (um L3b, outro L1c e dois L3e4) estão também presentes em São

Tomé e Príncipe. Três desses 7 haplótipos são especialmente frequentes no grupo NO

das ilhas e os 4 haplótipos caboverdianos mais frequentes partilhados apresentam

matches com 6 sequências de Forros ou Tongas.

Merece ainda referência a elevada percentagem de sequências moçambicanas,

41.1%, que também se encontram em São Tomé e Príncipe, embora representem apenas

13.6% de haplótipos diferentes partilhados. Naturalmente que o primeiro valor terá que

ser relativizado dado que o tamanho da amostra de Moçambique é superior ao de

qualquer outra região/população comparadas.

Mas não se pode excluir a possibilidade de que este resultado, e em particular o

referido para Cabo Verde NO, sejam parcialmente fruto do intenso fluxo imigratório

que se iniciou em meados do século XIX e que resultaria na entrada no arquipélago de

milhares de trabalhadores originários de Angola, Cabo Verde e Moçambique. Só entre

1901 e 1928, 50 000 angolanos e 43 000 moçambicanos foram contratados como

serviçais com destino às roças e estima-se em cerca de 80 000 o número de

caboverdianos com idêntico destino, para o período compreendido entre 1900 e 1970

(Carreira, 1982). A conotação com o recente influxo de serviçais moçambicanos é,

porém, pouco consistente com o facto de a proporção de mulheres que integraram essa

vaga de imigrantes ter sido muito reduzida relativamente à maioria de indivíduos do

sexo masculino (Nascimento, 2002). Dos serviçais que foram para São Tomé e Príncipe

no período de 1904 a 1922, Moçambique concorreu com apenas 7.2% de mulheres

(Carreira, 1982) e o desequilíbrio no ratio de sexos dos moçambicanos que

desembarcaram em São Tomé foi uma constante enquanto se manteve o fluxo

migratório. Portanto, outra explicação terá que ser encontrada para a elevada frequência

de matches registada entre sequências moçambicanas e sãotomenses e que pode traduzir

apenas o compartilhar de um fundo genético característico da faixa africana a Sul do

Equador. Para poder fundamentar a validade desta hipótese, será fundamental dispor de

dados relativos a mtDNA sobre regiões do Ocidente africano compreendendo as actuais

República Democrática do Congo e Angola, de momento inexistentes, já que, por um

lado, toda a faixa constituiu um importante centro de recrutamento de escravos levados

para São Tomé e Príncipe e, por outro, quanto ao mais recente contingente de angolanos

que entrou no arquipélago para trabalhar nas roças do cacau e café, a percentagem de

mulheres foi até inferior à referida para os moçambicanos (Carreira, 1982).

Page 147: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

117

Tabela 3.14 - Sequências sãotomenses partilhadas com outros grupos populacionais africanos.

Nor

te

Sene

gal

SE-C

abo

Ver

de

NO

-Cab

o V

erde

Nig

er/N

igér

ia

Pigm

eus

Bio

ko

Este

Moç

ambi

que

Sul

Ang

olar

es

Forr

os

Tong

as

SãoT

omé

N 300 231 184 108 161 30 45 244 416 98 30 35 38 103

Nº hapl. dif. 154 120 101 28 107 13 16 164 132 26 16 29 28 60 L1a 1 52 1 1 L1a 4 1 22 2 2 L1a 2 2 12 2 1 1 2 L1a 3 1 1 L1b 1 10 1 7 2 1 3 3 L1b 3 3 2 1 2 1 3 L1b 3 1 1 L1c 1 3 12 2 2 L1c 3 2 3 3 L1c 8 4 2 2 L1c 1 1 1 L2a 4 3 2 5 2 4 4 1 2 2 L2a 1 1 35 2 2 L2a 1 1 1 L2a 1 6 4 1 3 1 3 10 2 1 3 L2b 3 1 1 2 2 L2b 1 1 1 L2c 1 1 1 1 L2c 2 1 2 1 1 L2c 2 1 1 L2d 1 1 1 L3* 1 1 1 3 1 1 L3* 1 1 1 2 L3b 1 1 3 3 1 1 L3b 1 6 13 2 10 1 2 2 L3b 1 2 1 1 1 L3d 1 1 1 1 3 4 L3e1* 1 1 15 1 1 L3e1a 2 6 1 1 L3e2a 2 5 2 1 2 1 1 2 4 L3e2b 1 1 1 L3e3 1 10 1 1 2 L3e4 6 2 15 1 1 1 1 L3e4 1 11 1 1

Nº matches 16 53 43 46 33 3 14 27 171 11 9 24 26 58 % matches 5.3 22.9 23.4 42.6 20.5 10.0 31.1 11.1 41.1 11.2 30.0 68.6 68.4 56.3 Nº matches dif 8 17 18 8 12 1 5 10 18 3 7 19 17 34 % matches dif. 5.2 14.2 17.8 28.6 11.2 7.7 31.3 6.1 13.6 11.5 43.8 65.5 60.7 56.7

N = tamanho da amostra; Nº hapl. dif. = número de haplótipos diferentes; Nº matches = número total de matches com sequências sãotomenses; % matches = proporção de matches relativamente ao tamanho da amostra; Nº matches dif. = número de haplótipos diferentes compartilhados; % matches dif. = proporção de haplótipos diferentes compartilhados relativamente ao número de haplótipos diferentes da amostra. Composição das amostras de acordo com os códigos que constam da Tabela 3.12: Norte: SAH+ MA+ MO+ BM+ EGY+ MZB Senegal: SEN+ SER+ WO+ MAN SE Cabo Verde: CVSE NO Cabo Verde: CVNO Niger/Nigéria: HA + KA+-FUL+ SON+ TU+YOR Pigmeus: MBU + BIA Bioko: BIO Este: TK+ SO+ KIK+ NUB + SUD Moçambique: MOZ + amostra estudada por Salas et al., 2002 Sul: KNG1 +KNG2 + KWE

Page 148: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

118

Pelo contrário, parece fazer sentido relacionar a elevada frequência de matches

entre sequências sãotomenses e cabo-verdianas com a entrada maciça em São Tomé e

Príncipe de serviçais naturais de Cabo Verde. Os dados relativos a essa emigração

forçada indicam a entrada de 35.9%, de mulheres cabo-verdianas para o período de1904

a 1922, proporção que em anos subsequentes poderá ter sido até superior, já que, por

exemplo, relativamente a finais dos anos 40, estatísticas oficiais reportam a presença no

arquipélago de um número de caboverdianas superior ao de trabalhadores com a mesma

origem do sexo masculino (Carreira, 1982). Aliás a quota feminina nas plantações de

São Tomé e Príncipe era praticamente suprida por mulheres caboverdianas, sendo

encorajada a sua ligação com homens de diferentes origens (Carreira, 1982).

Assim, se nos fixarmos na frequência de sequência partilhadas com as amostras

que amalgamámos em Senegal, e que está numericamente mais bem representada que

os grupos NO ou SE de Cabo Verde, afigura-se verosímil atribuir o excesso de matches

com sequências sãotomenses registado nos dois grupos de Cabo Verde, em especial no

NO, a este influxo recente de caboverdianos em São Tomé e Príncipe.

As ilhas de São Vicente, São Nicolau, Santo Antão, as 3 que integram o grupo

NO de Cabo Verde, e Santiago, a ilha maior, mais populosa e uma das que está incluída

no grupo SE de Cabo Verde, foram as que mais contribuíram para a vaga de imigrantes

que desembarcaram em São Tomé e Príncipe, o que não parece justificar a desigualdade

acentuada quanto à proporção de matches com sequências sãotomenses registada para os

grupos NO e SE de Cabo Verde. Talvez essa disparidade resulte da circunstância de que,

quanto ao padrão de variação de linhagens de mtDNA, o grupo NO de Cabo Verde

comparativamente ao SE se caracterize por uma acentuada redução de diversidade

genética (Brehm et al., 2002).

3.3.6.3 - Análise de componentes principais

Com base nas frequências de haplogrupos registadas em Angolares, Forros, Tongas e

em todas as populações africanas usadas como referência, efectuou-se uma análise de

componentes principais (PC), que revelou que os três grupos populacionais de São

Tomé e Príncipe ficavam agrupados no conjunto que incluía as populações de África

Oriental/ Central/Ocidental. Este conjunto, distinguia-se claramente de outros dois que

Page 149: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

119

continham as populações do Norte e do Sul de África, mas no entanto, no seu interior a

resolução populacional não era muito satisfatória.

Remodelámos então a análise, restringindo-a a populações que no ensaio

anterior ficaram integradas no grupo Oriental/Central/Ocidental e trabalhámos

exclusivamente com frequências relativas de haplogrupos subsarianos (a inclusão de

todos os haplogrupos produziu sinais menores mas irrelevantes no contexto desta

análise). Por outro lado, e no sentido de obter um quadro de resultados mais conciso,

quando dispúnhamos de diferentes amostras da mesma região, nomeadamente do

Senegal, Nigéria e Quénia, amalgamámo-las numa amostra global representativa da

região.

Na Figura 3.14, apresenta-se a projecção dos dois primeiros componentes

principais obtidos na análise, que no conjunto condensam 54% da variância total.

Podem observar-se 3 grupos de populações. Aquele que ocupa o quarto

inferior/esquerdo do plano e que para além da amostra bem individualizada dos Biaka

contém a população Bubi da ilha do Bioko e os Angolares; outro, posicionado do quarto

inferior/direito do plano e que integra as populações de África de leste com excepção de

Moçambique; e ao centro da metade superior do plano, o grupo que compreende as

restantes populações consideradas da faixa ocidental atlântica, e onde se integram

Forros, Tongas e a amostra de São Tomé e Príncipe estudada por Mateu et al. (1997).

Se ignorarmos os Biaka, devido à sua posição extremamente marginalizada, observa-se

no segundo PC um gradiente bastante consistente que reflecte a localização de

populações no eixo NO/SE de África.

L1c é o haplogrupo que mais contribui tanto para PC1 como para PC2, sendo

responsável por 31% e 23% da variância total, respectivamente. É um haplogrupo que

atinge uma frequência particularmente elevada entre os Biaka e é ele o responsável pelo

arrastamento do Bioko e dos Angolares, onde também ocorre com frequência bastante

elevada, na direcção dos Pigmeus. Relativamente a PC1, o segundo haplogrupo com

maior impacto é L3*, sendo determinante no posicionamento das populações do leste de

África. Quanto a PC2, destacam-se adicionalmente as contribuições de dois

haplogrupos: L1a, na gama de valores negativos, e L2c, na dos positivos. L1a representa

23.5% das duas únicas linhagens encontradas entre os Biaka e é também muito vulgar

em África Oriental; L2c é especialmente frequente no Senegal mas quase não se

encontra no leste de África.

Page 150: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

120

-0,5

-0,4

-0,3

-0,2

-0,1

0

0,1

0,2

0,3

-0,4 -0,3 -0,2 -0,1 0 0,1 0,2 0,3 0,4

PC2

PC1

STM CVNO CVSE BiokoAngolares Forros Tongas SenegalNigéria Quénia Moçambique SomáliaNíger Sudão Nubia Biaka

Figura 3.14 - Projecção dos dois componentes principais obtidos com frequências relativas de haplogrupos de mtDNA subsarianos. SMT: São Tomé e Príncipe (Mateu et al., 1997); CVNO: Cabo Verde NO; Cabo Verde SE.

Nesta teia de relacionamento entre populações e haplogrupos, é interessante

reparar na quase sobreposição entre Cabo Verde, sobretudo o grupo SE, e o Senegal.

Forros e Tongas afastam-se um pouco deste grupo, ocupando numa posição

intermédia entre as populações atlânticas mais a Norte e as populações de África

Oriental. Angolares é o grupo sãotomense que mais se distingue, por evidenciar grandes

afinidades com o Bioko e por ser, de todas as populações consideradas nesta análise, a

que mais se aproxima dos Biaka.

3.3.7 - Considerações globais sobre o estudo de mtDNA em São Tomé e Príncipe

3.3.7.1 - Padrão de variação de mtDNA em São Tomé e Príncipe

O elevado nível de diversidade de mtDNA agora registado na amostra global de São

Tomé e Príncipe, reforça o resultado anteriormente reportado por Mateu et al., 1997,

para uma amostra diferente do mesmo arquipélago e indica que, apesar da insularidade,

São Tomé e Príncipe reteve um nível substancial de diversidade, o que se explica pelo

Page 151: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

121

influxo ciclíco de linhagens provenientes de regiões diversas e que foram transportadas

pelos indivíduos que ao longo dos últimos 5 séculos foram chegando ao arquipélago.

Entre eles, incluem-se os colonos europeus, preponderantemente portugueses,

que desempenharam um papel essencial no povoamento e no desenvolvimento das

estruturas políticas, sociais e económicas do arquipélago. Não obstante, o impacto

europeu no pool de mtDNA sãotomense parece ter sido virtualmente nulo, como atesta

a ausência de haplogrupos europeus nas amostras analisadas. Sem excepção, todas as

linhagens encontradas pertenciam a haplogrupos com distribuição geográfica confinada

a África subsariana, testemunhando um background de linhagens maternas totalmente

africano.

Esta observação contrasta com o registado para outras regiões genómicas. Como

apresentámos no ponto 3.1.1, detectámos em São Tomé e Príncipe bastantes haplótipos

definidos por STRs do cromossoma Y que, sem grande margem de dúvida, eram de

origem europeia. No ponto seguinte, sobre marcadores bialélicos do Y, marcadores

caracterizados por acentuada subestruturação macro-geográfica, apresentámos uma

estimativa para o componente europeu na amostra total sãotomense que rondava os

20.4%. É um valor, por si, bastante elevado, sobretudo se confrontado com o

equivalente feminino que é nulo.

Mas no conjunto, os resultados agora aferidos com base em linhagens maternas e

paternas, são absolutamente concordantes com os recentemente derivados com

marcadores autossómicos por Tomás et al. (2002), que estimam em 10.7% a

contribuição genética europeia em São Tomé e Príncipe, ou seja, quase a média dos

valores agora obtidos com mtDNA e cromossoma Y.

A ausência de linhagens femininas europeias em São Tomé e Príncipe significa,

pois, que a fracção genética de origem europeia actualmente existente no arquipélago

foi basicamente mediada por indivíduos do sexo masculino. Este desequilíbrio explica-

se, em parte, pelo facto de ter sido sempre muito reduzido o número de mulheres

europeias que foi para São Tomé e Príncipe. Por outro lado, o défice de mulheres

europeias associado ao contexto social da altura, altamente estigmatizador de ligações

entre mulheres europeias e homens africanos, resultaria em cruzamentos deste tipo

apenas esporádicos, enquanto que os recíprocos eram não só tolerados como muito

estimulados.

Page 152: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

122

O quadro genético que se extraiu do mtDNA e do cromossoma Y afigura-se um

reflexo nítido desta faceta do processo de povoamento de São Tomé e Príncipe.

Sobre o local de origem das linhagens de mtDNA presentes em São Tomé e

Príncipe, o perfil de haplogrupos detectado na amostra global sãotomense, aponta para

um pool de linhagens maternas com origem principal a partir dum substrato típico do

centro/sudoeste atlântico de África (ver Figura 3.14). Porém, a ausência de uma

caracterização mais fina quanto ao mtDNA nas populações dessa faixa territorial

impede que, de momento, se possam extrair deduções mais pormenorizadas sobre as

regiões que poderão ter dado os contributos mais significativos para o pool de

sequências sãotomenses. Apesar de tudo, este enquadramento grosseiro num substrato

de tipo centro/sudoeste atlântico, é congruente com o que se sabe sobre as áreas de

fornecimento dos escravos transportados para São Tomé e Príncipe no período que

antecedeu o ciclo do café e do cacau, áreas que terão abrangido, essencialmente, a faixa

atlântica balizada, grosso modo, entre o Cabo das Palmas, na Costa do Marfim, e o rio

Cuanza, em Angola (Caldeira, 1999).

Outros sinais do perfil de haplogrupos sãotomense, não deixam iludir a intricada

história demográfica do arquipélago e alguns parecem decorrer do fluxo migratório

mais recente que se encetou no século XIX com a exploração das culturas do café e do

cacau. Referimo-nos à presença em São Tomé e Príncipe de muitas sequências

compartilhadas com Cabo Verde e que parece ser consequência do influxo recente de

serviçais cabo-verdianas. Na realidade, o papel de Cabo Verde no desenvolvimento

inicial da população sãotomense deve ter sido nulo, já que nessa altura era também

premente em Cabo Verde a consolidação do povoamento que, no que respeita ao

componente africano, foi conseguida à custa de escravos recrutados na região da

Senegâmbia, região que, pelo contrário, não constituiu centro abastecedor daqueles que

foram levados para São Tomé e Príncipe.

3.3.7.2 - Achegas do mtDNA sobre a questão da origem dos Angolares

Quanto à questão da origem dos Angolares, relativamente à qual enunciámos no ponto

1.2.4 da INTRODUÇÃO as três versões comuns sobre o assunto, cremos que os dados

de mtDNA poderão fornecer pistas fundamentais para o esclarecimento do problema,

embora de momento, a ausência de uma caracterização filogeográfica mais fina, em

Page 153: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

123

particular na orla atlântica centro/ocidental de África, condicione muito o valor do

enquadramento interpretativo possível.

Entre os Angolares, o haplogrupo mais bem representado era L1c, um

haplogrupo com uma distribuição geográfica muito sintomática e que sugere que a sua

origem geográfica poderá ter ocorrido na região compreendida entre Angola e o delta de

Congo (Salas et al., 2002), região que permanece ainda por caracterizar quanto ao

mtDNA. Sabe-se que toda essa região foi crucial para as actividades dos portugueses

relacionadas com o tráfico negreiro e terá fornecido uma fracção substancial dos

escravos recrutados para o povoamento de São Tomé e Príncipe (Pinto e Carreira, 1979;

Henriques, 2000).

A representatividade de L1c agora detectada, não só entre os Angolares mas

também na amostra global sãotomense, parece reforçar o cenário proposto para a

origem de L1c, e admitindo-o, a referida região poderá ter sido uma das fontes

principais de antepassados dos Angolares. No entanto, o facto de o espectro de

sequências L1c Angolares ser bastante diversificado, parece indicar que o aporte de

linhagens envolveu considerável dispersão geográfica dentro da hipotética área de

origem de L1c.

Ainda quanto a este haplogrupo, é de sublinhar que apenas entre os Angolares se

tenham encontrado sequências do subgrupo L1c1a. Até agora, este tipo de linhagens só

foi detectado esporadicamente entre moçambicanos e entre os Biaka, o grupo ocidental

de Pigmeus, onde, pelo contrário, aparece com frequência muito elevada. Embora o

suprimento de escravos para São Tomé e Príncipe possa ter atingido algumas zonas

interiores do continente africano, nenhuma fonte refere a entrada de Pigmeus em São

Tomé e Príncipe. Assim, afigura-se altamente provável que o subgrupo esteja também

bem representado em regiões da faixa africana atlântica a Sul do Equador e, a ser assim,

o refinamento dessa distribuição afigura-se do maior interesse para se poder inferir a

origem das linhagens L1c1a que se encontram entre os Angolares.

O haplogrupo que predomina em segundo lugar nos Angolares é L3e1*,

representado por uma só linhagem mas compartilhada por 8 indivíduos, o que denuncia

um nítido efeito de fundador. De novo, o postulado local de origem de L3e1* é África

Central/Ocidental, ou seja, uma das áreas de filogeografia ainda muito pouco estudada,

mas que coincide com a presumível faixa de recrutamento de escravos levados para São

Tomé e Príncipe.

Page 154: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

124

As outras linhagens encontradas entre os Angolares com frequência moderada

ou baixa pertencem a haplogrupos ou amplamente dispersos em África ou típicos da

orla central/ ocidental, excepto uma linhagem de tipo L1a1a, que por ser de um

subgrupo predominante no leste/sudeste africano, resultará, provavelmente, de uma

introdução mais recente nos Angolares.

Remetendo-nos sucintamente às versões sobre a origem dos Angolares, e pondo

de parte, pela inverosimilhança, a “hipótese da prioridade africana”, os Angolares

poderiam ser (a) os descendentes dos náufragos de um navio negreiro proveniente de

Angola, ou (b) o grupo que se foi formando à custa dos escravos foragidos das

plantações da cana-de-açúcar e que se refugiaram nas florestas da região do sudeste de

São Tomé, onde, escapando ao controlo colonial, se foram estabelecendo e organizando.

À luz da primeira hipótese pressupõe-se um pequeno núcleo fundador e,

portanto, seria de prever que nos Angolares predominassem linhagens de origem

confinada a uma região bastante restrita e, presumivelmente, caracterizadas por forte

relacionamento molecular. À luz da segunda, seriam muito mais os fundadores e

oriundos de regiões diversas, esperando-se encontrar nos Angolares muito maior

dispersão geográfica quanto à origem das linhagens e, teoricamente, menor

relacionamento molecular entre elas.

Quanto aos locais específicos de origem das linhagens de mtDNA dos

Angolares, a informação de que dispomos é pouco conclusiva face à ausência, quanto a

mtDNA, de uma caracterização pormenorizada nas áreas que potencialmente

constituíram centros importantes de proveniência dos escravos levados para São Tomé e

Príncipe.

Porém, e não obstante a redução de diversidade nos Angolares

comparativamente a Forros e Tongas, o reportório de linhagens de mtDNA Angolares é

bastante variado, o que se traduz, como já salientámos, numa média muito elevada

quanto ao número de diferenças entre pares de haplótipos, resultado que parece mais

compatível com um cenário envolvendo a entrada sucessiva de linhagens múltiplas e

heterogéneas, ou seja, o previsto assumindo a segunda hipótese sobre a origem dos

Angolares, que considera serem os descendentes dos escravos fugitivos das plantações,

que ao longo do tempo foram consolidando uma comunidade relativamente isolada de

outros habitantes de São Tomé e Príncipe. Como já se referiu no ponto 1.2.4 a

propósito da questão da origem dos Angolares, também as evidências linguistas

Page 155: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

125

favorecem este cenário. Pela análise lexical e fonética pôde deduzir-se que o Angolar, o

crioulo falado pelos Angolares, se autonomizou mais recentemente que os outros

crioulos existentes no arquipélago, e parece ter surgido, basicamente, de uma

relexificação de vocábulos utilizados nas fazendas pelos escravos e seus descendentes

(Seibert, 1998). Trata-se de um crioulo de origem heterogénea, o que faz supor que os

que o utilizam fossem também descendentes de um núcleo de fundadores igualmente

diversificado. Com base na análise linguística, Hagemeijer (1999) recusa para os

Angolares a tese do naufrágio, considerando que o grupo se formou à custa dos

escravos fugidos das roças, tendo por isso assimilado já o crioulo que aí se falava. O

mesmo autor considera que, originalmente, haveria apenas um único crioulo que nos

Angolares se foi diferenciando devido ao isolamento do grupo.

3.3.7.3 - Afinidades genéticas entre Angolares, Forros e Tongas

Como diversos índices indicam, nomeadamente proporção de haplótipos diferentes,

diversidade génica, Tajima´s D ou Fu´s Fs, os Angolares distinguem-se de Forros e

Tongas pela patente redução de diversidade ao nível do mtDNA. A redução de

diversidade no pool de linhagens maternas neste grupo constitui mais uma marca de

efeitos de deriva genética no seu seio consequentes à circunstância de que, até bastante

recentemente, os Angolares se constituírem como grupo relativamente fechado

mantendo escassos contactos com os outros habitantes de São Tomé e Príncipe.

Em conformidade, os Angolares apresentam indícios de moderada diferenciação

genética, mas já estatisticamente significativa, quando confrontados com os dois outros

grupos populacionais sãotomenses. Pelo contrário, Forros e Tongas compartilham um

padrão de diversidade muito semelhante e não manifestam sinais de heterogeneidade

genética quanto aos perfis de mtDNA.

Assim, os resultados obtidos com mtDNA corroboram e reforçam os obtidos

com STRs do cromossoma Y no que respeita às relações de afinidade genética entre os

três grupos populacionais de São Tomé e Príncipe. No conjunto, os dados obtidos

apontam para uma ligeira diferenciação genética dos Angolares relativamente a Tongas

ou Forros, enquanto que os dois últimos grupos constituem entidades geneticamente

homogéneas. Para um arquipélago pequeno como São Tomé e Príncipe e com uma

história populacional tão recente, este resultado é digno de reparo. As populações são

Page 156: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

126

entidades complexas que desenvolvem intricadas interacções sociais. Os actuais perfis

genéticos podem fornecer uma aproximação sobre o seu passado evolutivo, mas este

nunca pode ser completamente recuperado. Em São Tomé e Príncipe, uma rede

complexa de forças sociais, históricas e económicas inter-actuaram para que uma

comunidade que se auto-intitula como angolar ainda hoje preserve sinais de uma certa

especificidade genética, apesar de compartilhar um território tão exíguo com outros

habitantes do arquipélago.

3.3.7.4 - Fluxo génico mediado pelo sexo feminino entre grupos sãotomenses

Finalmente, comentaremos os resultados obtidos com AMOVA.

Embora quando considerámos Angolares, Forros e Tongas como um único

grupo, o FST global produzido por AMOVA fosse estatisticamente significativo

(FST=0.026, P=0.02), quando a análise foi executada hierarquicamente discriminando de

cada vez um dos grupos populacionais dos restantes dois, não registámos diferenças

significativas entre os agrupamentos considerados. Estes resultados parecem indicar que

entre os grupos populacionais sãotomenses não se verificaram restrições muito

marcadas quanto ao fluxo génico mediado pelo sexo feminino, e para tal a explicação

poderá residir na conjugação de dois factores.

Por um lado, a tendência para sistemas de acasalamento poligâmicos que cedo se

generalizou em São Tomé e Príncipe. No arquipélago, a poligamia é uma prática

tradicional e corresponde à retenção de traços comuns em populações africanas que

contribuíram para o povoamento das ilhas (Caldeira, 1999). A poligamia tem como

consequência um aumento do tamanho efectivo da população feminina, o que pode ter

concorrido para impedir que se estabelecesse um grau de subestruturação bem definido

no pool de linhagens de mtDNA sãotomenses. Por outro lado, e paralelamente ao

aspecto anterior mas respeitante apenas aos Angolares, a prática inicial de procurarem

mulheres fora da comunidade. Muito provavelmente, seria do sexo masculino a maioria

dos escravos fugitivos das plantações. A partir das áreas de refúgio e uma vez

organizados, os Angolares desencadeavam ataques às plantações, sendo usual raptarem

mulheres negras. Há registos dessa prática até finais do século XVIII, o que indica que o

défice feminino era um problema estrutural sério entre a comunidade angolar (Caldeira,

1999). Défice que foi difícil equilibrar em parte porque muitas das mulheres que eram

Page 157: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

III-Resultados e Discussão

127

levadas para os quilombos regressavam voluntariamente às plantações (Caldeira, 1999).

Assim, durante os séculos em que o grupo se consolidou, procurou-se compensar

o reduzido número de mulheres entre os Angolares com a renovação de forma

continuada de elementos do sexo feminino. Este influxo sistemático de linhagens

femininas poderá ter contribuído para evitar limitações de relevo quanto ao fluxo génico

feminino entre grupos sãotomenses, e daí ser parcialmente responsável por não se ter

gerado subestruturação significativa no pool de linhagens maternas do arquipélago.

Retomando os resultados obtidos com STRs do cromossoma Y, é de recapitular

que, quando aplicámos AMOVA, detectámos uma fracção significativa de diversidade

atribuível a diferenças entre grupos na hierarquia em que Angolares eram confrontados

com Tongas e Forros. Por conseguinte, a informação combinada extraída com base em

linhagens maternas e paternas definidas por STRs, sugere que o fluxo génico entre

Angolares e os outros habitantes de São Tomé e Príncipe foi sexualmente

desequilibrado, tendo aparentemente ocorrido uma taxa de migração mais baixa

mediada por indivíduos de sexo masculino.

Page 158: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de
Page 159: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

IV - CONCLUSÕES

Page 160: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de
Page 161: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

131

Integrando os resultados obtidos com a análise de STRs ou marcadores bialélicos do

cromossoma Y e de sequências de mtDNA, são as seguintes as principais conclusões a

que conduziu este trabalho:

1. Sobre o arquipélago de São Tomé e Príncipe

- Os níveis de diversidade registados no arquipélago são elevados e enquadram-se

na gama de valores que caracteriza a maioria das populações continentais de

África. Apesar do relativo isolamento, não se encontram em São Tomé e

Príncipe sinais globais de erosão de diversidade que são comuns em grupos

populacionais fechados ou com longo percurso de insularidade. A recente

história demográfica do arquipélago e a origem diversificada dos indivíduos que

ao longo dos séculos foram consolidando o seu povoamento, permitem

compreender esta característica da moldura genética de São Tomé e Príncipe.

- O seu fundo genético é preponderantemente de origem africana, o que atesta o

forte impacto da contribuição de escravos no povoamento do arquipélago. Sobre

a sua proveniência, as linhagens de mtDNA apontam para uma contribuição

significativa do Centro/Ocidente de África, em conformidade com o que se sabe

sobre as zonas de recrutamento dos escravos levados para São Tomé e Príncipe,

mas o estado de incipiente caracterização filogeográfica de toda essa região,

impossibilita que, de momento, se façam inferências mais pormenorizadas.

Page 162: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

IV- Conclusões

132

- Para além dos vestígios destes povoadores, que desempenharam um papel

fundamental nos séculos que se seguiram à descoberta do arquipélago, outros

sinais no padrão de sequências de mtDNA parecem ser consequentes de um

fluxo imigratório mais recente. A observação de que uma percentagem elevada

de linhagens femininas sãotomenses é compartilhada por caboverdianos, quando

não há indicações que estes tenham tido algum papel de relevo no

desenvolvimento inicial da população de São Tomé e Príncipe, parece justificar-

se porque a partir do século XIX entraram no arquipélago milhares de

caboverdianos como contratados para os trabalhos nas roças do cacau e do café,

e nessa vaga, ao contrário dos serviçais moçambicanos ou angolanos que eram

esmagadoramente do sexo masculino, a quota de mulheres era muito semelhante

à de homens.

- O contributo europeu na formação da população de São Tomé e Príncipe está

bem presente no seu perfil genético actual que retém marcas claras sobre o grau

e padrão de miscigenação ocorridos. Com base em marcadores bialélicos do Y,

avaliou-se em 20.4% a proporção de linhagens masculinas de origem europeia, o

que representa uma fracção surpreendentemente elevada se se atender ao sempre

reduzido peso demográfico dos europeus comparativamente ao dos africanos em

São Tomé e Príncipe, passadas as décadas iniciais do processo de povoamento.

O considerável desfasamento entre a proporção de europeus e a proporção de

linhagens que introduziram no arquipélago reflecte bem a grande variância no

sucesso reprodutivo dos indivíduos que contribuíram para formação da

população de São Tomé e Príncipe.

- Em oposição, nas sequências de mtDNA sãotomenses, não existem quaisquer

linhagens de presumível origem europeia, o que significa que foi virtualmente

nulo o impacto demográfico do cruzamento entre mulheres europeias e homens

africanos. Tal entende-se por ter sido insignificante o número de mulheres

europeias que foi para São Tomé e Príncipe e porque, face ao contexto social da

altura, foram raras as ligações entre mulheres europeias e homens africanos.

Page 163: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

IV- Conclusões

133

2. Sobre Angolares, Forros e Tongas

- Não se encontraram indícios de diferenciação genética entre Forros e Tongas. Os

dois grupos compartilham basicamente o mesmo padrão de variação para todos

os marcadores analisados e podem, portanto, considerar-se uma entidade

genética homogénea. Forros, são os sãotomenses cujos antepassados têm raízes

remotas no arquipélago e incluem os descendentes dos escravos provenientes da

faixa Ocidental Atlântica que, após a descoberta de São Tomé e Príncipe, foram

sendo recrutados para o seu povoamento. Tongas são os descendentes dos

imigrantes forçados originários de Angola, Cabo Verde e Moçambique que,

entre o século XIX e meados do XX, entraram em massa no arquipélago para

trabalhar nas roças do cacau e do café. De uma certa forma e comparativamente

aos Forros, os Tongas representam uma sub-amostragem do continente africano

mais recente e geograficamente mais abrangente, mas percebe-se a ausência de

diferenciação entre os dois grupos dada a forma como os últimos se integraram

na sociedade sãotomense que, ao contrário de potenciar eventuais diferenças,

sempre funcionou no sentido de as esbater. Os Tongas descendem dos serviçais

que, por terem ficado com contratos de repatriação por cumprir, se viram

obrigados a estabelecer no arquipélago. Nunca formaram uma comunidade

isolada de outros habitantes, até porque o défice global de mulheres entre os

serviçais proporcionava as ligações com naturais do arquipélago. Assim, a

idealização de Tongas é uma construção social que não tem paralelo do ponto de

vista genético.

- Os Angolares apresentam sinais de alguma diferenciação relativamente a Tongas

ou Forros, embora seja uma diferenciação de nível moderado pois se atinge

significância estatística quando averiguada com STRs do Y ou mtDNA, o

mesmo não se verifica com marcadores bialélicos do Y. A especificidade

angolar, reside essencialmente numa redução de diversidade genética que se

nota na maioria dos parâmetros de avaliação e que se poderá explicar por efeitos

de deriva génica dado que este pequeno grupo populacional se manteve, até há

pouco tempo, bastante isolado e com escassos contactos com outros habitantes

de São Tomé.

Page 164: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

IV- Conclusões

134

- O grau de subestruturação detectado em São Tomé e Príncipe é, no entanto, mais

acentuado nas linhagens definidas por STRs do Y que nas de mtDNA, indicando

que entre os Angolares e outros sãotomenses, foram menores as restrições ao

fluxo génico mediado pelo sexo feminino que ao fluxo mediado pelo sexo

masculino. Para tal poderá ter concorrido, por um lado, uma certa generalização

em São Tomé e Príncipe de sistemas de acasalamento poligâmicos, com

consequente diminuição relativa do tamanho efectivo da população masculina e,

por outro, uma prática inicial entre os Angolares, e persistente durante séculos,

de procurarem mulheres fora da comunidade.

- Sobre a questão da origem dos Angolares, os resultados obtidos com mtDNA

indicam que apesar da relativa redução de diversidade das linhagens angolares,

elas incluem sequências molecularmente bastante divergentes, o que parece

favorecer um cenário evolutivo do grupo envolvendo a entrada sucessiva de

linhagens múltiplas e heterogéneas, ou seja, o previsto assumindo a hipótese de

os Angolares serem os descendentes dos escravos fugitivos das plantações que

ao longo do tempo foram reforçando um núcleo populacional que se manteve

bastante isolado de outros habitantes de São Tomé e Príncipe. É a hipótese que

os dados linguísticos também favorecem.

- No futuro, o previsível refinamento da caracterização filogeográfica de

haplótipos de mtDNA ou do cromossoma Y em toda a faixa Centro/Ocidental

atlântica do continente africano, permitirá um melhor enquadramento dos

resultados agora obtidos e afigura-se da maior importância para se poder inferir

quais os principais locais de origem dos africanos que contribuíram para o

povoamento geral de São Tomé e Príncipe e, em particular, para a formação do

grupo angolar. Quanto ao último ponto, a observação de que apenas entre os

Angolares estão presentes linhagens quer do haplogrupo do Y B*(xB2a,b), um

haplogrupo muito raro em África, quer de sequências mitocondriais de tipo L1c1

ou L1c1a, tipo de linhagens que, até agora, só se encontrou bem representado

entre um grupo de Pigmeus da Républica Centro-Africana, afigura-se ser uma

pista a valorizar no esclarecimento da questão relativa à origem dos Angolares.

Page 165: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

IV- Conclusões

135

3. Sobre a caracterização fina da diversidade genética em África

- Os dados obtidos neste trabalho contribuiram para aumentar o estado de

caracterização dos padrões de diversidade genética em África e a sua

disponibilização perante a comunidade científica permitirá integrá-los em

contextos de investigação diversificados, nomeadamente na reconstituição

pormenorizada da história genética do continente africano.

Page 166: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

V - BIBLIOGRAFIA _______________________________________________

Page 167: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

139

Albarrán, C., Garcia, O., Alonso, A., Deka, R., Martin, P., Trovoada, M.J., Amorim, A.,

Sancho, M. (1998) Patterns of haplotype variation at the D1S80 locus and a

flanking sequence polymorphism in African and non - African populations.

Prog. Forensic Genet. 7: 401-403.

Almeida, A. (1966) Das etnonimias da Guiné Portuguesa, do arquipélago de Cabo

Verde e das ilhas de São Tomé e Príncipe. Instituto Superior de Ciências Sociais e

Política Ultramarina.

Alves-Silva, J., Santos, M.S., Guimarães, P.E., Ferreira, A.C., Bandelt, H.J., Pena, S.D.,

Prado, V.F. (2000) The ancestry of Brazilian mtDNA lineages. Am. J. Hum. Genet.

67 (2): 444-461.

Ambrósio, A. (1984) Subsídios para a História de São Tomé e Príncipe. Livros do

Horizonte.

Anderson, S., Bankier, A.T., Barrell, B.G., De Bruijn, M.H.L., Coulson, A.R. (1981)

Sequence and organization of the human mitochondrial genome. Nature 290: 457-

465.

Andrews, R.M., Kubacka, I., Chinnery, P.F., Lightowlers, R.N., Turnbull, D.M.,

Howell, N. (1999) Reanalysis and revision of the Cambridge reference sequence for

human mitochondrial DNA. Nat. Genet. 23 (2):147

.

Page 168: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

V- Bibliografia

140

Ankel-Simons, F., Cummins, J.M. (1996) Misconceptions about mitochondria and

mammalian fertilization: Implications for theories on human evolution. Proc. Natl.

Acad. Sci. USA 93: 13859-13863.

Aquadro, C.F., Greenberg, B.D. (1983) Human mitochondrial DNA variation and

evolution: analysis of nucleotide sequences from seven individuals. Genetics 103:

287-312.

Avise, J.C., Arnold, J., Ball, R.M., Bermingham, E, Lamb, T., Neigel, J.E, Reeb, C.A.,

Saunders, N.C. (1987) Intraspecific Phylogeography: The Mitochondrial DNA

Bridge Between Population Genetics and Systematics. Annual Review of Ecology

and Systematics 18: 489-522.

Awadalla, P. Eyre-Walker, A., Smith, J.M. (1999) Linkage Disequilibrium and

Recombination in Hominid Mitochondrial DNA. Science 286: 2524-2525.

Awadalla, P. Eyre-Walker, A. Smith, J.M. (2000) Questioning evidence for

recombination in human mitochondrial DNA. Science 288: 1931a.

Awadalla, P. (2003) The evolutionary genomics of pathogen recombination. Nat. Rev.

Genet. 4 (1): 50-60.

Bandelt, H.J., Alves-Silva, J., Guimarães, P.E., Santos, M.S., Brehm, A., Pereira, L.,

Coppa, A., Larruga, J.M., Rengo, C., Scozzari, R., Torroni, A., Prata, M.J., Amorim,

A., Prado, V.F., Pena, S.D. (2001) Phylogeography of the human mitochondrial

haplogroup L3e: a snapshot of African prehistory and Atlantic slave trade. Ann.

Hum. Genet. 65 (Pt 6): 549-563.

Bandelt, H.J., Quintana-Murci, L., Salas, A., Macaulay, V. (2002) The fingerprint of

phantom mutations in mitochondrial DNA data. Am. J. Hum. Genet. 71 (5): 1150-

60.

Page 169: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

V- Bibliografia

141

Bendall, K.E., Macaulay, V.A., Baker, J.R., Sykes B.C. (1996) Heteroplasmic point

mutations in the human mtDNA control region. Am. J. Hum. Genet. 59 (6): 1276-

1287.

Boore, J.L. (1997) Transmission of mitochondrial DNA--playing favorites? Bioessays

19 (9): 751-753.

Bosch, E., Calafell, F., Santos, F. R., Perez-Lezaun, A., Comas, D., Benchemsi, N.,

Tyler-Smith, C., Bertranpetit, J. (1999) Variation in short tandem repeats is deeply

structured by genetic background on the human Y chromosome. Am. J. Hum.

Genet. 65, 1623-1638.

Bosch, E., Calafell, F., Comas, D., Oefner, P.J., Underhill, P.A., Bertranpetit, J. (2001)

High-resolution analysis of human Y-chromosome variation shows a sharp

discontinuity and limited gene flow between northwestern Africa and the Iberian

Peninsula. Am. J. Hum. Genet. 68 (4): 1019-1029.

Brehm, A., Pereira, L., Bandelt, H.J., Prata, M.J., Amorim, A. (2002) Mitochondrial

portrait of the Cabo Verde archipelago: the Senegambian outpost of Atlantic slave

trade. Ann. Hum. Genet. 66 (Pt 1): 49-60.

Brion, M., Salas, A., Gonzalez-Neira, A., Lareu, M.V., Carracedo, A. (2003) Insights

into Iberian population origins through the construction of highly informative Y-

chromosome haplotypes using biallelic markers, STRs, and the MSY1

minisatellite.Am. J. Phys. Anthropol. 122 (2): 147-61.

Brown, W.M. (1980) Polymorphism in mitochondrial DNA of humans as revealed by

restriction endonuclease analysis. Proc. Natl. Acad. Sci. USA 77 (6): 3605-3609.

Brown W.M., Prager, E.M., Wang, A., Wilson, A.C. (1982) Mitochondrial DNA

sequences of primates: tempo and mode of evolution. J. Mol. Evol. 18 (4): 225-239.

Page 170: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

V- Bibliografia

142

Brown, D.T., Samuels, D.C., Michael, E.M., Turnbull, D.M., Chinnery, P.F. (2001)

Random genetic drift determines the level of mutant mtDNA in human primary

oocytes. Am. J. Hum. Genet. 68 (2): 533-536.

Budowle, B., Chakraborty, R., Giusti, A.M., Eisenberg, A.J., Allen, R.C. (1991)

Analysis of the VNTR locus D1S80 by the PCR followed by high-resolution PAGE.

Am. J. Hum. Genet. 48 (1):137-144.

Budowle, B., Allard, M.W., MR Wilson (2002) Critique of interpretation of high levels

of heteroplasmy in the human mitochondrial DNA hypervariable region I from hair.

Forensic Sci. Int. 126 (1): 30-33.

Caldeira, A.M. (1999). Mulheres, sexualidade e casamento em São Tomé e Príncipe

(Séculos XV-XVIII). Lisboa. Edições Cosmos.

Cann, R.L., Wesley, M.B., Wilson, A.C. (1984). Polymorphic sites and the mechanism

of evolution in human mitochondrial DNA. Genetics 106: 479-499.

Cann, R.L., Stoneking, M., Wilson, A.C. (1987). Mitochondrial DNA and human

evolution. Nature 325 (6099): 31-36.

Carreira, A. (1982). The people of the Cape Verde islands. Exploitation and Emigration.

C. Hurst & Company, London and Archon Books, Hamden, Connecticut.

Carvalho, M., Anjos, M.J., Andrade, L., Coxinho, C., Corte-Real, F., Gamero, J.J.,

Vieira, D.N., Vide, M.C. (2000) Y chromosome polymorphisms: a comparison

between Azores and continental Portuguese samples. Progress in Forensic Genetics

8, 302-304.

Cavalli-Sforza, L.L., Feldman, M.W. (2003) The application of molecular genetic

approaches to the study of human evolution. Nat. Genet. 33 Suppl: 266-275.

Page 171: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

V- Bibliografia

143

Cavelier, L., Johannisson, A., Gyllensten, U. (2000) Analysis of mtDNA copy number

and composition of single mitochondrial particles using flow cytometry and PCR.

Exp. Cell Res. 259 (1): 79-85.

Chen, Y.S., Olckers, A., Schurr, T.G., Kogelnik, A.M., Huoponen, K., Wallace, D.C.

(2000) mtDNA variation in the South African Kung and Khwe-and their genetic

relationships to other African populations. Am. J. Hum. Genet. 66 (4): 1362-1383.

Chinnery, P.F., Howell, N., Lightowlers, R.N., Turnbull, D.M. (1997) Molecular

pathology of MELAS and MERRF. The relationship between mutation load and

clinical phenotypes. Brain 120: 1713 - 1721.

Costa, F.F. (1982) A ilha de São Tomé. Um reino de escravos na linha do Equador.

História 50, 66-78.

Cruciani, F., Santolamazza, P., Shen, P., Macaulay, V., Moral, P., Olckers, A.,

Modiano, D., Holmes, S., Destro-Bisol, G., Coia, V., Wallace, D.C., Oefner, P.J.,

Torroni, A., Cavalli-Sforza, L.L., Scozzari, R., Underhill, P.A. (2002) A back

migration from Asia to sub-Saharan Africa is supported by high-resolution analysis

of human Y-chromosome haplotypes. Am. J. Hum. Genet. 70 (5): 1197-1214.

Cruciani, F., La Fratta, R., Santolamazza, P., Sellitto, D., Pascone, R., Moral, P.,

Watson, E., Guida, V., Colomb, E.B., Zaharova, B., Lavinha, J., Vona, G., Aman,

R., Cali, F., Akar, N., Richards, M., Torroni, A., Novelletto, A., Scozzari, R. (2004)

Phylogeographic analysis of haplogroup e3b (e-m215) Y chromosomes reveals

multiple migratory events within and out of Africa. Am. J. Hum. Genet. 74 (5):

1014-22.

Cruz, C.B. (1975) São Tomé e Príncipe: do colonialismo à independência. Actualidade

portuguesa. Moraes editora. Lisboa.

Curtin, P. (1969) The Atlantic Slave Trade: A Census. Madison: University of

Wisconsin Press.

Page 172: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

V- Bibliografia

144

Davidson, B. (1988) As Ilhas Afortunadas. Lisboa. Editorial Caminho, SA.

D'Eustachio, P. (2002) High levels of mitochondrial DNA heteroplasmy in human hairs

by Budowle et al. Forensic Sci. Int. 130 (1): 63 - 67.

Dupanloup, I, Pereira, L., Bertorelle, G., Calafell, F., Prata, M.J., Amorim, A.,

Barbujani, G. (2003) A recent shift from polygyny to monogamy in humans is

suggested by the analysis of worldwide Y-chromosome diversity. J. Mol. Evol. 57

(1): 85-97.

Eisen, J.A., Hanawalt, P.C. (1999) A phylogenomic study of DNA repair genes,

proteins, and processes. Mutat. Res. 435 (3): 171-213.

Eltis, D., Beherendt, S.D., Richardson, D., Klein, H.S. eds. (1999) The Trans-Atlantic

Slave Trade: A Database on CD-Rom. Cambridge.

Eyre-Walker, A., Smith, N.H., Smith, J.M. (1999) How clonal are human mitochondria?

Proc. R. Soc. Lond. B. Biol. Sci. 266 (1418): 477-483.

Eyre-Walker, A.C., Awadalla, P. (2001) Does human mtDNA recombine? J Mol Evol.

53 (4-5): 430-435.

Excoffier, L., Yang, Z. (1999) Substitution rate variation among sites in mitochondrial

hypervariable region I of humans and chimpanzees. Mol. Biol. Evol. 16: 1357-1368.

Felsenstein, J. (1993) Phylip (Phylogeny inference package) version 3.5c. Distributed

by the author. Department of Genetics. University of Washington. Seatle.

Ferlin, A., Moro, E., Rossi, A., Dallapiccola, B., Foresta, C. (2003). The human Y

chromosome’s azoospermia factor b (AZFb) region: sequence, structure, and

deletion analysis in infertile men. Med. Genet. 40: 18-24.

Page 173: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

V- Bibliografia

145

Fisher, R.P., Lisowsky, T., Parisi, M.A., Clayton, D.A. (1992) DNA wrapping and

bending by a mitochondrial high mobility group-like transcriptional activator

protein. J. Biol. Chem. 267: 3358-3367.

Forster, P., Rohl, A., Lunnemann, P., Brinkmann, C., Zerjal, T., Tyler-Smith, C.,

Brinkmann, B. (2000) A short tandem repeat-based phylogeny for the human Y

chromosome. Am. J. Hum. Genet. 67 (1): 182-196.

Galhano, M.H. (1962) Estudo comparativo dos Angolares e Mussurongos pelo método

da análise discriminante. Trabalhos do centro de estudos de etnologia do Ultramar.

Giles, R.E., Blanc, H, Cann, H.M., Wallace, D.C. (1980). Maternal inheritance of

human mitochondrial DNA. Proc. Natl. Acad. Sci. USA. 77 (11): 6715-6719.

Gill, P., Brenner, C., Brinkmann, B., Budowle, B., Carracedo, A., Jobling, M.A., de

Knijff, P., Kayser, M ., Krawczak, M ., Mayr, W.R., Morling, N., Olaisen, B., V

Pascali, V., Prinz, M., Roewer, L., Schneider, P.M., Sajantila, A., Tyler-Smith, C.

(2001) DNA commission of the International Society of Forensic Genetics:

recommendations on forensic analysis using Y-chromosome STRs. Int. J. Legal

Med. 114 (6): 305-309.

Gonçalves, R., Rosa, A., Freitas, A., Fernandes, A., Kivisild, T., Villems, R., ·Brehm,

A. (2003) Y-chromosome lineages in Cabo Verde Islands witness the diverse

geographic origin of its first male settlers. Hum. Genet. 113: 467-472

Gonser, R., Donnelly, P., Nicholson, G., Di Rienzo, A. (2000). Microsatellite mutations

and inferences about human demography. Genetics 154: 1793-1807.

González-Neira, A., Gusmão, L., Brión, M., Lareu, M. V., Amorim, A., Carracedo, A.

(2000) Distribution of Y-chromosome STR defined haplotypes in Iberia. Forensic

Sci. Int. 110: 117-126.

Page 174: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

V- Bibliografia

146

Goodfellow, P., Darling, S., Wolfe, J. (1985) The human Y chromosome. J. Med.

Genet. 22: 329 - 344.

Graven, L., Passarino, G., Semino, O., Boursot, P., Santachiara-Benerecetti, S.,

Langaney, A. & Excoffier, L. (1995) Evolutionary correlation between control

region sequence and restriction polymorphisms in the mitochondrial genome of a

large Senegalese Mandenka sample. Mol. Biol. Evol. 12, 334 - 345.

Graves, J.A.M. (2000) Human Y Chromosome, Sex Determination, and

Spermatogenesis - A Feminist View. Biol. Reprod. 63: 667 - 676.

Graves, J.A.M. (2002). The rise and fall of SRY. Trends Genet. 18 (5): 259-264.

Grzybowski, T. (2000) Extremely high levels of human mitochondrial DNA

heteroplasmy in single hair roots. Electrophoresis 21 (3): 548-553.

Gusmão, L., Gonzáles-Neira, A., Pestoni, C., Brión, M., Lareu, M. V., Carracedo, A.

(1999) Robustness of the Y STRs DYS19, DYS389I/II, DYS390, DYS391,

DYS392 and DYS393: optimization of a PCR pentaplex. Forensic Sci. Int. 106,

163-172.

Gusmão, L., Prata, M.J., Miranda, C., Trovoada, M.J., Amorim, A. (2001) STR data

from S. Tomé e Príncipe (Gulf of Guinea, West Africa). Forensic Sci. Int. 116 (1):

53-54.

Hagemeijer, T. (1999). As Ilhas de Babel: a crioulização no Golfo da Guiné in Revista

Camões 6: 74-88.

Hammer, M.F., Horai, S (1995) Y chromosomal DNA variation and the peopling of

Japan. Am. J. Hum. Genet 56 (4): 951-962.

Page 175: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

V- Bibliografia

147

Hammer, M.F., Blackmer, F., Garrigan, D., Nachman, M.W., Wilder, J.A. (2003)

Human Population Structure and Its Effects on Sampling Y Chromosome Sequence

Variation. Genetics 164: 1495 - 1509.

Harpending, H.C., Batzer, M.A., Gurven, M., Jorde, L.B., Rogers, A.R., Sherry, S.T.

(1998). Genetic traces of ancient demography. Proc. Natl. Acad. Sci. USA 95: 1961-

1967.

Hasegawa, M., Di Rienzo, A., Kocher, T.D., Wilson, A.C. (1993) Toward a more

accurate time scale for the human mitochondrial DNA tree. J. Mol. Evol. 37 (4):

347-354.

Henriques, I.C. (2000). São Tomé e Príncipe. A invenção de uma sociedade. Vega e

Autor.

Hurles, M.E., Irven, C., Nicholson, J., Taylor, P.G., Santos, F.R., Loughlin, J., Jobling,

M.A., Sykes, B.C. (1998) European Y-chromosomal lineages in Polynesians: a

contrast to the population structure revealed by mtDNA. Am. J. Hum. Genet. 63 (6):

1793-1806.

Hurles, M., Veitia, R., Arroyo, E., Armenteros, M., Bertranpetit, J., Perez-Lezaun, A.,

Bosch, E., Shlumukova, M., Cambon-Thomsen, A., Singh, L., Pandya, A. Santos,

F., Tyler-Smith, C., Jobling, M. (1999). Recent male-mediated gene flow over a

linguistic barrier in Iberia, suggested by analysis of a Y-chromosomal DNA

polymorphism. Am. J. Hum. Genet. 65: 1437-1448.

Iliffe, J. (1995) Os Africanos - história dum continente. Terramar, Lda.

Ingman, M., Kaessmann, H., Paabo, S., Gyllensten, U. (2000). Mitochondrial genome

variation and the origin of modern humans. Nature. 408 (6813): 708-713.

Ingman, M. (2003) Mitochondria and Human Evolution. Acta Universitatis Upsaliensis.

Comprehensive Sumamaries of Uppsala Dissertations from the Faculty of Medicine

1288. Uppsala.

Page 176: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

V- Bibliografia

148

Jenuth, J.P., Peterson, A.C., Fu, K., Shoubridge, E.A. (1996). Random genetic drift in

the female germline explains the rapid segregation of mammalian mitochondrial

DNA. Nat. Genet. 14 (2): 146-151.

Jin, L., Macaubas, C., Hallmayer, J., Kimura, A., Mignot, E. (1996) Mutation rate varies

among alleles at a microsatellite locus: Phylogenetic evidence. Proc. Natl. Acad.

Sci. USA 93: 15285-15288.

Jobling, M.A., Heyer, E., Dieltjes, P., de Knijff, P. (1999). Y-chromosome-specific

microsatellite mutation rates re-examined using a minisatellite, MSY1. Hum. Mol.

Genet. 8: 2117-2120.

Jobling, M.A., Tyler-Smith, C. (2000). New uses for new haplotypes the human Y

chromosome, disease and selection. Trends Genet. 16 (8): 356-362.

Jobling, M.A. (2001). Y-chromosomal SNP haplotype diversity in forensic analysis.

Forensic Sci. Int. 118 (2-3): 158-162.

Jobling, M.A., Tyler-Smith, C. (2003) The human Y chromosome: an evolutionary

marker comes of age. Nat Rev Genet. 4 (8): 598-612.

Johnson, A.A., Johnson, K.A. (2001). Exonuclease Proofreading by Human

Mitochondrial DNA Polymerase. J. Biol. Chem. 276: 38097-38107.

Jorde, L.B., Bamshad, M.J., Watkins, W.S., Zenger, R., Fraley, A.E., Krakowiak, P.A.,

Carpenter, K.D., Soodyall, H., Jenkins, T., Rogers, A.R. (1995) Origins and

affinities of modern humans: a comparison of mitochondrial and nuclear genetic

data. Am. J. Hum. Genet. 57 (3): 523-38.

Jorde, L.B., Bamshad, M. (2000) Questioning evidence for recombination in human

mitochondrial DNA. Science 288 (5473): 1931.

Page 177: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

V- Bibliografia

149

Kaneda, H., Hayashi, J., Takahama, S., Taya, C., Lindahl, K.F., Yonekawa, H. (1995)

Elimination of Paternal Mitochondrial DNA in Intraspecific Crosses During Early

Mouse Embryogenesis. Proc. Natl. Acad. Sci. USA 92: 4542-4546.

Kayser, M., de Knijff, P., Dialtjes, P., Krawczak, M., Nagy, M., Zerjal, T., Pandya, A.

(1997) Applications of microsatellite based Y chromosome haplotyping.

Electrophoresis 18 1602-1607.

Kayser, M., Roewer, L., Hedman, M., Henke, L., Henke, J., Brauer, S., Kruger, C.,

Krawczak, M., Nagy, M., Dobosz, T., Szibor, R., de Knijff, P., Stoneking, M.,

Sajantila, A. (2000) Characteristics and frequency of germline mutations at

microsatellite loci from the human Y chromosome, as revealed by direct observation

in father/son pairs. Am. J. Hum. Genet. 66 (5): 1580-1588.

Kayser, M., Brauer S, Weiss G, Schiefenhovel W, Underhill P, Stoneking M (2001a)

Independent histories of human Y chromosomes from Melanesia and Australia. Am.

J. Hum. Genet. 68:173-190.

Kayser, M., Krawczak, M., Excoffier, L., Dieltjes, P., Corach, D., Pascali, V., Gehrig,

C., Bernini, L.F., Jespersen, J., Bakker, E., Roewer, e de Knijff, P. (2001b) An

extensive analysis of Y-chromosomal microsatellite haplotypes in globally dispersed

human populations. Am. J. Hum. Genet. 68 (4): 990-1018.

Kayser, M., Brauer, S., Weiss, G., Schiefenhovel, W., Underhill, P., Shen, P., Oefner,

P., Tommaseo-Ponzetta, M., Stoneking, M. (2003) Reduced Y-chromosome, but not

mitochondrial DNA, diversity in human populations from West New Guinea. Am. J.

Hum. Genet. 72:281-302.

Kimmel, M., Chakraborty, R., King, J. P., Bamshad, M., Watkins, W. S., Jorde, L. B.

(1998) Signatures of population expansion in microsatellite repeat data. Genetics

148, 1921-1930.

Page 178: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

V- Bibliografia

150

Kivisild, T., Villems, R., Jorde, L.B., Bamshad, M., Kumar, S., Hedrick, P., Dowling,

T., Stoneking, M., Parsons, T.J., Irwin, J.A., Awadalla, P., Eyre-Walker, A.,

Maynard, S.J. (2000) Questioning evidence for recombination in human

mitochondrial DNA. Science 288: 1931.

Klein, H.S. (1999) O Comércio Atlântico de Escravos. Quatro séculos de comércio

esclavagista. Lisboa. Editora Replicação, Lda.

Knight, A., Underhill, P.A., Mortensen, H.M., Zhivotovsky, L.A., Lin, A.A., Henn,

B.M., Louis. D., Ruhlen, M., Mountain, J.L. (2003) African Y chromosome and

mtDNA divergence provides insight into the history of click languages. Curr. Biol.

13 (6): 464-473.

de Knijff, P., Kayser, M., Caglia, A., Corach, D., Fretwell, N., Gehrig, C., Graziosi, G.,

Heidorn, F., Herrmann, S., Herzog, B., Hidding, M., Honda, K., Jobling, M.,

Krawczak, M., Leim, K., Meuser, S., Meyer, E., Oesterreich, W., Pandya, A.,

Parson, W., Penacino, G., Perez-Lezaun, A., Piccinini, A., Prinz, M., Roewer, L

(1997) Chromosome Y microsatellites: population genetic and evolutionary aspects.

Int J. Legal. Med. 110 (3): 134-49.

Krausz, C., Quintana-Murci, L., Rajpert-De Meyts, E., Jørgensen, N., Jobling, M.A.,

Rosser, Z.H., Skakkebaek, N.E., e McElreavey, K., (2001) Identification of a Y

chromosome haplogroup associated with reduced sperm counts. Hum. Mol. Genet.

10: 1873-1877.

Krings, M., Salem, A. E., Bauer, K., Geisert, H., Malek, A. K., Chaix, L., Simon, C.,

Welsby, D., Di Rienzo, A., Utermann, G., Sajantila, A., Pääbo, S. & Stoneking, M.

(1999) mtDNA analysis of Nile River Valley populations: A genetic corridor or a

barrier to migration? Am. J. Hum. Genet. 64, 1166-76.

Kumar, S., Hedrick, P., Dowling, T., Stoneking, M (2000) Questioning evidence for

recombination in human mitochondrial DNA. Science 288 (5473): 1931.

Page 179: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

V- Bibliografia

151

Lansman, R.A., Clayton, D.A. (1975). Mitochondrial protein synthesis in mouse L-

cells: effect of selective nicking of mitochondrial DNA. J. Mol. Biol. 99 (4): 777-

793.

Lareu, M. V., Phillips, C. P., Carracedo, A., Lincoln, P. J., Syndercombe Court, D. &

Thomson, J. A. (1994) Investigation of the STR locus HUMTH01 using PCR and

two electrophoresis formats: UK and Galician Caucasian population surveys and

usefulness in paternity investigations. Forensic Sci. Int. 66, 41-52.

Larsson, N.G., Clayton, D.A. (1995) Molecular genetic aspects of human mitochondrial

disorders.Annu Rev Genet. 29: 151-178.

Lightowlers, RN, PF Chinnery, DM Turnbull, and N Howell (1997) Mammalian

mitochondrial genetics: heredity, heteroplasmy and disease. Trends Genet. 13 (11):

450-455.

Lorenzino, G.A. (1998). The Angolar Creole Portuguese of São Tomé: Its Grammar

and Sociolinguistic History. A dissertation submitted to the Graduate Faculty in

Linguistics in partial fulfillment of the requirements for the degree of Doctor of

Philisophy, The City University of New York.

Luís, J.R., Caeiro, B.A. (1995) Application of two STRs (VWF and hTPO) to human

population profiling. A survey in Galicia. Hum. Biol. 67 (5): 789-795.

Macaulay, V., Richards, M., Hickey, E., Vega, E., Cruciani, F., Guida, V., Scozzari, R.,

Bonné-Tamir, B., Sykes, B., Torroni, A. (1999) The emerging tree of West Eurasian

mtDNAs: a synthesis of control-region sequences and RFLPs. Am. J. Hum. Genet.

64, 232-49.

Manco, L., Trovoada, M.J., Abade, A., Amorim, A. (1999) Distribution of AMY2

polymorphism in S.Tomé and Príncipe (West Africa). Int. J. Anthr. 14 (4): 255-258.

Page 180: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

V- Bibliografia

152

Marchington, D.R., Hartshorne, G.M., Barlow, D., Poulton, J. (1997) Homopolymeric

tract heteroplasmy in mtDNA from tissues and single oocytes: support for a genetic

bottleneck. Am. J. Hum. Genet.; 60 (2): 408-416.

Mateu, E., Comas, D., Calafell, F., Perez-Lezaun, A., Abade, A., Bertranpetit, J. (1997)

A tale of two islands: population history and mitochondrial DNA sequence variation

of Bioko and São Tomé, Gulf of Guinea. Ann. Hum. Genet. 61, 507-518.

Nachman, M.W., Crowell, S.L. (2000) Estimate of the Mutation Rate per Nucleotide in

Humans. Genetics. 156: 297-304.

Nascimento, A. (2002) Desterro e Contrato: Moçambicanos a caminho de S. Tomé e

Príncipe (Anos 1940 a 1960). Arquivo Histórico de Moçambique. Colecção

Estudos, 19. 195 pgs. Maputo.

Neves, C.A. (1989) São Tomé e Príncipe na segunda metade do SéculoXVIII. Faculdade

de Ciências Sociais e Humanas. Universidade Nova de Lisboa. Instituto de História

de Além-Mar.

Oliveira, P.M.M. (2001) Caracterização genética de populações Açorianas com base no

estudo de polimorfismos do cromossoma Y. Dissertação de Mestrado em Evolução

Humana. Faculdade de Ciências da Universidade de Coimbra.

Oota, H., Settheetham-Ishida, W., Tiwawech, D., Ishida, T., Stoneking, M. (2001)

Human mtDNA and Y-chromosome variation is correlated with matrilocal versus

patrilocal residence. Nat. Genet. 29 (1): 20-21.

Page, R.D.M. (1996). Treeview: An application to display phylogenetic trees on

personal computers. Computer Applications in the Biosciences. 12: 357-358.

Parsons, T.J., Muniec, D.S., Sullivan, K., Woodyatt, N., Alliston-Greiner, R. Wilson,

M.R., Berry, D.L., Holland, K.A., Weedn, V.W., Gill, P., Holland, M.M. (1997). A

Page 181: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

V- Bibliografia

153

high observed substitution rate in the human mitochondrial DNA control region.

Nat. Genet. 15 (4): 363-368.

Pereira, L., Gusmão, L., Prata, M.J., Mota, P., Trovoada, M.J., Amorim, A. (2000a)

Variation in STR loci of the human myelin basic protein gene: north Portugal and

São Tomé e Príncipe. Hum Biol 72 (3): 481-7.

Pereira, L., Prata, M.J., Amorim, A. (2000b) Diversity of mtDNA lineages in Portugal:

not a genetic edge of European variation. Ann Hum Genet. 64 (Pt 6): 491-506.

Pereira, L., Prata, M.J., Jobling, M.A., Amorim, A, (2000c). Analysis of the Y-

chromosome and mitochondrial DNA pools in Portugal. In Renfrew C, Boyle K

(2000) Archaeogenetics: DNA and the population prehistory of Europe. McDonald

Institute for Archaeological Research, University of Cambridge. Cambridge.

Pereira, L., Macaulay, V., Torroni, A., Scozzari, R., Prata, M.J., Amorim, A. (2001)

Prehistoric and historic traces in the mtDNA of Mozambique: insights into the

Bantu expansions and the slave trade. Ann Hum Genet. 65 (Pt 5): 439-58.

Pereira, L., Gusmão, L., Alves, C., Amorim, A., Prata, M.J. (2002). Bantu and European

Y-lineages in Sub-Saharan Africa. Ann. Hum. Genet. 66 (Pt 5-6): 369-378.

Perez-Lezaun, A., Calafell, F., Seielstad, M., Mateu, E., Comas, D., Bosch, E.,

Bertranpetit, J. (1997) Population genetics of Y-chromosome short tandem repeats

in humans. J. Mol. Evol. 45, 265-270.

Perez-Lezaun, A., Calafell, F., Comas, D., Mateu, E., Bosch, E., Martinez-Arias, R.,

Clarimon, J., Fiori, G., Luiselli, D., Facchini, F., Pettener, D., Bertranpetit, J. (1999)

Sex-specific migration patterns in Central Asian populations, revealed by analysis of

Y-chromosome short tandem repeats and mtDNA. Am. J. Hum. Genet. 65 (1): 208-

219.

Page 182: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

V- Bibliografia

154

Pinto, F.L.V., Carreira, A. (1979) Portuguese participation in the slave trade: opposing

forces, trends of opinion within Portuguese society: effects on Portugal's socio-

economic development. In: The African slave trade from the fifteenth to the

nineteenth century. The general history of Africa. Studies and documents 2. pp. 119–

147. Unesco.

Poulton, J., Macaulay, V, Marchington, D.R. (1998) Mitochondrial genetics '98 is the

bottleneck cracked? Am. J. Hum. Genet. 62 (4): 752-7.

Prata, M.J., Gusmão, L., Silva, F., Amorim, A., Trovoada, M.J., Santos, M.T. (1997)

Population Genetics of the STRs CD4, MBP (locus B), THO1, TP53, TPO and

VWA31/A in S.Tomé e Príncipe. Proceedings of ISFH Symposium on DNA

polymorphisms, 1996, Japan: 420-423.

Pritchard, J.K., Seielstad, M.T., Perez-Lezaun, A., Feldman, M.W. (1999) Population

growth of human Y chromosomes: a study of Y chromosome microsatellites. Mol.

Biol. Evol. 16: 1791-1798.

Pritchard, J.K, Stephens, M., Donnelly, P. (2000) Inference of Population Structure

Using Multilocus Genotype Data. Genetics. 155: 945 - 959.

Quintana-Murci, L., Fellous, M. (2001) The Human Y Chromosome: The Biological

Role of a "Functional Wasteland". J. Biomed. Biotechnol. 1 (1): 18-24.

Rando, J.C., Pinto, F., Gonzalez, A.M., Hernandez, M., Larruga, J.M., Cabrera, V.M.,

Bandelt, H.J. (1998) Mitochondrial DNA analysis of northwest African populations

reveals genetic exchanges with European, near-eastern, and sub-Saharan

populations. Ann Hum Genet 62 (Pt 6): 531-550.

Relethford, J.H. (1998) Mitochondrial DNA and ancient population growth. Am. J.

Phys. Anthropol. 105 (1): 1-7.

Richards, M., Macaulay, V., Hickey, E., Vega, E., Sykes, B., Guida, V., Rengo, C.,

Sellitto, D., Cruciani, F., Kivisild, T., Villems, R., Thomas, M., Rychkov, S.,

Page 183: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

V- Bibliografia

155

Rychkov, O., Rychkov, Y., Golge, M., Dimitrov, D., Hill, E., Bradley, D., Romano,

V., Cali, F., Vona, G., Demaine, A., Papiha, S., Triantaphyllidis, C., Stefanescu, G.,

Hatina, J., Belledi, M., Di Rienzo, A., Novelletto, A., Oppenheim, A., Norby, S., Al-

Zaheri, N., Santachiara-Benerecetti, S., Scozari, R., Torroni, A., Bandelt, H.J.

(2000) Tracing European founder lineages in the Near Eastern mtDNA pool. Am. J.

Hum. Genet. 67 (5): 1251-1276.

Richards, M., Rengo, C., Cruciani, F., Gratrix, F., Wilson, J.F., Scozzari, R., Macaulay,

V. Torroni, A. (2003) Extensive female-mediated gene flow from sub-Saharan

Africa into near eastern Arab populations. Am. J. Hum. Genet. 72 (4): 1058-1064.

Rosser, Z.H., Zerjal, T., Hurles, M.E., Adojaan, M., Alavantic, D., Amorim, A., Amos,

W., Armenteros, M., Arroyo, E., Barbujani, G., Beckman, G., Beckman, L.,

Bertranpetit, J., Bosch, E., Bradley, D.G., Brede, G., Cooper, G., Corte-Real, H.B.,

de Knijff, P., Decorte, R., Dubrova, Y.E., Evgrafov, O., Gilissen, A., Glisic, S.,

Golge, M., Hill, E.W., Jeziorowska, A., Kalaydjieva, L., Kayser, M., Kivisild, T.,

Kravchenko, S.A., Krumina, A., Kucinskas, V., Lavinha, J., Livshits, L.A.,

Malaspina, P., Maria, S., McElreavey, K., Meitinger, T.A., Mikelsaar, A.V.,

Mitchell, R.J., Nafa, K., Nicholson, J., Norby, S., Pandya, A., Parik, J., Patsalis,

P.C., Pereira, L., Peterlin, B., Pielberg, G., Prata, M.J., Previdere, C., Roewer, L.,

Rootsi, S., Rubinsztein, D.C., Saillard, J., Santos, F.R., Stefanescu, G., Sykes, B.C.,

Tolun, A., Villems, R., Tyler-Smith, C., Jobling, M.A. (2000) Y-chromosomal

diversity in Europe is clinal and influenced primarily by geography, rather than by

language. Am. J. Hum. Genet. 67 (6): 1526-1543.

Rozen, S, Skaletsky, H, Marszalek, JD, Minx, PJ, Cordum, HS, Waterston, RH, Wilson,

R.K., e Page, D.C. (2003) Abundant gene conversion between arms of palindromes

in human and ape Y chromosomes. Nature 423 (6942): 873-876.

Saitou, N., Nei, M. (1987) The neighbour-Joining method: a new method for

reconstructing phylogenetic tree. Mol. Biol. Evol. 4: 406.

Page 184: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

V- Bibliografia

156

Salas, A., Richards, M., De la Fe, T., Lareu, M.V., Sobrino, B., Sanchez-Diz, P.,

Macaulay, V., Carracedo, A. (2002) The making of the African mtDNA landscape.

Am. J. Hum. Genet. 71 (5): 1082-1111.

Sánchez-Diz, P. (2003) Polimorfismos de cromosoma Y: aspectos genético-

poblacionales y evolutivos y aplicaciones forenses. Tesis doctoral. Universidade de

Santiago de Compostela.

Santibáñez-Koref, M.F., Rathithevy Gangeswaran, and John M. Hancock (2001) A

Relationship Between Lengths of Microsatellites and Nearby Substitution Rates in

Mammalian Genomes. Mol. Biol. Evol. 18: 2119-2123.

Santos, M.F., Amorim, A., Manco. L., Trovoada, M.J. (1996) Plasma protein markers in

São Tomé e Príncipe. Adv Forens Haemogenet 6: 444-445.

Santos, C., Lima, M., Montiel, R., Angles, N., Pires, L., Abade, A., Aluja, M.P. (2003)

Genetic structure and origin of peopling in the Azores islands (Portugal): the view

from mtDNA. Ann. Hum. Genet. 67(Pt 5): 433-456.

Schneider, S., Excoffier, L. (1999) Estimation of past demographic parameters from the

distribution of pairwise differences when themutation rates vary among sites:

application to human mitochondrial DNA. Genetics. 152 (3),1079 -1089.

Schneider, S; Roessli, D., Excoffier, L. (2000) ARLEQUIN: A software for population

genetics data analysis. Ver 2.000. Genetics and Biometry . Lab, Dept. of

Anthropology, University of Geneva.

Schwartz, M., Vissing, J. (2003) New patterns of inheritance in mitochondrial disease.

Biochem. Biophys. Res. Commun. 310 (2): 247-251.

Scozzari, R., Cruciani, F., Santolamazza, P., Malaspina, P., Torroni, A., Sellitto, D.,

Arredi, B., Destro-Bisol, G., De Stefano, G., Rickards, O., Martinez-Labarga,

Modiano, D., Biondi, G., Moral, P., Olckers, A., Wallace, D.C., Novelletto. (1999)

Page 185: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

V- Bibliografia

157

A. Combined use of biallelic and microsatellite Y-chromosome polymorphisms to

infer affinities among African populations. Am. J. Hum. Genet.. 65 (3): 829-846.

Scozzari, R., Cruciani, F., Pangrazio, A., Santolamazza, P., Vona, G., Moral, P., Latini,

V., Varesi, L., Memmi, M.M., Romano, V., De Leo, G., Gennarelli, M., Jaruzelska,

J., Villems, R., Parik, J., Macaulay, V., Torroni, A. (2001) Human Y-chromosome

variation in the western Mediterranean area: implications for the peopling of the

region. Hum. Immunol. 62 (9): 871-84.

Seibert, G. (1998) A Questão da Origem dos Angolares de São Tomé. Brief Papers

nº5/98, CEsA, Lisboa.

Seielstad, M.T., Hebert, J.M., Lin, A.A., Underhill, P.A., Ibrahim, M., Vollrath, D.,

Cavalli- Sforza, L.L. (1994) Construction of human Y-chromosomal haplotypes

using a new polymorphic A to G transition. Hum. Mol. Genet. 3: 2159 - 2161.

Seielstad, M.T., Minch, E., Cavalli-Sforza, L.L. (1998). Genetic evidence for a higher

female migration rate in humans. Nat. Genet. 20 (3): 278-280.

Seixas, S., Trovoada, M.J., Rocha, J. (1999) Haplotype analysis of the apolipoprotein E

and apolipoprotein C1 loci in Portugal and São Tomé e Príncipe (Gulf of Guinea):

linkage disequilibrium evidence that APOE*4 is the ancestral APOE allele. Hum.

Biol. 71 (6): 1001-1008.

Semino, O., Passarino, G., Brega, A., Fellous, M., Santachiara-Benerecetti, A.S. (1996)

A view of the neolithic demic diffusion in Europe through two Y chromosome-

specific markers. Am. J. Hum. Genet. 59 (4): 964-968.

Semino, O., Santachiara-Benerecetti, A.S., Falaschi, F., Cavalli-Sforza, L.L., Underhill,

P.A.( 2002) Ethiopians and Khoisan share the deepest clades of the human Y-

chromosome phylogeny. Am. J. Hum. Genet. 70 (1): 265-268.

Page 186: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

V- Bibliografia

158

Shadel, G.S., Clayton, D.A. (1997) Mitochondrial DNA maintenance in vertebrates.

Annu. Rev. Biochem. 66: 409-435.

Shields, G.F., Schmiechen, A.M., Frazier, B.L., Redd, A., Voevoda, M.I., Reed, J.K.,

Ward, R.H. (1993) mtDNA sequences suggest a recent evolutionary divergence for

Beringian and northern North American populations. Am. J. Hum. Genet. 53 (3):

549-562

Sigurðardóttir, S., Helgason, A., Gulcher, J.R., Stefansson, K., Donnelly, P. (2000) The

mutation rate in the human mtDNA control region. Am J Hum Genet 66 :1599–1609

Skaletsky, H., Kuroda-Kawaguchi, T., Minx, P.J., Cordum, H.S., Hillier, L., Brown,

L.G., Repping, S., Pyntikova, T., Ali, J., Bieri, T., Chinwalla, A., Delehaunty, A.,

Delehaunty, K., Du, H., Fewell, G., Fulton, L., Fulton, R., Graves, T., Hou, S.F.,

Latrielle, P., Leonard, S., Mardis, E., Maupin, R., McPherson, J., Miner, T., Nash,

W., Nguyen, C., Ozersky, P., Pepin, K., Rock, S., Rohlfing, T., Scott, K., Schultz,

B., Strong, C., Tin-Wollam, A., Yang, S.P., Waterston, R.H., Wilson, R.K., Rozen,

S., Page, D.C. (2003) The male-specific region of the human Y chromosome is a

mosaic of discrete sequence classes. Nature. 423 (6942): 825-837.

Smith, G.P. (1976) Evolution of repeated DNA sequences by unequal crossover.

Science 191 (4227): 528-535.

Soodyall, H., Vigilant, L., Hill, A.V., Stoneking, M., Jenkins, T. (1996) mtDNA

control-region sequence variation suggests multiple independent origins of an

"Asian-specific" 9-bp deletion in sub-Saharan Africans. Am. J. Hum. Genet. 58:595-

608.

Sphuhler, J.N. (1988) Evolution of mitochondrial DNA in monkeys, apes, and humans.

Y. Phys. Anthropol. 31: 15-48.

Stephan, W. (1989) Tandem-repetitive noncoding DNA: forms and forces. Mol. Biol.

Evol. 6: 198-212.

Page 187: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

V- Bibliografia

159

Sutovsky, P., Moreno, R.D., Ramalho-Santos, J., Dominko, T., Simerly, C., Schatten,

G. (2000) Ubiquitinated Sperm Mitochondria, Selective Proteolysis, and the

Regulation of Mitochondrial Inheritance in Mammalian Embryos. Biol. Reprod. 63:

582-590.

Sykes, B., Irven, C. (2000) Surnames and the Y chromosome. Am. J. Hum. Genet. 66

(4): 1417-1419.

Tang, H., Siegmund, D.O., Shen, P., Oefner, P.J., Feldman, M.W. (2002) Frequentist

Estimation of Coalescence Times From Nucleotide Sequence Data Using a Tree-

Based Partition. Genetics 161: 447-459.

Tautz, D., Schlötterer (1994) Simple sequences. Curr. Opin. Genet. 4 (6): 832-837.

Tenreiro, F. (1961) A ilha de São Tomé. Memórias da Junta de Investigações do

Ultramar. Lisboa.

Thomas, M,G., Parfitt, T., Weiss, D.A., Skorecki, K., Wilson, J.F., le Roux, M.,

Bradman, N., Goldstein, D.B. (2000) Y chromosomes traveling south: the cohen

modal haplotype and the origins of the Lemba--the "Black Jews of Southern

Africa". Am. J. Hum. Genet. 66 (2): 674 - 686.

Tilford, C.A., Kuroda-Kawaguchi, T., Skaletsky, H., Rozen, S., Brown, L.G.,

Rosenberg, M., McPherson, J.D., Wylie, K., Sekhon, M., Kucaba, T.A., Waterston,

R.H., Page, D.C. (2001). A physical map of the human Y chromosome. Nature 409

(6822): 943-945.

Tishkoff, S.A., Williams, S.M. (2002). Genetic analysis of African populations: human

evolution and complex disease. Nat. Rev. Genet. 3 (8): 611-621.

Tomás, G., Seco, L., Seixas, S., Faustino, P., Lavinha, J., Rocha, J. (2002) The peopling

of São Tomé (Gulf of Guinea): origins of slave settlers and admixture with the

Portuguese. Hum. Biol. 74 (3): 397-411.

Page 188: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

V- Bibliografia

160

Thomson, R., Pritchard, J.K., Shen, P., Oefner, P.J., Feldman M.W. (2000). Recent

common ancestry of human Y chromosomes: Evidence from DNA sequence data

Proc. Natl. Acad. Sci. USA 97: 7360 - 7365.

Torroni, A., D'Urbano, L., Rengo, C., Scozzari, R., Sbracia, M., Manna, C., Cavazzini,

C. e Sellitto, D. (1998) Intracytoplasmic injection of spermatozoa does not appear to

alter the mode of mitochondrial DNA inheritance. Hum. Reprod. 13: 1747-1749.

Trovoada, M.J., Manco, L., Amorim, A., Abade, A., Prata, M.J., Santos, M.T. (2001)

Polimorfismos Genéticos de ESD, GLO1, GPT e PGM1 em São Tomé e Príncipe.

Antropologia Portuguesa 18: 143-150.

Underhill, P.A., Shen, P., Lin, A.A., Jin, L., Passarino, G., Yang, W.H., Kauffman, E.,

Bonne-Tamir, B., Bertranpetit, J., Francalacci, P., Ibrahim, M., Jenkins, T., Kidd,

J.R., Mehdi, S.Q., Seielstad, M.T., Wells, R.S., Piazza, A., Davis, R.W., Feldman,

M.W., Cavalli-Sforza, L.L., e Oefner, P.J. (2000) Y chromosome sequence variation

and the history of human populations. Nat. Genet. 26 (3): 358-361.

Underhill, P.A., Passarino, G., Lin, A.A., Shen, P., Lahr, M.M., Foley, R.A., Oefner,

P.J. e Cavalli-Sforza, L.L. (2001) The phylogeography of Y chromosome binary

haplotypes and the origins of modern human populations. Ann. Hum. Genet. 65 (Pt

1): 43-62.

Valdes, AM, Slatkin, M, Freimer, NB (1993) Allele Frequencies at Microsatellite Loci:

The Stepwise Mutation Model Revisited. Genetics. 133: 737-749.

Veitia, R., Ion, A., Barbaux, S., Jobling, MA., Souleyreau, N., Ennis, K., Ostrer, H.,

Tosi, M., Meo, T., Chibani, J., Fellous, M., McElreavey K. (1997) Mutations and

sequence variants in the testis-determining region of the Y chromosome in

individuals with a 46,XY female phenotype. Hum. Genet. 99 (5): 648-52.

Page 189: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

V- Bibliografia

161

Vigilant, L., Pennington, R., Harpending, H., Kocher, T.D., Wilson, A.C. (1989)

Mitochondrial DNA sequences in single hairs from a southern African population.

Proc. Natl. Acad. Sci. USA. 86 (23): 9350-9354.

Vigilant, L., Stoneking, M., Harpending, H., Hawkes, K., Wilson, A.C. (1991) African

populations and the evolution of human mitochondrial DNA. Science 253 (5027):

1503-1507.

Wakeley, J. (1993) Substitution rate variation among sites in hypervariable region 1 of

human mitochondrial DNA. J. Mol. Evol. 37 (6): 613-23.

Wallace, D.C. (1994) Mitochondrial DNA sequence variation in human evolution and

disease. Proc. Nat. Acad. Sci. USA. 91: 8739-8746.

Watson, E., Bauer, K., Aman, R., Weiss, G., von Haeseler, A., Paabo, S. (1996) mtDNA

sequence diversity in Africa. Am. J. Hum. Genet. 59 (2): 437-44.

Watson, E., Forster, P., Richards, M., Bandelt, H.J. (1997) Mitochondrial footprints of

human expansions in Africa. Am. J. Hum. Genet. 61 (3): 691-704.

Zerjal, T., Dashnyam, B., Pandya, A., Kayser, M., Roewer, L., Santos, F.R.,

Schiefenhovel, W., Fretwell, N., Jobling, M.A., Harihara, S., Shimizu, K.,

Semjidmaa, D., Sajantila, A., Salo, P., Crawford, M.H., Ginter, E.K., Evgrafov,

O.V., Tyler-Smith, C. (1997) Genetic relationships of Asians and Northern

Europeans, revealed by Y-chromosomal DNA analysis. Am. J. Hum. Genet. (60 (5):

1174-83.

Page 190: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

VI – APÊNDICES

___________________________________________

Page 191: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

VI-Apêndices

165

Apêndice 1 - Frequências de haplogrupos definidos por marcadores bialélicos utilizadas na análise de componentes principais

Haplogrupo

População K

J P CR

*(xD

E,J,K

)

E*(x

E3a)

E3a

B2a

B2b

B*(

xB2a

,b)

A

Angolares(1) 0.089 0.036 0.036 0.786 0.054

Forros(1) 0.179 0.051 0.103 0.667

Tongas(1) 0.091 0.091 0.091 0.591 0.023 0.091 0.023

Árabes(2) 0.200 0.020 0.020 0.760

Berberes(2) 0.060 0.050 0.820 0.050 0.030

Biaka(3) 0.650 0.050 0.300

Cabo Verde(4) 0.100 0.109 0.229 0.095 0.284 0.159 0.025

Galiza(5) 0.076 0.151 0.566 0.094 0.113 0.000

Guiné(4) 0.227 0.713 0.060

Maghrebis(5) 0.050 0.250 0.050 0.600 0.050

Moçambique(6) 0.017 0.086 0.749 0.096 0.046 0.003 0.003

Portugal(7) 0.050 0.090 0.590 0.190 0.080

Senegal(8) 0.014 0.172 0.813

Ju, Ju|´hoansi (3) 0.004 0.103 0.179 0.282 0.436

Khwe(9) 0.350 0.540 0.120

(1)- Este trabalho; (2)- Scozzari et al., 2001; (3)- Underhill et al., 2000; (4)- Gonçalves et al., 2003; (5)- Brion et al., 2003; (6) Sánchez-Diz, 2003; (7)- Sandra Beleza, comunicação pessoal; (8)- Semino et al., 2002; (9)- Cruciani et al., 2002.

Page 192: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de
Page 193: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

VI-Apêndices

167

Apêndice 2 - Haplótipos de STRs dentro de haplogrupos definidos por marcadores bialélicos do Y em amostras de Angolares, Forros e Tongas.

Haplogrupo DYS19 DYS389I DYS389II DYS390 DYS391 DYS392 DYS393 An Fo To

E3a

12 10 18 21 11 11 13 1

13 10 18 21 10 11 13 1

15 9 17 21 10 11 14 1

15 10 16 21 10 11 14 1

15 10 17 21 10 10 13 1

15 10 17 21 10 11 12 1

15 10 17 21 10 11 13 1

15 10 17 21 10 11 14 1 2

15 10 17 21 10 11 15 2 2

15 10 17 21 11 11 13 2

15 10 17 21 12 11 13 1

15 10 17 22 10 11 15 2

15 10 18 21 10 11 13 1 1 2

15 10 19 21 10 11 13 1 1

15 10 18 21 10 11 14 1

15 10 18 21 11 11 13 4 4 4

15 11 17 21 10 11 13 1 1

15 11 17 21 10 11 14 1

15 11 17 21 10 11 15 1

15 11 17 22 10 11 13 1

16 9 17 21 10 11 14 1

16 9 18 22 11 11 13 1

16 10 16 21 10 11 15 1

16 10 16 21 11 11 12 1

16 10 17 21 10 11 13 1

16 10 17 21 10 11 14 2

16 10 17 21 10 11 15 1

16 10 18 21 11 11 13 1

16 11 18 21 10 11 13 1

17 10 17 21 10 11 14 2 2

17 10 17 21 10 11 17 1

17 11 17 21 10 11 14 2

17 11 17 21 10 11 15 1

18 11 17 21 10 11 14 1

B*(xB2a,b)

14 9 17 22 11 11 14 1

16 10 18 20 11 12 13 1

B2a1

15 11 18 25 10 11 13 1

Page 194: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

V- Apêndices

168

Apêndice 2 (continuação) B2b 15 8 15 23 10 12 13 2

E*(xE3a)

13 9 17 24 10 11 13 1

13 10 17 24 10 11 13 1

13 10 17 24 11 11 13 1

13 10 18 24 10 11 12 1

14 10 18 24 10 11 13 1

14 11 17 23 9 11 13 1

15 9 18 23 12 11 14 1

16 10 16 24 10 11 13 1

P*(xR1a,R1b3f)

14 10 16 24 10 13 13 1

14 10 16 24 10 13 14 1

14 10 16 24 11 13 13 1

14 10 16 26 11 13 13 1

14 11 17 24 11 13 13 1

15 9 15 24 11 13 13 1

15 10 16 24 10 13 13 1

16 10 18 25 11 11 14 1

CR*(xDE,J,K)

14 9 16 24 11 13 13 1

14 11 17 23 10 11 12 2

15 9 16 22 10 11 13 1

17 10 18 23 10 14 13 1

16 32 40

Page 195: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de
Page 196: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

Apêndice 3 - Frequência de haplogrupos definidos por mtDNA em amostras de Angolares, Forros e Tongas.

Ang

olar

es

Forr

os

Tong

as HVS-I HVS-II

Hap

logr

upo

1 148 172 187 188C/G 189 223 230 311 320 93 152 189 204 207 236 247 263 315.1 L1a 1 129 148 168 172 187 188C/G 189 209 213 223 230* 93 185 189 236 247 263 309.1 315.1 L1a1 1 93 129 148 168 172 187 188C/G 189 223 230 278 293 311 320 93 95A/C 185 189 236 247 263 315.1 L1a1a 2 129 148 168 172 187 188C/G 189 223 230 278 293 311 320 93 95A/C 185 189 236 247 263 309.1 315.1 320 L1a1a 1 1 129 148 168 172 187 188C/G 189 223 230 311 320 93 185 189 236 247 263 315.1 L1a1a 2 1 126 187 189 223 264 270 278 311 73 152 182 185G/T 195 247 263 315.1 357 L1b 3 1 111 126 187 189 223 239 270 278 293 311 73 146 152 182 185G/T 189 247 263 315.1 357 L1b1 1 111 187 189 223 239 270 278 293 311 73 146 152 182 185G/T 189 247 263 315.1 357 L1b1 1 114C/A 126 189 223 264 270 274 278 293 311 73 152 182 185G/T 195 247 263 309.1 315.1 357 L1b1 1 114C/G 126 187 189 223 264 270 278 293 311 73 152 182 185G/T 195 247 263 315.1 357 L1b1 1 126 187 189 223 264 270 278 293 311 73 152 182 185G/T 189 195 247 263 309.1 315.1 357 L1b1 2 126 187 189 223 264 270 278 293 311 73 152 182 185G/T 189 195 247DelG 263 309.1 315.1 357 L1b1 1 129 163 187 189 209 223 278 293 294 298 311 360 73 152 182 186C/A 189A/C 194 198 247DelG 263 309.1 315.1 316 L1c1 1 129 163 187 189 223 278 293 294 304 311 360 73 151 152 182 186C/A 189A/C 195 247 263 315.1 316 L1c1 1 129 163 187 189 223 278 293 294 304 311 360 73 151 152 182 186C/A 189A/C 195 198 247 263 315.1 316 L1c1 1 129 187 189 223 278 293 294 311 360 73 152 186C/A 189 195 247 250T/G* L1c1 1 93 129 187 189 223 263 278 293 294 311 360 368 73 151 152 182 186C/A 189A/C 195 247 263 297 315.1 316 L1c1 1 93 129 187 189 223 263 278 293 294 311 360 368 73 182 186C/A 189A/C 195 247 263 297 315.1 316 L1c1 2 129 187 189 223 274 278 293 294 311 360 73 93 95A/C 152 182 186C/A 189A/C 195 236 247 263 297 315.1 316 L1c1a 1 129 187 189 223 274 278 293 294 311 360 73 95A/C 152 182 186C/A 189A/C 195 236 247 263 297 315.1 316 L1c1a 1 129 187 189 214 234 249 258 274 278 293 294 311 73 151 152 186C/A 189A/C 195 247 263 297 315.1 316 L1c1a11 51 129 187 189 214 234 249 258 274 278 293 294 311 73 186C/A 189A/C 195 247 263 297 315.1 316 L1c1a11 129 163 187 189 265A/C 278 286C/G 294 311 320 360 73 151 152 186C/A 189A/C 195 198 247 263 297 315.1 316 L1c2 1 129 187 189 214 223 265A/C 278 286C/A 291 294 311 360 73 151 152 182 186C/A 189A/C 195 198 247 263 297 315.1 316 L1c2 2 129 187 189 223 265A/C 278 286C/G 294 311 343A/T 360 73 151 152 182 186C/A 189A/C 195 198 247 263 297 315.1 316 L1c2 3 129 187 189 223 265A/C 286C/A 292 294 311 360 73 152 182 186C/A 189A/C 195 198 247 263 297 309.1 315.1 316 L1c2 1 172 187 189 223 265A/C 278 286C/G 294 311 360 73 151 152 182 186C/A 189A/C 195 198 247 263 297 309.1 315.1 316 L1c2 2 129 183A/C 189 215 223 278 294 311 360 73 152 182 186C/A 189A/C 247 263 309.1 315.1 316 L1c3

Page 197: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

Apêndice 3 (continuação)

1 (42) 129 166 187 189 223 254 278 311 73 146 152 182 195 198 247 263 315.1 L1e 1 111 223 278 294 309 311 390 73 152 195 315.1 L2a1 1 129 223 278 294 309 390 73 143 146 152 195 263 315.1 L2a1 1 189 192 223 239C/A 278 279C/A 294 309* 73 195 263 315.1 L2a1 1 189 192 223 278 294 309 390 73 143 146 152 195 263 309.1 315.1 L2a1 2 189 192 223 278 294 309 390 73 146 152 195 263 309.1 315.1 L2a1 1 193 213 223 239 278 294 309 390 73 146 152 195 263 309 309.1 315.1 L2a1 1 223 278 294 309 390 73 143 146 152 195 198 263 309.1 315.1 L2a1 2 223 278 294 309 390 73 146 152 195 263 309.1 315.1 L2a1 2 223 278 286 294 309 390 73 146 152 195 263 309.1 315.1 L2a1a 2 114C/A 129 213 223 278 355 362 390 73 150 152 182 195 198 204 249DelA 263 309.1 315.1 L2b1 1 114C/A 213 223 278 362 390 73 150 152 182 195 198 204 263 315.1 L2b1 2 81 93 175 223 278 320 390 73 146 150 182 195 198 263 309.1 315.1 325 L2c 1 81 93 175 223 278 320 390 73 93 146 150 182 195 198 263 309.1 315.1 325 L2c 1 114 223 278 318 390 73 93 146 150 152 182 195 198 263 309.1 315.1 325 L2c1 1 223 264 278 390 73 146 150 152 182 195 198 263 309.1 315.1 325 L2c2 1 84 93 220 223 264 278 311 390 73 93 146 150 152 182 195 198 263 315.1 325 L2c2 1 93 223 264 278 390 73 93 146 150 152 182 195 198 263 309.1 315.1 325 L2c2 1 111C/A 145 184 223 239 278 292 355 390 73 146 150 152 182 263 315.1 L2d2 1 1 223 290 355 73 150 152 235 263 309.1 315.1 L3* 1 223 278 362 73 263 315.1 L3b 1 124 183A/C 189 214 223 278 73 263 309.1 315.1 L3b1 2 124 223 278 362 73 263 315.1 L3b1 1 124 223 278 311 362 73 257 263 309.1 315.1 L3b2 1 124 223 311 73 101G/C 150 152 263 309.1 315.1 L3d 3 124 223 311 73 152 200 263 309.1 315.1 L3d 1 124 209 223 319 362 73 152 263 315.1 (385) L3d1 1 124 223 300 319 73 152 263 315.1 L3d1 1 104 129 183A/C 189 223 260 327 73 150 263 309.1 315.1 L3e1* 8 172 223 327 (399) 73 150 189 200 207 263 309.1 315.1 L3e1* 1 207 223 327 73 150 183 189 200 263 309.1 315.1 L3e1* 1 223 325DelT 327 73 150 185 189 209 263 309.1 315.1 L3e1* 1 185 209 223 327 73 150 152 189 195 200 263 309.1 315.1 L3e1a 1 223 258A/T 320 73 150 189 195 315.1 L3e2a

Page 198: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

Apêndice 3 (continuação)

1 223 320 73 150 195 198 263 309.1 315.1 L3e2a 1 2 223 320 73 150 195 198 263 315.1 L3e2a 1 126 172 182A/C 183A/C 189 223 320 73 150 195 263 315.1 L3e2b 1 1 223 265A/T 73 150 195 263 315.1 L3e3 1 51 223 264 73 150 263 309.1 315.1 L3e4 1 51 223 264 299 73 150 263 309.1 315.1 L3e4 1 129 209 223 311 73 189 200 263 315.1 L3f 1 209 223 311 73 150 189 200 263 309.1 315.1 L3f 1 209 215 223 256 292 311 73 185 189 195 263 309.1 315.1 L3f1

Page 199: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de
Page 200: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

ARTIGO 1

Page 201: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

ARTIGO 2

Page 202: CARACTERIZAÇÃO GENÉTICA DE SÃO TOMÉ E PRÍNCIPE COM …ms.gov.st/wp-content/uploads/2019/09/MJTrovoada-PhDThesis.pdf · da Universidade de Coimbra para obtenção do grau de

ARTIGO 3