Apostila de Genetica Vegetal 2006-2

1

Universidade Federal Rural do Rio de janeiro

Instituto de Biologia

Departamento de Genética

GENÉTICA VEGETAL

MAURICIO BALLESTEIRO PEREIRA

ANA LÚCIA CUNHA DORNELLES

Sumário.

1. INTRODUÇÃO: MENDEL, O INÍCIO DA GENÉTICA

2. FUNDAMENTOS DE GENÉTICA MOLECULAR

2.1. ESTRUTURA DO DNA

2.2. REPLICAÇÃO DO DNA

2.3. TRANSCRIÇÃO DO DNA

2.4. TRADUÇÃO – SÍNTESE DE PROTEÍNAS

3. GENÉTICA DE POPULAÇÕES

3.1. DEFINIÇÃO DE POPULAÇÃO

3.2. FREQÜÊNCIA GÊNICA E GENOTÍPICA

3.3. PADRÕES REPRODUTIVOS DAS POPULAÇÕES

3.4. FREQÜÊNCIAS EM UMA POPULAÇÃO PANMÍTICA.

3.5. FREQÜÊNCIAS EM UMA POPULAÇÃO ENDOGÂMICA

3.6. FREQÜÊNCIAS EM UMA POPULAÇÃO EXOGÂMICA

3.7. FATORES QUE AFETAM AS FREQÚÊNCIAS GÊNICAS DAS

POPULAÇÕES.

3.7.1. MUTAÇÃO GÊNICA

3.7.2. MIGRAÇÃO GENÉTICA.

3.7.3. OSCILAÇÃO GENÉTICA.

3.7.4. SELEÇÃO.

3.8. VARIÂNCIA E MÉDIA DA POPULAÇÃO. EFEITO MÉDIO DA

SUBSTITUIÇÃO DO GENE.

3.9. VALOR REPRODUTIVO, VALOR GENÉTICO OU VALOR ADITIVO

2

4. CARACTERES QUANTITATIVOS

4.1. SISTEMAS DE GENES

4.2. PROPRIEDADES DO CARÁTER QUANTITATIVO

4.2.1. CONTROLE POR MUITOS PARES DE GENES

4.2.2. EFEITOS PEQUENOS POR GENES SOBRE O FENÓTIPO

4.2.3. AÇÃO GÊNICA

4.2.4. AÇÃO DO AMBIENTE

4.2.5. DISTRIBUIÇÃO DE FREQÜÊNCIAS

5. COMPONENTES DA VARIÂNCIA FENOTÍPICA.

5.1. VARIÂNCIA GENOTÍPICA E VARIÂNCIA AMBIENTE. CONCEITO

DE VALOR FENOTÍPICO E VALOR GENOTÍPICO.

5.2. COMPONENTES DA VARIÂNCIA GENOTÍPICA. VARIÂNCIA

ADITIVA, VARIÂNCIA DE DOMINÂNCIA E VARIÂNCIA EPISTÁTICA. VALOR

ADITIVO

6. CORRESPONDÊNCIA ENTRE FENÓTIPO E GENÓTIPO.

6.1. CORRELAÇÃO ENTRE VALOR FENOTÍPICO E VALOR GENOTÍPICO.

COEFICIENTE DE DETERMINAÇÃO.

6.2. REGRESSÃO DO VALOR GENOTÍPICO SOBRE O VALOR

FENOTÍPICO. HERDABILIDADE NO SENTIDO AMPLO.

6.3. REGRESSÃO DO VALOR ADITIVO SOBRE O VALOR FENOTÍPICO.

HERDABILIDADE NO SENTIDO RESTRITO.

7. SEMELHANÇA ENTRE PARENTES.

7.1. PARENTESCO GENÉTICO

7.2. COVARIÂNCIA ENTRE INDIVÍDUOS APARENTADOS.

8. PROGRESSO GENÉTICO POR SELEÇÃO.

8. CORRELAÇÃO INTRA-CLASSE. REPETIBILIDADE.

9. ESTIMAÇÃO DA HERDABILIDADE NO SENTIDO RESTRITO

10. GRAU MÉDIO DE DOMINÂNCIA

3

1. INTRODUÇÃO: MENDEL, O INÍCIO DA GENÉTICA

Desde a Antigüidade, os seres humanos perceberam as semelhanças entre parentes,

principalmente no que diz respeito a pais e filhos. Diversas explicações foram sendo utilizadas à medida

que o nível de conhecimento humano foi se alterando. Uma explicação muito popular até ao início deste

século era a de que a herança dos caracteres se dava por fluidos orgânicos existentes no sangue e que

passavam de pais para filhos. Contribuía para essa hipótese as observações de que em muitos

caracteres os filhos apresentavam valores intermediários aos pais. Além disso, os filhos apresentavam

uma mistura de características dos pais.

Em 1866, Gregor Mendel publicou os resultados de uma pesquisa que, pela primeira vez

elucidou a herança de caracteres. Mendel trabalhou com ervilhas de jardim, Pisum sativa L., uma planta

autógama de alta variabilidade. O seu procedimento altamente criterioso permitiu resultados claros para

sete caracteres dessa planta, que seguiam um padrão semelhante.

Para o seu trabalho Mendel escolheu plantas que por várias gerações produziram sempre

características inalteradas, por isso afirmou que elas eram puras para essas características, e pelo

cruzamento de plantas com características diferentes pode estabelecer o padrão de herança.

Por exemplo, ele tomou plantas puras para a característica “cor da semente”, que pode ser verde

ou amarela. Cruzou plantas puras para essas características, obtendo uma geração híbrida, que

posteriormente foi chamada F1. Todas as plantas da F1 tinham sementes verdes. A seguir

autofecundou as plantas F1, obtendo a geração F2. Essa geração apresentou plantas com sementes

verdes e amarelas na proporção 3 para 1, aproximadamente. Depois Mendel autofecundou ainda as

plantas F2, colhendo separadamente cada planta, e percebeu que todas as plantas com sementes

amarelas (1/4 do total) produziram somente plantas com sementes amarelas, mas entre as plantas com

sementes verdes (3/4 do total) 1/4 produziram somente plantas com sementes verdes, mas 2/4

produziram a proporção 3 para 1 de sementes verdes e amarelas.

Para explicar os resultados Mendel supôs que as plantas paternas com sementes verdes tinham

um fator (hoje chamamos gene), para determinação desse fenótipo. Assim como as plantas paternas

com sementes amarelas tinham um fator para o fenótipo sementes amarelas. As plantas F1 tinham o

fator para sementes verdes, já que apresentavam esse fenótipo, mas deveriam ter também o fator para

sementes amarelas, já que seus descendentes apresentavam esse fenótipo. Deduziu então que todas

plantas deveriam ter dois fatores, já que as F1 tinham, e que as plantas puras tinham fatores iguais

(homozigotas). Deduziu também que esses fatores não se misturavam pois em F2 apareceram plantas

puras filhas de F1 que tinha os dois fatores. Pelo resultado do F2 deduziu que os fatores se separavam

na gametogênese e se combinavam de novo, ao acaso, na fecundação.

4

Esquematicamente:

Geração Paterna

P1

(sementes verdes)

x P2

(sementes amarelas)

AA x aa

Determinantes A a

Geração F1

100% sementes verdes Aa x Aa

Determinantes A e a A e a

Geração F2

1/4 AA

sementes verdes puras

1/2 Aa

sementes verdes híbridas

1/4 aa

sementes amarelas puras

Como vimos anteriormente, Mendel apresentou os resultados de sete caracteres, todos com o

mesmo padrão de herança. A análise conjunta de dois caracteres apresentou outro resultado importante

que pode ser exemplificado usando o caráter cor das sementes, com fenótipos sementes verdes e

sementes amarelas, e o caráter tipo de tegumento, com os fenótipos sementes lisa e rugosa.

Nesses caracteres os fenótipos sementes verdes e sementes lisas são dominantes. Mendel

cruzou plantas com sementes verdes e lisas puras com plantas com sementes amarelas e rugosas

também puras. Na geração F1 obteve apenas plantas sementes verdes e lisas, as quais

autofecundadas geraram uma geração F2 com 9/16 das plantas com fenótipo sementes verdes e lisas,

3/16 plantas sementes verdes e rugosas, 3/16 plantas sementes amarelas e lisas e 1/16 plantas

sementes amarelas e rugosas. Com isso Mendel deduziu que as combinações entre fatores de

diferentes pares eram independentes (ao acaso).

Esquematicamente:

Geração Fenótipo Proporção Genótipo Proporção

P1 sementes verdes e lisas 100% AABB 100%

P2 sementes amarelas e rugosas 100% aabb 100%

F1 sementes verdes e lisas 100% AaBa 100%

5

AABB 1/16

F2 sementes verdes e lisas 9/16 AABb 2/16

AaBB 2/16

AaBb 4/16

sementes verdes e rugosas 3/16 Aabb 1/16

Aabb 2/16

sementes amarelas e lisas 3/16 aaBB 1/16

aaBb 2/16

sementes amarelas e rugosas 1/16 aabb 1/16

Por esse resultado Mendel postulou que:

1a Lei de Mendel

(1) A herança dos caracteres se dá por fatores não miscíveis, que ocorrem aos pares em qualquer

indivíduo.

(2) As duas formas contrastantes de um caráter são determinadas pelos dois componentes de um par

de fatores.

(3) Quando um indivíduo apresenta os dois fatores diferentes apenas um deles se manifesta, o qual ‚

chamado de "Dominante".

(4) Os dois componentes de um par de fatores se separam na gametogênese, se combinando ao acaso

na fecundação.

2a Lei de Mendel

(5) Qualquer componente de um par de fatores se combina independentemente (ao acaso) com

qualquer componente de outro par.

O trabalho de Mendel teve o mérito de pela primeira vez expor uma explicação razoável e com

base experimental, para a herança de caracteres. Muitos pesquisadores repetiram a metodologia de

Mendel para outros caracteres em outras espécies encontrando ora resultados semelhantes ora

resultados conflitantes. Por isso os seus resultados demoraram a serem admitidos como gerais. A teoria

da dominância, por exemplo, mostrou-se um caso particular e não geral como Mendel havia suposto. A

sua 2a Lei também não se mostrou geral, já que os genes ligados não segregam independentemente.

Mesmo assim, suas descobertas deram o início a uma nova ciência, a Genética, da qual Mendel é

considerado o pai.

As continuidades dos estudos de genética, após os trabalhos de Mendel, se desenvolveram em

diversas áreas. A necessidade de localizar os genes permitiu o surgimento da citogenética, que resultou

de uma fusão de conhecimentos da citologia e da genética e permitiu a identificação dos cromossomos

como portadores da informação genética. Um conhecimento mais aprofundado dos cromossomos e de

6

sua constituição permitiu o desenvolvimento da Genética Molecular, que têm permitido a uma grande

compreensão dos mecanismos bioquímicos envolvidos na herança dos caracteres.

A identificação de que a herança de uma forma geral não segue exatamente as leis de Mendel,

ao invés de desmenti-las, simplesmente demonstrou que os processos são mais complexos que o

observado com as características por ele estudadas. Por exemplo:

→ genes localizados no mesmo cromossomo não apresentam segregação independente;

→ a maioria das características não é determinada por apenas um gene e sim por diversos

genes;

→ além do efeito dos genes, os efeitos do ambiente também são determinantes em muitas

características;

→ alguns genes são influenciados (estimulados, inibidos, etc..) pelos produtos de outros genes.

Além dos pontos acima citados, existe ainda o aspecto importantíssimo que os indivíduos vivem

em populações e que os processos genéticos e evolutivos acontecem em função da estrutura destas

populações.

Como base para o Melhoramento Genético Vegetal, discutiremos nos próximos capítulos

diversos aspectos básicos ligados a: Genética Molecular, Genética de Populações e Genética

Quantitativa, conhecimentos que nos permitirão uma compreensão das técnicas e métodos utilizados

para definição de programas de melhoramento e avaliação de genótipos a serem lançados como

cultivares.

7

2. FUNDAMENTOS DE GENÉTICA MOLECULAR

2.1. ESTRUTURA DO DNA

Logo após a redescoberta dos trabalhos de Mendel, em 1900, a principal pergunta que surgiu na

comunidade científica era: “onde estavam localizados, na célula, os „fatores‟ que determinavam os

caracteres”.

Naquela época os avanços da microscopia vinham permitindo grandes avanços em citologia, e

foram os citologistas que, ao observarem a estrutura dos ovócitos (com grande quantidade de

citoplasma) e os espermatozóides (praticamente sem citoplasma), chegaram a conclusão que as

estruturas responsáveis pela herança estavam no núcleo e não no citoplasma. Além disto, estudando o

comportamento dos cromossomos na meiose, observaram uma correspondência muito grande entre

estes e os „fatores‟ de Mendel, e concluíram, após alguns testes, que os genes estavam nos

cromossomos → “Teoria Cromossômica da Herança”.

Estas conclusões permitiram uma compreensão de como os genes eram transmitidos de célula a

célula durante o desenvolvimento do indivíduo (mitose), assim como esta transmissão acontecia de uma

geração para outra (meiose, formação de gametas e fertilização).

Estas descobertas estimularam um incremento nas pesquisas sobre a composição e a estrutura

dos cromossomos, buscando uma maior compreensão sobre o que eram os genes, de que substâncias

eram compostos, como se multiplicavam e como eram transmitidos.

A composição dos genes foi um dos aspectos que gerou algumas polêmicas, pois a substância

que constitui os genes precisa possuir três propriedades fundamentais para que os genes

desempenhem seus papéis biológicos:

1º - Replicação – a molécula portadora da informação genética precisa ter a capacidade de ser

copiada em dois momentos do ciclo vital. O primeiro, na meiose, na produção das células responsáveis

pela continuidade da espécie, que irão produzir a nova geração, os gametas (animais e vegetais). Em

um segundo momento, na mitose, quando, a partir da primeira célula de um organismo, ocorrem

diversas multiplicações durante o seu desenvolvimento.

2º - Produção da Forma – informação necessária para a formação e o funcionamento do

organismo. Toda a informação necessária para que as estruturas sejam produzidas e realizem suas

funções a que se destinam deve estar contida nos genes.

3º - Serem Mutáveis – a molécula hereditária é uma molécula passível de alteração (mutações),

eventos que, mesmo ocorrendo raramente, é a base para a variação dentro e entre espécies, e a longo

prazo o fator primário para determinar a evolução e possibilitar o melhoramento genético.

Em um primeiro momento, foi observado que, dentro do núcleo da célula existiam principalmente

três tipos de moléculas com características para serem as portadoras da informação genética

(complexidade de estrutura), o DNA, o RNA e proteínas. Por apresentar uma grande instabilidade em

8

sua participação no conteúdo celular, e por não fazer parte da constituição dos cromossomos, o RNA foi

logo descartado. Apenas em 1944 trabalhos com transformação de bactérias, publicados por Avery,

MacLeod e McCarty, forneceram as evidências definitivas de que o material genético é o DNA.

Antes mesmo da descoberta da estrutura do DNA por Watson & Crick em 1953, a composição

do DNA já era conhecida. O DNA (Ácido desoxirribonucléico) é composto de apenas quatro diferentes

moléculas básicas chamadas nucleotídeos. Cada nucleotídeo é composto por um fosfato, uma

desoxirribose e uma de quatro bases nitrogenadas:

Nucleotídeos Purínicos

Adenina (A) Guanina (G)

Nucleotídeos Pirimídicos

Timina (T) Citosina (C)

A estrutura de dupla hélice definida por Watson & Crick foi fundamentada a partir de duas

evidências:

1º - Trabalhos de Franklin & Wilkins com dados de raios X da estrutura do DNA sugeriam que o

DNA era longo e fino, e que tinha duas partes similares que eram paralelas, uma a outra, ao longo da

molécula.

NH2

N 6 N

7 5 1

8

9 4 2

Fosfato N 3

N

O O Base Nitrogenada

5’ (Adenina)

O – P – O – CH2

O 4’ 1’

H3 H

Desoxirribose

3’ 2’

OH H

O

4 H

CH3 5 3 N

Base Nitrogenada

6 2 (Timina)

1 O

Fosfato N

O O

5’

O – P – O – CH2

O 4’ 1’

H3 H

Desoxirribose

3’ 2’

OH H

NH2

4

5 3 N

Base Nitrogenada

(Citosina)

6 2 O

1

Fosfato N

O O

5’

O – P – O – CH2

O 4’ 1’

H3 H

Desoxirribose

3’ 2’

OH H

O

H

N 6

7 5 1 N

8

NH2

9 4 2

Fosfato N 3

N

O O Base Nitrogenada

5’ (Guanina)

O – P – O – CH2

O 4’ 1’

H3 H

Desoxirribose

3’ 2’

OH H

9

2º - A quantidade total de nucleotídeos pirimídicos (T + C) é sempre igual a quantidade total de

nucleotídeos purínicos (A + G), sendo T=A e C=G, e que A+T não é necessariamente igual a C+G.

A estrutura em dupla hélice é constituída então de duas cadeias de nucleotídeos ligados entre si

por ligações fosfodiester, em que um grupo fosfato, que está ligado ao Carbono 5‟ da desoxirribose se

ligará ao grupo –OH no Carbono 3‟ da desoxirribose adjacente. As duas hélices são mantidas juntas por

pontes de hidrogênio entre as bases, como demonstrado no esquema abaixo, o que explica a

especificidade A-T e C-G.

3‟ 5‟

5‟ 3‟

Um outro aspecto importante é que as fitas de nucleotídeos possuem sentidos opostos, ou seja,

elas são antiparalelas, sendo um filamento 5‟ → 3‟ e o outro 3‟ → 5‟.

A estrutura tridimensional (helicoidal) é uma conseqüência da composição da molécula de DNA.

Os cromossomos, como são visualizados durante as divisões celulares, estão em uma forma

compactada. Tendo em vista que as moléculas de DNA são extremamente longas, por exemplo, o

genoma humano, possui aproximadamente três bilhões de pares de bases, o que faz com que cada

célula diplóide possua cerca de 2 metros de DNA compactados em 46 cromossomos, sendo cada

cromossomo constituído por uma molécula de DNA e por diversas proteínas envolvidas na

compactação.

Em um primeiro nível de compactação, o DNA se enrola como um carretel em estruturas

formadas por oito moléculas de proteínas denominadas histonas, formando os nucleossomos. Os

nucleossomos, organizados em uma forma que se assemelha a contas de um colar, assumem uma

forma helicoidizada denominada solenóide. Existem evidências de que a solenóide ainda sofre um

outro processo de helicoidização a redor de uma estrutura protéica denominada arcabouço.

G G A

T C

C T

A

C

G

Nucleotídeo

10

2.2. REPLICAÇÃO DO DNA

Como já vimos, o DNA consiste de uma dupla hélice composta de duas fitas de

desoxirribonucleotídeos que são antiparalelas e complementares.

Para que ocorra duplicação, ou replicação, as duas fitas de DNA, que estão, unidas entre si por

pontes de hidrogênio, deverão ser abertas, pois cada uma destas fitas servirá de molde para formar

uma nova molécula de DNA. Assim, a partir de uma molécula original de DNA, serão formadas duas

moléculas filhas, em que uma das fitas é recém sintetizada a partir da fita molde da molécula original.

Esta forma de replicação é chamada de semiconservativa, como pode ser observado no esquema

abaixo:

Dupla fita “fechada” – Molécula Original

Moléculas Filhas

O processo de replicação de DNA é bastante complexo, onde diversas enzimas e outros

componentes participam. Descreveremos aqui apenas o processo básico.

A replicação do DNA propriamente dita é catalisada pela enzima DNA polimerase. Embora já

tenham sido identificadas diversas DNA polimerases (apenas em E. coli existem três), algumas com

funções específicas, as atividades básicas desta enzima são:

1. atividade de polimerase, catalisa o crescimento da cadeia de DNA no sentido 5’→ 3’;

5’

T C

A G A A T T C C C G

3’

A A T T C G G G T

C

A A T T C G G G T

C

A G A A T T C C C G

A A T T C G G G T

C

A G A A T T C C C G

Fita

Molde

Nova

Fita

Nova

Fita

5’ 3’

Fita

Molde

Sentido da

Replicação

Sentido da

Replicação

11

2. atividade de exonuclease 3‟ → 5‟, com o objetivo de remover bases pareadas erradas;

3. atividade de exonuclease 5‟ → 3‟, degradação da dupla hélice, usada principalmente na

remoção dos “primers” de RNA.

Aparentemente estas três atividades são realizadas por sítios ativos situados em partes

diferentes da molécula.

A replicação do DNA inicia com uma Origem de Replicação e então continua bidirecionalmente

em uma Forquilha de replicação.

Em organismos procariotos replicação acontece a partir de uma única origem de replicação. Em

eucariotos o processo acontece a partir de diversas origens de replicação por cromossomo.

A DNA polimerase é uma enzima com capacidade de ampliar uma cadeia de DNA, mas é

incapaz de iniciá-la, pois ela necessita de um grupamento 3‟-OH livre para atuar. Sendo assim, antes do

início da síntese de DNA, é necessário que, na origem da replicação, seja sintetizado um pequeno

fragmento de RNA (RNA iniciador ou “primer”), com aproximadamente 10 a 60 nucleotídeos, pela

enzima primase. A partir do “primer” então a nova cadeia de DNA será produzida pela DNA polimerase.

A DNA polimerase sintetiza novas cadeias apenas no sentido 5‟ → 3‟, movendo-se no sentido 3‟

→ 5‟ do filamento molde. Como já foi comentado, o processo de replicação ocorre de forma bi-direcional

nas duas fitas da molécula de DNA, sendo assim enquanto uma das fitas é sintetizada de forma

contínua, a outra necessariamente será sintetizada de forma descontínua como pode ser observado na

figura abaixo:

f

o

r

q

u

i

l

h

a

d

e

R

e

p

l

i

c

a

ç

ã

o

Origem de Replicação

Forquilha de Replicação

3’

5’ 3’

Fragmentos de Okazaki Filamento Contínuo

Origem de Replicação

Primers

5’

12

A DNA polimerase sintetiza um novo fragmento até o início do fragmento anterior retirando

inclusive o “primer” que lhe deu origem, graças a sua atividade exonuclease 5‟ → 3‟. A união dos

diversos fragmentos de Okasaki, da fita descontínua, são então, unidos pela enzima ligase (única

enzima capaz de unir duas cadeias de DNA).

Ao final da replicação, um aspecto importante é que uma das extremidades do cromossomo, a

da fita descontínua, ficará mais curta, pois o primer que foi ali adicionado não será substituído por DNA

pela DNA polimerase, como os demais fragmentos. Para resolver este problema existe a enzima

telomerase que adiciona seqüência simples repetidas às pontas do cromossomo, deixando-a completa.

2.3. TRANSCRIÇÃO DO DNA

Como vimos anteriormente o DNA contém toda a informação necessária para o funcionamento e

desenvolvimento do organismo. Mas que tipo de informação é esta?

Esta informação do DNA tem como resultado a produção de proteína, sejam elas proteínas

estruturais ou enzimas, todas as estruturas celulares são compostas por proteínas ou foram produzidas

a partir de atuação proteínas.

Mas para que a informação contida no DNA resulte em proteínas as regiões deste DNA, onde se

encontram os genes, devem ser copiadas ou transcritas em moléculas unifilamentares de RNA (ácido

ribonucléico).

O RNA, apesar de também ser um ácido nucléico, possui algumas características peculiares que

o tornam apto para ser a “cópia funcional” do DNA:

RNA é unifilamentar, sendo assim o RNA pode possuir uma variedade de formas

tridimensionais, algumas bastante complexas, como ribossomos e tRNA, que o permite realizar uma

diversidade de atividade, principalmente na tradução.

O RNA possui em sua composição a ribose em vez da desoxirribose.

O RNA também é composto pelas bases nitrogenadas Adenina (A), Guanina (G) e Citosina

(C), mas a Uracila (U) é encontrada no lugar da Timina.

Existem algumas classes de RNA:

RNAs Informacionais – são os intermediários na decodificação de DNA e cadeias polipeptídicas

(proteínas) → mRNA – RNA mensageiro. Nos procariotos, o mRNA é o transcrito primário, ou seja o

produto direto da transcrição, em eucariotos o transcrito primário precisa passar por um processamento,

ainda no núcleo, para ser o mRNA, e então passar para o citoplasma onde será traduzido em proteína.

RNAs funcionais – nunca são traduzidos em polipeptídios, são RNAs que possuem funções

específicas nas células:

13

tRNAs – RNAs transportadores – se ligam a aminoácidos específicos e os transportam

ao complexo Ribossomo + mRNA durante a tradução;

rRNAs – RNAs ribossômicos – combinam-se a diversas proteínas para formar os

ribossomo, que são complexos moleculares encarregados de realizar a síntese de proteínas.

Além destes existes ainda outros tipos de RNAs com funções ainda não bem esclarecidas que

são encontrados tanto no núcleo como no citoplasma, os snRNAs (RNAs pequenos nucleares) e os

scRNAs (RNAs pequenos citoplasmáticos).

De uma forma similar a replicação, a transcrição também é uma reação de polimerização,

baseada no pareamento complementar de bases nitrogenadas, tendo como fita molde o DNA. Consiste

em um processo catalisado pela enzima denominada RNA polimerase, que se liga ao DNA e se

desloca ao longo da fita molde adicionando a nova cadeia ribonucleotídeos. Assim ao

desoxirribonucleotídeo citosina (C), alinha-se um ribonucleotídeo guanina (G), ao desoxirribonucleotídeo

guanina (G), alinha-se um ribonucleotídeo citosina (C) e ao desoxirribonucleotídeo adenina (A) alinha-se

um ribonucleotídeo uracila (U), pois o RNA não possui timina em sua composição. Também da mesma

forma que na replicação a transcrição acontece no sentido 5‟ → 3‟. A transcrição, no entanto, acontece

em apenas um dos filamentos da molécula de DNA, sendo por isto assimétrica. O mesmo filamento de

DNA não é necessariamente transcrito ao longo de todo o cromossomo.

A transcrição acontece basicamente em três estágios:

Início – para que se dê início à transcrição de um determinado gene, é necessário que a RNA

polimerase, com o auxílio do fator (sigma), reconheça, na molécula de DNA, a região em que este

gene está localizado. Estas regiões do DNA que precedem as seqüências que codificam os genes,

regiões -35 e -10, e que são reconhecidas pela RNA polimerase são chamadas promotores. Ao

reconhecer as seqüências promotoras na molécula de DNA, a RNA polimerase se liga a elas levemente,

formando o complexo promotor fechado, quando então desenrola o DNA e se liga fortemente a

molécula de DNA, libera o fator , formando o complexo promotor aberto, e começa a síntese de

RNA.

Alongamento – como já foi dito, a síntese de RNA acontece sempre no sentido 5‟ → 3‟. Tendo

como substrato os trifosfatos de nucleosídeos (NTP: ATP, GTP, CTP e UTP), que além de fornecerem

os ribonucleosídeos vão também fornecer a energia necessária a reação, com a quebra do trifosfato de

alta energia pela reação:

NTP + (NMP)n DNA (NMP)n+1 + PPi Mg

2+ + RNA polimerase

Durante todo o processo de alongamento, o complexo de transcrição aberto resulta em uma

“bolha de transcrição”, que se desloca ao longo da dupla fita de DNA

14

Término – A finalização da transcrição gênica se dá quando a RNA polimerase reconhece sinais

para o término. Em geral estes sinais são seqüências de nucleotídeos que produzem alterações

tridimensionais na molécula de RNA em formação que sinalizam para a liberação da RNA polimerase e

conseqüentemente para o final da transcrição.

Estes passos acima descritos correspondem ao processo de transcrição em procariotos, em

eucariotos, o processo é basicamente o mesmo, porém, possui algumas diferenças que é importante

que sejam salientadas:

1ª - Uma grande diferença se dá em decorrência do fato que em eucariotos o DNA está no

núcleo, o RNA é então produzido no núcleo e precisa ser levado para o citoplasma, onde ocorre a

síntese protéica. Em procariotos, como não possuem núcleo, a transcrição e a tradução ocorrem no

mesmo local, podendo inclusive a tradução iniciar antes mesmo da molécula de RNA estar toda

sintetizada.

2ª - Enquanto em procariotos existe só uma espécie de RNA polimerase, em eucariotos já foram

reconhecidas pelo menos três, todas com estruturas mais complexas que a existente em procarioros:

RNA polimerase I – catalisa a síntese de rRNA

RNA polimerase II – catalisa a síntese de mRNA

RNA polimerase III – catalisa a síntese de tRNA, snRNA e scRNA.

3ª - Em eucariotos cada molécula de mRNA sintetizada corresponde a uma cadeia polipeptídica,

enquanto que em procariotos, uma molécula de mRNA pode codificar várias proteínas.

4ª - Em eucariotos o transcrito primário de mRNA será processado antes de ser transportado

para o citoplasma. O processamento consiste basicamente em:

Adição de um cap (7-metilguanosina) à extremidade 5‟;

5’

3’

Sentido da

transcrição

3’

Filamento não molde do DNA

5’

3’

RNA sendo

Transcrito

5’

Filamento molde do DNA

A A A A T T C G G G T

T T G G G A A T T C G G G T

T C C

A A T T C G G G T

T G G A A C T G

A A T T C G G G T

T C

A A T T C C C G

A G

15

Adição da cauda poli (A) (seqüência de 150 - 200 adenosinas) à extremidade 3‟;

Recomposição (“Splicing”) – remoção das partes internas do transcrito .

Os segmentos de DNA que codificam a estrutura da proteína são interrompidos por seqüências

intercalares não codificadoras – introns. A recomposição remove os introns e junta todas as regiões

codificantes chamadas exons para formar o mRNA

5ª - Recomposição alternativa – em eucariotos pode acontecer a produção de mRNAs

diferentes e conseqüentemente proteínas diferentes a partir do mesmo transcrito primário. Isto acontece

em diferentes tipos celulares ou em estágios diferentes do desenvolvimento.

2.4. TRADUÇÃO – SÍNTESE DE PROTEÍNAS

Antes de qualquer coisa vamos discutir como foi possível chegar ao Código Genético. Ou seja:

“Como a seqüência de nucleotídeos dita a seqüência de aminoácidos”

Sendo os nucleotídeos considerados letras, poderíamos considerar os aminoácidos palavras e

assim, diferentes combinações de nucleotídeos resultariam no código para identificar diferentes

aminoácidos.

A primeira questão a ser respondida foi se o código genético era superposto ou não:

aa3

aa2 Código superposto

aa1

A U U G C U C A G

aa1 aa2 aa3 Código não superposto

Experimentos em que se provocavam mutações em que se trocava apenas um nucleotídeo por

outro em um gene, observava-se alteração em apenas um aminoácido na cadeia polipeptídica

resultante, sendo assim, ficou demonstrado que o código não é superposto, pois do contrário haveria

um número maior de aminoácidos trocados.

A questão seguinte foi a de quantas letras resultava em um código, ou seja, quantos

nucleotídeos resultariam em um aminoácido. Sendo o RNA composto de quatro nucleotídeos diferentes

e havendo 20 aminoácidos, o código deveria ser tal que as diferentes combinações de nucleotídeos

fossem no mínimo 20.

Então: 1 nucleotídeo → 41 código para apenas quatro aminoácidos → DESCARTADO

2 nucleotídeos → 42 código para apenas 16 aminoácidos→ DESCARTADO

3 nucleotídeos → 43 código para 64 aminoácidos → ACEITO

Este resultado conclui que existem códigos em excesso, mais tarde foi confirmado que para

vários aminoácidos existem várias combinações de nucleotídeos – O código genético é redundante.

Além disto existe algumas seqüências que codificam para a finalização do processo de tradução.

16

O Código genético é o seguinte:

S e g u n d a L e t r a

U C A G

P

r

i

m

e

i

r

a

L

e

t

r

a

U

UUU Fen UCU

Ser

UAU Tir UGU Cis U

T

e

r

c

e

i

r

a

L

e

t

r

a

UUC UCC UAC UGC C

UUA Leu UCA UAA Fim UGA Fim A

UUG UCG UAG Fim UGG Trp G

C

CUU

Leu

CCU

Pro

CAU His CGU

Arg

U

CUC CCC CAC CGC C

CUA CCA CAA Gin CGA A

CUG CCG CAG CGG G

A

AUU

Ile

ACU

Tre

AAU Asn

AGU Ser U

AUC ACC AAC AGC C

AUA ACA AAA Lis AGA Arg A

AUG Met ACG AAG AGG G

G

GUU

Val

GCU

Ala

GAU Asp GGU

Gli

U

GUC GCC GAC GGC C

GUA GCA GAA Glu GGA A

GUG GCG GAG GGG G Deve-se observar que:

Cada uma das 64 combinações de nucleotídeos tem sentido;

Pelo menos alguns aminoácidos são codificados por dois ou mais trincas de nucleotídeos;

os tRNAs possuem um anticódon que reconhece o códon do mRNA;

Cada molécula de tRNA tem uma forma tridimensional única que permite o reconhecimento

da sintetase correta, que será a enzima que catalisará a união do rRNA ao aminoácido correto formando

o complexo denominado amoniacil-tRNA (tRNA carregado). Alguns aminoácidos possuem apenas um

tRNA correspondente, enquanto que para outros, existem vários tRNAs alternativos. Além disto alguns

tRNAs podem levar seus aminoácidos em resposta a vários códons com pareamento “frouxo” em uma

das extremidades – Códon oscilante;

Os tRNAs e rRNAs são produtos finais de genes específicos.

Síntese de Proteínas

A maior parte das reações da síntese de proteínas acontecem nos ribossomos que são

estruturas constituídas de duas subunidades, uma maior, composta de duas moléculas de rRNA e

proteínas (denominadas L1, L2, etc...), e uma subunidade menor, composta de uma molécula de rRNA

e proteínas (denominadas S1, S2, etc...). Os ribossomos possuem sítios específicos para se ligarem ao

17

mRNA e aos tRNAs e ainda a fatores protéicos específicos. Quando não estão realizando a síntese

protéica, as subunidades do ribossomo ficam dissociadas na solução citoplasmática.

50 S

+

70 S

30 S A síntese de proteínas é o resultado de uma série de reações químicas , ou seja:

1ª reação – acontece no citosol, ligação dos aminoácidos às moléculas específicas de tRNA por

uma ligação de alta energia. Reação catalisada por uma enzima específica para cada aminoácido –

sintetase. Então:

aa1 + tRNA1 + ATP Sintetase aa1-tRNA1 + AMP + PPi

tRNA1 carregado

2ª reação e as seguintes – acontece no ribossomo. União de um aminoácido a outro, a energia

é proveniente da ligação de alta energia do tRNA carregado, a reação é catalisada pela peptidil

transferase:

aa1-tRNA1 + aa2-tRNA2 Peptidil transferase aa1-aa2-tRNA2 + tRNA1 (liberado)

Este processo de adição de aminoácidos continua até que o aminoácido final é adicionado.

O processo de síntese de proteínas pode ser dividido em três etapas:

Iniciação – nesta fase, que conta com a participação de fatores de iniciação e GTP, como

fornecedor de energia, o mRNA se liga a subunidade menor do ribossomo, logo após ocorre a ligação

do tRNA iniciador (fMet-tRNA na maioria dos procariotos) no sítio P do ribossomo (sítio em que se

liga o peptidil-tRNA levando a cadeia em formação) e a seguir ocorre a montagem das duas unidades

do ribossomo deixando-o em condições de passar para a fase de alongamento.

18

Alongamento – nesta fase os seguintes passos:

complexos de aminoacil-tRNA, com a participação de fatores de alongamento e GTP,

se ligam ao sítio A do ribossomo,

ocorre a reação, mediada pela peptidil transferase, em que a cadeia polipeptídica do

peptidil-tRNA, que está no sítio P, se liga ao aminoácido do aminoacil-tRNA que está no sítio A;

ribossomo se move em códon, libverando o tRNA descarregado do sítio P e

transferindo o peptidil-tRNA recém formado do sítio A para o sítio P;

este processo de alongamento se repete o número de vezes necessárias para

completar a cadeia polipeptídica em formação.

Término – o processo de síntese protéica é finalizado quando no sítio A apresenta um dos

códons de término (Fim). Estes codons são identificados por fatores de liberação que se ligam ao sítio

A. O polipeptídeo formado é então liberado do sítio P e os ribossomos se dissociam em duas

subunidades.

O conjunto de genes que codificam para proteínas em um organismo é chamado Proteoma,

diversos trabalhos têm sido realizados como o objetivo de identificar, diferentes organismos, o número

de genes que codificam proteínas, assim como a “divisão de trabalho” dentro do proteoma, objetivando

compreender que tipos de genes são necessários para que um organismo funcione.

19

3. GENÉTICA DE POPULAÇÕES

Os indivíduos não se encontram isolados na natureza, mas reunidos em populações,

reprodutivamente ativas.

Ao estudar a genética experimental, nós retiramos os indivíduos das suas populações naturais, e

o submetemos a cruzamentos escolhidos, para observar, pela descendência, os diversos fenômenos

envolvidos na herança. Mendel, por exemplo, concluiu com sucesso seus experimentos cruzando

artificialmente plantas de ervilha, obtendo gerações F1 e F2.

Em muitos casos não é possível estudar a genética por meio de cruzamentos artificiais. Muitas

vezes é interessante estudar os indivíduos em seu estado natural, por exemplo, nos estudos de

genética ecológica. Em certos casos a reprodução artificial é muito difícil, como em muitas espécies

selvagens. Ou ainda pode haver dificuldades de ordem ética para os cruzamentos, como na espécie

humana.

Nestes casos o estudo da herança deve ser feito na população em seu estado natural. O estudo

do comportamento dos genes nas populações pode ainda fornecer uma base teórica para os trabalhos

de melhoramento vegetal e animal.

3.1. DEFINIÇÃO DE POPULAÇÃO

Uma população, do ponto de vista da genética, pode ser definida como um grupo de indivíduos

da mesma espécie, que ocupam uma mesma área ao mesmo tempo, e que são potencialmente

intercruzáveis.

3.2. FREQÜÊNCIAS GÊNICAS E GENOTÍPICAS

Uma população pode ser caracterizada, para determinado loco (forma aportuguesada de locus,

plural locos), pelas freqüências com que cada genótipo aparece. Por exemplo:

População 1 População 2

Genótipo Nº de

Indivíduos

Freqüências

Genotípicas

Genótipo Nº de

Indivíduos

Freqüências

Genotípicas

AA 100 D 100/400=0,25 AA 200 D 200/500=0,40

Aa 200 H 200/400=0,50 Aa 200 H 200/500=0,40

aa 100 R 100/400=0,25 aa 100 R 100/500=0,20

Total 400 1 Total 500 1

Note que a soma das freqüências é sempre igual a 1 (isto ocorre com qualquer distribuição de

freqüências relativas, já que a soma de todas as partes é sempre igual ao todo), então sempre

D + H + R = 1

20

A partir das freqüências genotípicas pode-se facilmente chegar às freqüências gênicas, basta

para isso observar que o genótipo AA tem 100% de genes A, o genótipo Aa tem 50% de genes A e 50%

de genes a e o genótipo aa tem 100% de genes a. Assim a freqüência de A, que chamaremos de p,

será igual a freqüência dos homozigotos AA mais metade da freqüência dos heterozigotos, ou seja,

f(A)= p = D + (1/2) H (I)

assim como a freqüência de a, que chamaremos q, será:

f(a)=q = R + (1/2) H. (II)

Note mais uma vez que p+q=1.

Nos exemplos acima temos:

População 1 p = 0,25 + (1/2) 0,50 = 0,50 População 2 p = 0,40 + (1/2) 0,40 = 0,60

q = 0,25 + (1/2) 0,50 = 0,50 q = 0,20 + (1/2) 0,40 = 0,40

A freqüência genotípica caracteriza uma população, mas a freqüência gênica não, já que para

uma distribuição de freqüências gênicas, infinitas distribuições de freqüência genotípicas são possíveis.

Por exemplo, se afirmarmos que certa população tem freqüências gênicas:

p = 0,4 para o alelo A e q = 0,6 para o alelo a

não podemos fazer nenhuma afirmativa sobre as freqüências genotípicas.

Estas podem ser D=0,4, H=0,0 e R=0,6 , ou D=0,3, H=0,2 e R=0,5, ou outra qualquer.

Para podermos fazer qualquer afirmativa a respeito das freqüências genotípicas é necessário um

conhecimento da forma como os genes se combinam na população. Cada gameta contém um único

gene de cada loco, assim, as formas como os genes se combinam para formar os genótipos da nova

geração é determinada pela forma como os gametas se combinam para formar os novos indivíduos de

população. É então necessário estudar os padrões reprodutivos das populações.

3.3. PADRÕES REPRODUTIVOS DAS POPULAÇÕES

Panmixia - é o sistema reprodutivo onde todos os indivíduos de uma população têm a mesma

chance de se acasalarem entre si. Isto é, a reprodução é totalmente ao acaso. É difícil imaginar algum

tipo de população que seja estritamente panmítica. Veja por exemplo, se a população é de espécie

dióica, não haverá cruzamentos entre indivíduos do mesmo sexo. Se forem monóicos, poderão ocorrer

cruzamentos mais freqüentes entre indivíduos com certas características especiais, como os que

floresçam na mesma época, etc.

No entanto, como esta população tem características especiais, e muitas populações estão em

condições próximas à panmixia, iremos dar atenção especial a ela e a usaremos como modelo para

nosso estudo.

21

Endogamia - é o cruzamento entre indivíduos com grau de parentesco maior do que o de dois

indivíduos tomados ao acaso na população. Como indivíduos aparentados têm uma chance maior de

terem os mesmos genes alelos, teremos um aumento da homozigoze em decorrência desse processo.

Exogamia - é o oposto à endogamia, isto é, o cruzamento de indivíduos com parentesco menor

que dois indivíduos tomados ao acaso na população, e leva a um aumento na freqüência de

heterozigotos.

Além desses sistemas podemos ter sistemas de acasalamentos próprios para certas

populações, como por exemplo, a autofecundação obrigatória em certas plantas (chamadas

autógamas), ou sistemas em que a autofecundação e o cruzamento ocorrem com certas proporções

(parcialmente autógamas) ou ainda fecundações recíprocas em animais hermafroditas, etc.

O sistema de acasalamento é extremamente importante nas populações, pois determina as

combinações de gametas que poderão ocorrer e assim os genótipos na geração seguinte.

3.4. FREQÜÊNCIAS GÊNICAS E GENOTÍPICAS NA POPULAÇÃO PANMÍTICA.

As freqüências gênicas nos gametas produzidos em uma população serão iguais às freqüências

gênicas na população. De fato, no processo de meiose, cada indivíduo produz seus gametas de acordo

com os genes que tem, um homozigoto AA produzirá 100% de gametas A, um heterozigoto (Aa)

produzirá 50% de gametas A e 50% de gametas a e um homozigoto aa produzirá somente gametas a.

Teremos então p gametas A e q gametas a produzidos pelos machos e o mesmo pelas fêmeas,

supondo iguais proporções entre os sexos. Como panmixia indica reprodução aleatória, a combinação

dos gametas também o será, assim:

gametas femininos

gametas masculinos p A q a

p A p2 AA pq Aa

q a pq Aa q2 aa

Notamos então que, qualquer que sejam as freqüência genotípicas iniciais, em uma geração de

panmixia, elas passam a ser p2, 2pq e q

2, para os genótipos AA, Aa e aa, respectivamente, e esses

valores dependem apenas das freqüência gênicas na geração paterna.

Aplicando as fórmulas I e II às novas freqüências genotípicas teremos:

p1=D1+(1/2) H1 ou p1 = p2 + pq

sendo q=1-p então: p1 = p2 + p(1-p) = p

2 + p - p

2 = p, e q1 = q

2 + pq =q

Ou seja uma população panmítica não altera suas freqüências gênicas de uma geração para

outra. Se o sistema de acasalamento continuar panmítico as freqüência genotípicas e gênicas não irão

se alterar geração após geração. Desta forma se diz que a população está em equilíbrio ou Equilíbrio

de Hardy-Weinberg.

22

Teorema de Hardy-Weinberg:

“Em uma população suficientemente grande para que não ocorra oscilação genética, onde os

acasalamentos ocorram ao acaso (Panmixia), sendo todos os indivíduos igualmente férteis e viáveis e

onde não ocorra seleção, mutação ou migração, as freqüências genotípicas e genéticas permanecerão

constantes ao longo das gerações”

Isto poderia ser observado, de forma mais trabalhosa usando as freqüências dos genótipos.

No quadro abaixo temos todos os acasalamentos possíveis em uma população panmítica, com

suas freqüências respectivas, e os descendentes gerados.

Confirma-se observando os resultados que uma população panmítica não altera suas

freqüências gênicas e genotípicas de uma geração para outra e que estas permanecem nas proporções

p2, 2pq e q

2, sendo p e q as freqüências gênicas.

Machos Fêmeas Freqüência do cruzamento Descendência

AA AA p4 AA

Aa 2p3q 0,5 AA e 0,5 Aa

aa p2q

2 Aa

Aa AA 2p3q 0,5 AA e 0,5Aa

Aa 4p2q

2 0,25 AA, 0,5 Aa e 0,25 aa

aa 2 pq3 0,5 Aa e 0,5 aa

aa AA p2q

2 Aa

Aa 2pq3 0,5 Aa e 0,5 aa

aa q4 aa

Totais dos descendentes f(AA)= p4 + 2p

3q + p

2q

2 = p

2 (p

2 + 2pq + q

2) = p

2

f(Aa)= 2p3q + 4p

2q

2 + 2pq

3 = 2pq (p

2 + 2pq + q

2) = 2pq

f(aa)= p2q

2 + 2pq

3 + q

4 = q

2 (p

2 + 2pq + q

2) = q

2

3.5. FREQÜÊNCIAS GÊNICAS E GENOTÍPICAS EM POPULAÇÕES ENDÓGAMAS

Como vimos, a endogamia é o cruzamento entre indivíduos com grau de parentesco maior do

que o de dois indivíduos tomados ao acaso na população. Este tipo de acasalamento irá afetar as

freqüências genotípicas na população porque indivíduos formados dessa maneira terão maior chance

de terem genes semelhantes nos seus locos e, portanto, serem homozigotos. O acasalamento que

promove maior grau de endogamia é a autofecundação, pois oferecerá a maior chance de gametas com

genes semelhantes se unirem na fecundação, por isso iremos usar este tipo de acasalamento para

demonstrar os efeitos da endogamia sobre as freqüências genotípicas.

23

Vamos imaginar uma população inicialmente panmítica, com freqüências p e q para os alelos A e

a. Então os genótipos devem estar nas freqüências:

Descendência

Genótipos Freqüência AA Aa aa

AA p2 p

2

Aa 2pq (1/2)pq pq (1/2)pq

aa q2 q

2

Freq. na descendência (1/2)(p2+p) pq (1/2)(q

2+q)

Se em certa geração a reprodução for toda por autofecundação, a geração seguinte terá uma

diminuição da freqüência dos heterozigotos e um aumento da freqüência dos homozigotos em valor

igual. Notamos que neste caso a freqüência dos heterozigotos diminuiu numa proporção igual a 1/2.

Esta proporção de diminuição na freqüência dos heterozigotos é chamada de coeficiente de

endogamia e é simbolizado pela letra F. O cálculo desse coeficiente em situações práticas será

examinado em um outro capítulo.

Pode ser demonstrado que, uma população que tenha um coeficiente de endogamia F a

freqüência dos genótipos estará em equilíbrio nas proporções:

Genótipos Freqüência

AA p2+ pqF = p

2(1-F)+ pF

Aa 2pq(1-F) = 2pq(1-F)

aa q2+ pqF = q

2(1-F)+ qF

O coeficiente de endogamia F varia de 0 a 1.

Pode-se ver então que quando o F = 0 → população é panmítica.

Quando o F=1 → a população é autógama completa, e será constituída somente de

homozigotos. Quanto maior o valor de F maior a proporção de homozigotos na população.

3.6. FREQÜÊNCIAS GÊNICAS E GENOTÍPICAS EM POPULAÇÕES EXÓGAMAS

A exogamia é uma tendência geral na natureza, principalmente entre os animais. pode-se

observar em muitas espécies de plantas e de animais mecanismos e comportamentos que protegem a

população da endogamia, promovendo a exogamia. Em populações muito grandes a exogamia não

difere praticamente da panmixia. De fato, se a população é muito grande, composta de muitas famílias,

e as famílias não são grandes a probabilidade de dois indivíduos da mesma família se acasalar por

acaso (portanto sob panmixia) é muito reduzida. Assim, em populações grandes comportamentos

exogâmicos não alteram muito a população. No entanto em populações pequenas, com poucas

24

famílias, onde o tamanho da família é grande em relação ao da população, a exogamia exerce um papel

muito importante na prevenção da endogamia.

Em uma população, com N indivíduos, podem-se ter CN2 acasalamentos, se cada família tiver n

indivíduos a probabilidade de acasalamento dentro de cada família será Cn2. A probabilidade de

acasalamentos endogâmicos será P= f Cn2 / CN

2 em que f é o número de famílias, ou seja:

P = (n-1)/(N-1). Logo essa probabilidade será maior em populações menores

Suponhamos uma situação simplificada onde uma população é composta por n famílias, todas

com o mesmo tamanho, e que não haja possibilidade de acasalamentos dentro das famílias. Cada

família tem sua própria freqüência gênica, digamos p1, p2,...pn, de modo que a freqüência na população

é a média pi/n. Ao acasalar com todos os indivíduos das outras famílias, uma família produziria uma

proporção de homozigotos AA igual a pj (pi - pj)/(n -1).

Fazendo a média para todas as famílias teremos:

D=(1/n) [p1 (pi - p1)/(n -1)+ p2 (pi - p2)/(n -1)+...+ pn (pi - pn)/(n -1)]

D= p2- [1/n] S

2p . → Se pi for constante D= p

2 simplesmente.

Há então uma diminuição da homozigose que é proporcional à variância da freqüência gênica

nas famílias e inversamente proporcional ao número de famílias.

Outra forma de escrever é D=[n/(n-1)] p2 - pi

2/ [n(n-1)] → vê-se que se o número de famílias

for grande, de modo que a divisão [n/(n-1)] 1 e o segundo termo seja insignificante, a exogamia não

causará diferença em relação à panmixia.

3.7. FATORES QUE ALTERAM AS FREQÜÊNCIAS GÊNICAS DAS POPULAÇÕES

Como vimos, as populações panmíticas não alteram suas freqüências gênicas e genotípicas ao

longo das gerações. Dessa forma nenhuma alteração poderia acontecer e não haveria obviamente

evolução ou melhoramento. No entanto existem processos naturais que alteram as freqüências gênicas

das populações promovendo as mudanças necessárias a constante adaptação das populações ao meio,

sempre em alteração. Esses fatores são: a mutação gênica, a oscilação genética, a migração genética,

a seleção natural e os acasalamentos preferenciais. São esses os fatores essenciais à evolução, sem

os quais a variação existente seria estatística.

Veremos a seguir cada um destes fatores.

3.7.1. Mutação Gênica

Os genes são formados por cadeias de moléculas especiais chamadas DNA (ácido

desoxirribonucléico). Essas cadeias são longas seqüências pareadas de bases aminadas.

Existem dois tipos de bases aminadas: purinas (Adenina e Guanina) e pirimidinas (Timina e

Citosina) que se pareiam de forma específica, formando pela sua seqüência um código que determina o

25

aminoácido que deverá ser alocado em cada posição na proteína codificada pelo gene. Qualquer

mudança nesta seqüência de bases causará uma mudança na proteína codificada, podendo então

alterar sua função no organismo.

Diversos fatores podem determinar a alteração da seqüência de DNA. Um erro na replicação do

mesmo, no momento da sua duplicação, no processo de reprodução celular (mitose ou meiose), por

exemplo. Existem também radiações capazes de atingir o DNA, causando quebras em sua estrutura e

que redundam em mutações, como raios X, raios gama, etc, além de substâncias químicas capazes de

reagir com o DNA e causar essas alterações.

Os genes existentes e que exercem funções no organismo se mantiveram na população por que

mostraram sua utilidade no longo período evolutivo da espécie. As mutações são alterações químicas

que podem atingir qualquer parte do DNA indiferentemente, e, portanto causam mudanças

completamente aleatórias. É extremamente improvável que uma mutação venha a trazer vantagem

imediata ao organismo que a sofreu, ela será na maioria dos casos prejudicial. No entanto, o acúmulo

de muitas mutações em uma população é benéfico em longo prazo, pois algumas delas poderão ser

úteis em outras situações futuras, ajudando a população a fazer frente a novos ambientes.

As mutações ocorrem continuamente em todas as populações, em baixíssima freqüência. Para

que haja acúmulo de mutações é necessário que elas não sejam eliminadas no processo evolutivo.

Como isso ocorre iremos discutir mais adiante.

Para quantificarmos o efeito das mutações sobre as freqüências gênicas vamos supor que a

taxa de mutação do gene A1 para A2 seja u e que a taxa de mutação do gene A2 para A1 seja v e que

as freqüências originais sejam po e qo, para os alelos A1 e A2, então:

p1 = po - upo + vqo q1 = qo + upo - vqo

Se upo > vqo a freqüência de A1 diminui.

Se upo < vqo a freqüência de A2 diminui.

Obviamente estes valores tenderão a um equilíbrio quando vqe = upe e consequentemente

pe = v/(u+v) e qe = u/(u+v)

3.7.2. Migração Genética

Por migração genética se entende a saída ou entrada de indivíduos de uma população. Como

estudaremos o processo independente da seleção, está excluída qualquer escolha de indivíduos no

processo. Portanto a saída de indivíduos não causará qualquer impacto na população, já que estes

serão tirados ao acaso. Já a entrada de indivíduos na população causará alteração nas freqüências,

pois as freqüências gênicas nos imigrantes serão as da população de origem.

Para que haja imigração é necessário que os imigrantes se integrem à nova população. Isso só

se dará se eles passarem a se reproduzir normalmente na nova população. A imigração muitas vezes

26

requer uma mudança de ambiente. Por isso os indivíduos imigrantes devem ter a capacidade de

sobreviver no novo ambiente. Esta característica é conhecida como capacidade de dispersão. Os

imigrantes têm também que se reproduzir com os indivíduos da nova população, então nenhuma

barreira reprodutiva pode existir entre eles. Barreiras reprodutivas são mecanismos que podem impedir

ou dificultar a reprodução, tal como diferenças na época de florescimento. Podem ser pré-zigóticas,

como diferentes condições ecológicas ótimas para os indivíduos das duas populações envolvidas,

incompatibilidade reprodutiva entre os indivíduos das populações, diferentes agentes polinizadores, ou

pós-zigóticas, como inviabilidade do híbrido, esterilidade do híbrido, inviabilidade do F2, etc.

Supondo duas populações:

População original "O", onde po = no/To, e outra população "I", onde pi = ni/Ti,

sendo no o número de genes A na população "O", ni o número de genes A na população "I", To o

total de genes deste loco na população "O" e Ti o total de genes deste loco na população "I".

Com a junção das duas populações temos p1 = (no + ni)/(To + Ti).

Mas no = poTo e ni = piTi. → Assim, p1 = (poTo + piTi)/(Ti+To).

Se chamarmos de m a proporção de imigrantes na população resultante, m = Ti/(Ti + To);

Então : p1 = po (1-m) + pi mi ou p1 = po + m (pi - po)

Então a freqüência gênica na população resultante na migração natural é a média ponderada

das freqüências gênicas das populações que se uniram.

Como não houve alteração da estrutura reprodutiva, se a população era originalmente panmítica,

ela continuará mantendo as proporções típicas dessas populações, mas com as novas freqüências, isto

é, p12, 2p1q1, q1

2.

No melhoramento vegetal a população formada pela junção de duas ou mais populações é

chamada de “composto”. A freqüência gênica em um composto será então a média ponderada das

freqüências gênicas das populações que o compõe. O peso será o número de indivíduos de cada

população. Um composto recém formado não é uma população em equilíbrio. Teoricamente entraria em

equilíbrio na primeira geração de reprodução panmítica, mas na prática o equilíbrio só vai ocorrer após

algumas gerações.

Uma outra forma pela qual os genes de uma população podem ser introduzidos em outra é pelo

cruzamento de indivíduos de uma população com indivíduos de outra. Neste caso o número de

indivíduos de cada grupo deixa de ser importante, pois na geração descendente cada indivíduo será

fruto da junção de um gameta proveniente de uma população com um gameta proveniente da outra.

Assim, a proporção de genes das duas populações será a mesma e a nova freqüência gênica será a

média aritmética simples das freqüências nas populações originais.

A população resultante desta hibridação não manterá as proporções p12, 2p1q1 e q

2, já que não é

proveniente de reprodução panmítica, e deverá ter mais heterozigotos que o esperado segundo essas

proporções, como mostrado no diagrama abaixo.

27

População 2

População 1 p2 A q2 a

p1 A p1p2 AA p1q2 Aa

q1 a p2q1 Aa q1q2 aa

Uma observação importante é que o valor máximo para o freqüência de heterozigotos em uma

população panmítica é 0,5 (meio). Isso pode ser facilmente demonstrado determinando o máximo para

a função 2p(1-p). Numa população híbrida o valor poderá exceder 0,5 e será tanto maior quanto mais

contrastantes forem as populações cruzadas, podendo chegar a 1.

Caso a população híbrida se reproduza ao acaso, formando o que se costuma chamar de

“geração avançada de um híbrido” dará origem a um composto de duas populações obtido pela

reprodução panmítica do cruzamento entre as duas. Assim, as freqüências gênicas seriam a média das

freqüências nas populações cruzadas:

pc = p1 + p2 qc = q1 + q2

2 2

3.7.3. Deriva Genética ou Oscilação Genética

Quando se tira uma amostra representativa de uma população qualquer, pode ser que esta seja

parecida com a população, mas não necessariamente igual. Por exemplo, vamos supor uma caixa onde

colocamos 100 bolas, sendo 40 pretas e 60 brancas. Se tirarmos a menor amostra aleatória na caixa,

uma bola tomada ao acaso, a probabilidade de ser preta ou branca será 40% e 60%, respectivamente.

É óbvio que não há bolas brancas e pretas ao mesmo tempo, então ou teremos uma bola preta (100%

bolas pretas na amostra) ou teremos uma bola branca (100% bolas brancas na amostra). Nos dois

casos houve um erro amostral. Se tirarmos amostras maiores haverá maior chance de se aproximar do

verdadeiro valor da população, mas este só ocorrerá pelo acaso. O único grupo que garante a presença

de 40% de bolas pretas e 60% de bolas brancas é o formado por todas as bolas, portanto a população.

Note que, se tirarmos 99 bolas já haverá um erro.

Note-se que se a caixa contivesse somente bolas de uma cor, qualquer amostra tirada teria

100% de bolas dessa cor, proporção exatamente igual a da população.

É importante notar que o erro amostral ocorre em todas as amostras de populações variáveis, e

será maior quanto menor for o tamanho da mesma. Este erro é imprevisível em seu efeito, já que‚

totalmente aleatório, mas sua variância pode ser prevista estudando a natureza do processo.

Na reprodução das populações, uma geração é formada de uma amostra dos gametas possíveis

na geração anterior. A população de gametas pode ser considerada infinita, já que trata-se de todas as

combinações possíveis dos genes segregantes na população. Já a amostra tem tamanho 2N, sendo N o

número de indivíduos na geração de filhos, pois cada descendente foi formado pela junção de 2

28

gametas. É óbvio que haverá um erro amostral, pois os gametas são tomados ao acaso. Sendo assim a

freqüência gênica na geração descendente não será a mesma que na geração paterna, mesmo que

nenhum processo especial esteja ocorrendo. Este fenômeno só não ocorrerá para locos não

segregantes, onde todos os indivíduos da população sejam homozigotos e iguais, ou para uma

população infinita de descendentes.

Este erro é então imprevisível quanto à direção e inversamente proporcional ao tamanho da

população descendente.

O erro pode ser representado pela variância (S2) da freqüência gênica de diversas amostras de

tamanho 2N retiradas de uma mesma população.

Supondo que esta população tem freqüência p e q para os alelos A e a, temos:

Amostra de tamanho 1 (um gameta) Amostras de tamanho 2 (um indivíduo) tipo Prob Freq. Variância tipo Prob Freq. Variância

A p 1 S2p=p - p

2 = p(1-p) = pq AA p

2 1

a q 0 Aa 2pq 0,5 S2p=p

2 + pq/2 - p

2 = pq/2

aa q2 0

Amostra de tamanho 4 (dois indivíduos) Tipos prob. Freq. Variância

AA e AA p4 1 Generalizando, a variância da Freqüência Gênica será

AA e Aa 2p3q 0.75

AA e aa p2q

2 0.5 S

2p = pq/2N, onde

Aa e AA 2p3q 0.75 S

2p = pq/4 N = número de indivíduos descendentes

Aa e Aa 4p2q

2 0.5

Aa e aa 2pq3 0.25 Vê-se que: S

2p = 0

aa e AA p2q

2 0.5 se p=0 ou q=0

aa e Aa 2pq3 0.25 ou se N for infinito

aa e aa q4 0

O efeito desse fenômeno, ao longo das gerações, se mostra pela variação nas freqüências

gênicas, sem motivo aparente. Estas mudanças são não direcionais e dão a impressão que as

freqüências estão flutuando, quando vistas em um gráfico. Daí o nome dado ao fenômeno, "genetical

drift", ou deriva genética ou ainda oscilação genética.

É fácil perceber que se a freqüência gênica em dado momento chegar a zero ou um, neste

processo, ela não mais sairá deste ponto. Podemos dizer que esses valores funcionam como barreiras

absorventes. Quando a freqüência chega a zero diz-se que o gene foi perdido. E quando a freqüência

chega a um diz-se que o gene foi fixado. Se não houver nenhum outro fator influindo no processo, a

probabilidade de fixar ou perder certo gene é proporcional à sua freqüência inicial.

A fixação ou a perda de genes ocorre aleatoriamente para genes favoráveis ou desfavoráveis, e

29

leva ao aumento da homozigose e perda de variabilidade.

A oscilação genética é um importante fator evolutivo, influindo diretamente na diferenciação de

populações e formação de raças naturais. Deve ser levado em conta quando se objetiva a preservação

da variabilidade genética, como em bancos de germoplasma, e na seleção em longo prazo, pois tende a

diminuir o limite final da seleção.

3.7.4. Seleção

O conceito de seleção está ligado às diferenças na capacidade dos indivíduos com diferentes

genótipos de deixarem descendentes para a geração seguinte. Se determinado genótipo é capaz de

deixar uma maior proporção de descendentes que a de outro, seus genes estarão representados na

geração seguinte com maior freqüência.

A seleção está ligada então à viabilidade, que pode ser definida como a capacidade de

sobrevivência de um genótipo em um meio ambiente. Esta capacidade pode ser medida pela freqüência

de determinado genótipo ou gene, nos sobreviventes em um meio. Ou pela proporção de descendentes

deixados de uma geração para outra por um determinado tipo.

A viabilidade depende da adaptação e da fertilidade conferida pelo genótipo.

Na seleção artificial o conceito de viabilidade fica substituído pelo critério de seleção usado pelo

melhorista, muito embora os processos sejam bem semelhantes.

Seleção contra genes recessivos

Vamos supor um modelo em que s é a taxa de seleção, isto é, a taxa de eliminação de

determinado genótipo, e 1-s ‚ então a taxa de viabilidade.

Em casos de dominância o genótipo do heterozigoto dominante é igual ao do homozigoto, então

também serão iguais suas viabilidades.

Genótipos Freqüências Viabilidade Freqüências

AA p2 1 p

2/(1-q

2s)

Aa 2pq 1 2pq/(1-q2s)

Aa q2 1-s q

2(1-s)/(1-q

2s)

Soma 1 1-q2s 1

F(a) = q1 = [q2(1-s) + pq]/(1-q

2s) q1 = q(1-qs)/(1-q

2s)

Esta expressão nos mostra o valor da freqüência do alelo recessivo após uma geração de

seleção contra os homozigotos recessivos com taxa s.

Vamos estudá-la para entender este processo.

Note que q varia de 0 a 1, assim como s. Para valores de q=0 ou q=1 a seleção é obviamente

impossível.

Quando s=zero indica a ausência de seleção e s=1 indica seleção máxima, que só ocorre nos

genes letais recessivos, e em melhoramento genético.

30

Se s=0 então pela fórmula q1 = q, como esperado.

Note que o denominador da fórmula jamais pode assumir valor zero. O numerador, só atingirá

este valor se q = 0, ou q e s iguais a 1.

Portanto, partindo de um valor qualquer diferente de zero ou um para “q” nunca se

atingirá valor zero para “q1”. Isto indica que, nos casos de dominância, o processo de seleção

não é capaz de, por si só, eliminar um gene da população, por mais prejudicial que ele seja.

Para confirmar vamos estudar o caso mais extremo, o dos genes letais recessivos, onde s=1.

q1 = q(1-q)/(1-q2) q1 = q/(1+q)

Nota-se de novo que q1 não será zero a não ser que q já o seja.

Esta expressão nos chama a atenção para outro fato. Note-se o denominador (1+q). Se q for

muito pequeno, digamos próximo a zero, então 1+q será praticamente 1, e pode-se dizer então que q1 é

praticamente igual a q. Isto indica a pouca eficiência desse processo em alterar a freqüência de genes

recessivos raros.

De fato, se nessas condições (s=1): q = 0,5 então → q1 = 0,33 , q = 0,2 então → q1 = 0,166 , q = 0,1 então → q1 = 0,0909.

Nota-se claramente que à medida que o valor da freqüência do gene recessivo diminui, o efeito

da seleção sobre ele diminui.

Podemos alterar esta fórmula para qt = q/(1 + tq), onde qt é a freqüência gênica após t gerações

de seleção com taxa 1 contra os homozigotos recessivos. Modificando esta fórmula chega-se a

t= (1/qt)- (1/q).

Mais uma vez pode-se confirmar a afirmativa feita.

Para diminuir à metade a freqüência de um gene com freqüência inicial 0,6 são necessárias 1,66

gerações. Para diminuir à mesma proporção um gene com freqüência inicial de 0,1 serão necessárias

10 gerações. Este fenômeno se deve ao fato de que a seleção só age sobre os homozigotos

recessivos. O gene recessivo presente no heterozigoto está isento de seleção, mantendo sempre uma

freqüência residual do mesmo.

Note que se q diminui muito, tende a zero, q2 tende a zero mais rápido que 2pq. Logo a

proporção de genes recessivos em heterozigotos passa a ser mais importante para a freqüência dos

genes recessivos que a proporção dos homozigotos recessivos. Isto pode ser mais bem visto se

estudarmos a relação entre genes recessivos nos heterozigotos e nos homozigotos, (pq/q2) = p/q.

Se q tende a zero, este valor tende a infinito.

Então a seleção agirá sobre alelos recessivos, diminuindo a sua freqüência, até‚ atingir um ponto

tal, quando este alelo for suficientemente raro, em que seu efeito será desprezível.

De fato, populações panmíticas acumulam inúmeros alelos recessivos prejudiciais, em

freqüência baixíssima, sem que sejam eliminados pela seleção. Ao longo do processo evolutivo, estes

31

alelos se manifestam em homozigose dando origem a indivíduos mal adaptados ou letais, o que dá a

esses genes aspecto totalmente indesejável. Daí o nome "carga genética", como se fossem um peso a

ser carregado pela população. No entanto, esse processo exerce um papel fundamental na evolução da

espécie, pois permite o acúmulo de inúmeros genes mutantes diferentes, que poderão ficar à disposição

do processo seletivo caso haja uma mudança nas condições ambientais. Esses alelos constituem uma

reserva de variabilidade genética para o processo evolutivo e para o melhoramento.

Seleção com ausência de dominância

Neste caso os heterozigotos são intermediários entre os homozigotos e, portanto a sua

viabilidade também deve ser.

Temos :

Genótipos freqüências Viabilidade Freqüência

AA p2 1 p

2/(1-qs)

Aa 2pq 1-(s/2) 2pq [1-(s/2)]/(1-qs)

Aa q2 1-s q

2(1-s)/(1-qs)

Soma 1 1-qs

F(a) = q1 = q (1 – s) – pqs/2

1 - qs

Examinaremos apenas o caso extremo em que s=1.

q1 = (pq/2)/(1-q) q1 = q/2

Neste caso também, apesar da eficiência da seleção contra o recessivo ser muito maior que na

dominância, não será possível ao processo de seleção eliminar o gene prejudicial. Neste caso no

entanto a diminuição da freqüência é rápida, havendo pequena chance de acúmulo dos genes

mutantes.

Seleção contra genes dominantes

Neste caso temos: Genótipos Freqüências Viabilidade

:AA p2 1-s

Aa 2pq 1-s

aa q2 1

Não é preciso examinar profundamente o modelo, para se ver que a seleção contra alelos

dominantes é muito mais efetiva que contra alelos recessivos. Qualquer alelo dominante prejudicial será

rapidamente eliminado da população. Isto explica por que na natureza, quase todos os genes

dominantes representam formas bem adaptadas e férteis, enquanto encontramos inúmeros genes

recessivos que geram em homozigose indivíduos com problemas de adaptação ou fertilidade. É

importante lembrar que no melhoramento essa situação pode não se manter. Genes recessivos podem

representar formas altamente desejáveis enquanto dominantes podem ser inferiores.

32

O efeito da seleção e a freqüência gênica

Este efeito pode ser observado pela alteração causada pela seleção em uma geração.

Na dominância este valor é q = pq2s/[1-q

2s].

Na ausência de dominância q = pqs/2[1-qs].

Se considerarmos s pequeno, o que é, em geral, verdade nos programas de melhoramento,

teremos aproximadamente:

Na dominância → q = pq2s Na ausência de dominância → q = pqs/2.

Note que estes valores tem seu máximo em q = 0,6666., com dominância, e em q = 0,5, para

ausência de dominância, diminuindo para os extremos até‚ chegar a zero quando q=0 ou q=1. Portanto,

de uma forma geral a seleção é mais eficiente para locos com freqüência gênicas intermediárias,

diminuindo sua eficiência para locos com freqüências gênicas mais extremas.

Efeito da seleção

0

0,02

0,04

0,06

0,08

0,1

0,12

0,14

0,16

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1q

∆q

dominância s=0,1

dominância s=0,5

dominância s=0,9

dominância s=1

sem dominância s=0,1



sem dominância s=1

3.8. MÉDIA DE UMA POPULAÇÃO

Para estudarmos a média em populações poderíamos imaginar o seguinte modelo genético:

Genótipo Freqüências Valor Genotípico

BB p2 z + 2u

Bb 2pg z + u + au

bb q2 z

Neste modelo p e q são as freqüência de B e b, z é um valor básico para o caráter em questão,

u é o efeito de um gene B e a é o grau de dominância. Este modelo, apesar de ser compreensível e

explicável biologicamente, causa um aumento da complexidade para a dedução das variâncias.

Um modelo simplificado, mais adequado seria obtido pela subtração do valor z+u de todos os

genótipos. Assim,

33

Genótipo Freqüências Valor Genotípico Freq. x V. Genot.

BB p2 u p

2u

Bb 2pg au 2pqau

bb q2 -u - q

2u

Média da População p2u + 2pqau - q

2u

Neste modelo os valores simbolizados são os mesmos, mas as médias obtidas são apenas

comparativas, já que os valores foram codificados. A variância será a mesma do modelo anterior. Este

modelo tem sido usado em muitos estudos clássicos de genética quantitativa e se tornou de uso

comum. Assim, para uma população panmítica, conforme representado acima, tem-se:

m = p2u + 2pqau - q

2u = u(p

2 - q

2) + 2pqau como: p

2 – q

2 = (p + q)(p – q) (2 alelos/loco)

m = u(p - q) + 2pq au

Nota-se que o valor da média é função do efeito do gene "u", do grau de dominância “a”, que

são fatores inerentes ao gene e não podem ser mudados pelo melhorista, e da freqüência dos genes.

Esta expressão, pela substituição de q por 1-p, pode ser escrita também como:

m =-u+2(u+au) p - 2au p2

O que mostra que no caso de ausência de dominância a média é uma função linear em p, ou

seja, o aumento de p causa um aumento linear da média. O mesmo não ocorre na dominância, onde a

média é uma função de segundo grau.

Ausência de dominância:. a=0 → Então m = -u + 2u p.

Max m'= 2u = 0 já que é uma reta o máximo é no infinito

Dominância completa: a=1 m = -u + 4u p -2u p2

Max m'= 2(u+au) - 4aup=0 → u+au = 2aup

se a = 1 no ponto de máximo p=1

Sobredominância (supor a=2): então substituindo em p = (1+a)/ 2a

p= 3/4, portanto o máximo da média não é com o máximo de freq de genes favoráveis.

3.9. VALOR REPRODUTIVO, VALOR GENÉTICO OU VALOR ADITIVO

Por valor ou efeito aditivo (genético ou ainda reprodutivo), entende-se o valor que e transmitido à

descendência. De outra forma pode-se entender como o valor dos genes do indivíduo. Pode ser

calculado a partir do efeito observado na própria descendência de cada indivíduo, quando cruzado ao

acaso com toda a população.

Neste caso cada descendente é formado por um gameta do indivíduo considerado e outro

tomado ao acaso da população. Se os gametas fossem todos tomados na população, não haveria

alteração na média, pois não haveria alteração na freqüência dos genes. Assim qualquer alteração na

média da descendência deverá ser atribuída à superioridade ou inferioridade genética do indivíduo

cruzado com a população. Note que só metade dos genes da descendência é proveniente do indivíduo

34

sob teste, assim a diferença observada com relação à média da população e considerada metade do

efeito aditivo do indivíduo.

Assim, considerando-se o modelo proposto acima, para o indivíduo BB, tem-se:

Gametas da População Indivíduo BB Gameta B Valor Média

p B p BB u pu

q b q Bb au qau

pu + q au

Média da descendência de BB Média da população

½ V.A.(BB) = pu + qau - u(p-q) - 2pqau = +qau + qu - 2pqau = q[u + au - 2pau]

= q[u + (1-2p)au] = 1/2 VA.

Chamando-se [u + (1-2p)au] de Alfa "". V.A.(BB)= 2q

1/2V.A.(bb) = -p[u + (1-2p)au] V.A.(bb) = -2p

1/2V.A.(Bb) = 1/2(q-p)[u + (1-2p)au] V.A.(Bb) = (q-p)

Note-se que o valor aditivo é proporcional ao número ou a freqüência de alelos favoráveis no

genótipo, o que pode ser verificado observando-se as diferenças entre os valores. O genótipo bb tem

zero alelos favoráveis e seu valor e -2p . O heterozigoto tem um alelo favorável e seu valor é (q-p) .

A diferença é α. O homozigoto BB tem dois alelos favoráveis e seu valor é 2q, sendo a diferença α.

Assim, para cada alelo favorável adicionado ao genótipo há um acréscimo de α. Este valor ficou

conhecido como efeito médio de substituição gênica (FALCONER, 1960).

Valor Fenotípico, Valor Genotípico e Valor Fenotípico Médio

Para um caráter quantitativo, tanto o genótipo como o ambiente, atuam na determinação do

caráter. Pode-se então admitir que o valor do fenótipo, de forma simplificada, seja dado por uma

expressão como P = G + E. Ou seja, o fenótipo é a soma do genótipo mais o ambiente. O valor

fenotípico é facilmente compreendido, já que é o valor observado nos indivíduos medidos. Já o valor

genotípico, que é o valor atribuído ao genótipo, não poderia ser medido de forma alguma, já que o

genótipo não se manifesta sem a influencia do ambiente. Assim, para entendermos qual é o valor do

genótipo, pode-se considerar que o mesmo seja o valor médio de todos os fenótipos manifestados por

um genótipo quando submetido a todos os ambientes possíveis. Assim, dentro de certa limitação, pode-

se entender o valor genotípico como sendo o valor fenotípico médio.

35

Comparações de Médias

A expressão da média, dada anteriormente, pode ser usada para fazer comparações entre

médias de diferentes materiais genéticos, levando a compreensão de diversos fenômenos.

Por exemplo, a heterose manifestada por híbridos ou compostos obtidos de populações

diferentes pode ser estudada por esse método.

Um composto de duas populações é obtido pela reprodução panmítica do cruzamento entre as

duas.

Assim, as freqüências gênicas seriam a média das freqüências nas populações cruzadas e a

média seria,

Média do Composto das duas populações

mc = u ( p0+pi - 1 + p0+pi ) + (p0+pi) (1 - p0+pi) au

2 2 2

Heterose H = mc - mp Hc= mc - (mo+mi)/2 Hc=1/2 au(p0-pi)

Para um híbrido, cujas freqüências gênicas são as mesmas, mas não está em equilíbrio:

Gametas na Pop i

piB qib

Gametas na p0 B p0pi BB p0qi Bb

Pop Original q0b piq0 Bb q0qi bb

F(Bb) = p0(1-pi)+pi(1-p0)

Média do híbrido entre populações mH = u[p0pi-q0qi]+(pi+p0-2pip0)au

A heterose do híbrido será: HH= mH - (mo+mi)/2 = au(p0-pi)2 HH = au(p0-pi)

2

Nota-se assim que a heterose do híbrido é superior a do composto, e que ambas são função do

efeito do loco (u), do grau de dominância (a), e do quadrado da diferença entre as freqüências gênicas

dos progenitores (populações) cruzados.

36

4. CARÁTER QUANTITATIVO

4.1. SISTEMAS DE GENES

Mendel demonstrou com seus estudos que as características hereditárias eram controladas por

fatores imiscíveis, que obedeciam a regras de combinação específica. Seus estudos, no entanto só

elucidaram uns poucos casos de herança simples, restando ainda muitíssimas dúvidas, que só com

outras pesquisas foram resolvidas. Por exemplo, ele não apontou nenhuma solução para a herança de

características que se apresentavam de forma contínua, sem apresentação de tipos definidos, como a

altura ou peso de plantas ou parte delas. Neste capítulo nos dedicaremos a entender estes caracteres,

chamados quantitativos e como os genes atuam para sua determinação.

Os Genes não atuam sozinhos, mas em conjunto. Mesmo caracteres que são controlados por

um único gene dependem, na sua formação de muitos outros. De forma didática iremos dividir os

diversos sistemas de genes em dois tipos, os sistemas de genes seriados e os sistemas de genes

múltiplos (poligenes).

Sistemas de genes seriados são aqueles em que os genes atuam em série, de modo que a

atuação de um ocorre em um passo posterior à do outro, formando uma série de eventos fisiológicos

interdependentes. Pode-se entender isso observando o esquema a seguir:

GENES A B C

ENZIMAS EA EB EC

S PA PB Produto final

Nesse esquema o substrato "S" transforma-se no produto "A", pela ação da enzima "A", que

por sua vez é codificada pelo gene "A", o produto "B", é produzido a partir do produto "A", pela ação

da enzima "B", produzida pelo gene "B", e assim por diante.

Esse tipo de sistema se expressa numa ação complementar entre genes. Um exemplo real

desse sistema é encontrado na determinação da cor de flor em Collinsia, uma espécie com algum

interesse ornamental. Neste caráter estão envolvidos diretamente dois locos, em ambos são conhecidos

dois alelos, com dominância completa:

Enzima W Enzima M

Substrato Pigmento Rosa Pigmento Azul

Sendo assim as combinações destes genes resultam nos seguintes fenótipos:

Genótipos Fenótipo W_ M_ As duas enzimas estão presentes Flores Azuis W_ mm Apenas enzima W está presente Flores Cor-de-rosa ww M_ Apenas enzima M está presente, mas seu substrato (pigmento

rosa), que é produzido a partir da enzima W, está ausente. Flores Brancas

ww mm Nenhuma das enzimas está presente Flores Brancas

37

Muitos outros casos de interação entre genes não alelos poderiam ser explicados desse modo.

O outro tipo de sistema, de genes múltiplos se caracteriza pela ação independente dos genes na

formação de um produto. Podemos imaginar que uma determinada enzima possa ser codificada por

vários locos no genótipo, cada qual sendo capaz de sintetizar uma determinada dose da mesma. Assim,

basta ter um alelo favorável em um loco para que haja a presença da enzima. No entanto, quanto maior

o número de alelos favoráveis nos locos, maior a quantidade de enzima presente, e consequentemente

mais intensa será a produção do produto final.

Esse sistema pode ser esquematizado como a seguir:

Locos (Enzimas) A B

S . Produto . . N

Em 1908 Nilsson-Ehle publicou uma pesquisa em que estudou a coloração da semente de Trigo.

Aquele autor cruzou duas variedades de trigo uma com sementes brancas e outra com sementes

vermelho muito escuro. O F1 apresentou sementes vermelho médio, e no F2 podia-se distinguir 5 cores

de sementes: vermelho muito escuro, que apareceu na proporção 1/16, vermelho escuro, que apareceu

na proporção 4/16, vermelho médio, que apareceu na proporção 6/16, vermelho claro, que apareceu na

proporção 4/16 e branco na proporção 1/16. A explicação para o fato foi dada admitindo-se fatores

imiscíveis, de acordo com a teoria de Mendel, bem como a primeira e segunda lei de Mendel, com dois

locos controlando o mesmo caráter, de modo que cada alelo favorável em qualquer dos locos era

responsável por uma dose de pigmento. Assim, temos os seguintes genótipos e fenótipos:

Genótipo Freqüência Doses Cor da semente

AABB 1/16 4 Vermelho muito escuro

AABb 2/16 3 Vermelho escuro

AaBB 2/16 3 Vermelho escuro

AAbb 1/16 2 Vermelho médio

AaBb 4/16 2 Vermelho médio

aaBB 1/16 2 Vermelho médio

Aabb 2/16 1 Vermelho claro

aaBb 2/16 1 Vermelho claro

aabb 1/16 0 Branca

Esses resultados exemplificam bem os sistemas de múltiplos fatores. Note a simetria das

freqüências no F2, bem diferente dos resultados obtidos por Mendel.

As possíveis explicações para os poligenes têm sido encontradas nos fenômenos da poliploidia,

38

na politenia e nas duplicações de seguimentos cromossômicos durante a evolução. É possível que

tenha sido vantajoso para os diversos organismos ter duplicatas dos genes, pois assim, caso ocorra

uma mutação desfavorável em um loco, esta não afetaria muito a adaptação geral do organismo. A

presença de muitos locos pode ter proporcionado também um meio para um ajuste mais fino com as

necessidades dos organismos nos diferentes ambientes.

4.2. PROPRIEDADES DO CARÁTER QUANTITATIVO.

4.2.1. Controle por muitos pares de genes

Ao contrário das observações de Mendel o caráter quantitativo é controlado por muitos genes,

por isso é chamado também de caráter poligênico.

Os genes formam sistemas de genes múltiplos, como mostrado pela primeira vez por Nilsson-

Elhe, com os genes somando seus efeitos para formação do caráter.

A conseqüência disto é que quando observamos um caráter quantitativo, não observamos a

ocorrência de apenas duas ou três classes de fenótipos, dependendo da ação gênica existente, e sim

um número maior de classes fenotípicas. Observe o exemplo de coloração de sementes de trigo acima

citado, são observadas quatro classes fenotípicas.

0

1

2

3

4

5

6

7

aabb

cc

aaBbc

c

AAbbc

c

aaBB

cc

aaBbC

c

AAB

bcc

AAbbC

c

aaBB

Cc

aaBbC

C

AAB

bCc

AAbbC

C

aaBB

CC

AAB

bCC

AAB

BCC

GENÓTIPOS

Valo

res G

en

otí

pic

os

4.2.2. Efeitos pequenos por gene sobre o fenótipo.

Por serem muitos genes formando um só caráter, cada gene contribui com uma pequena parte

da variação do caráter. Em alguns caracteres os efeitos dos diversos locos envolvidos podem ser

equivalentes, em outros, alguns locos podem possuir um efeito mais importante na determinação do

fenótipo.

4.2.3. Ação gênica.

Qualquer tipo de ação gênica pode ocorrer no controle dos caracteres poligênicos, mas a mais

comum é a ausência de dominância entre alelos. O tipo de ação gênica também tem uma importância

no número de classes fenotípicas observadas.

39

4.2.4. Ação do ambiente

Caracteres quantitativos sofrem em geral forte influência do meio ambiente, fazendo

modificações nos valores fenotípicos dos indivíduos, de modo que não se pode saber pelo fenótipo o

valor do genótipo do indivíduo.

A variação que se observa ‚ então em parte de origem genética e em parte de origem ambiental,

o que dificulta em muito a seleção nestes caracteres, e exige métodos estatísticos refinados para sua

eliminação.

As alterações ambientais não atingem os genes. Portanto não são passadas para a

descendência.

4.2.5. Distribuição de freqüências

Os Caracteres Quantitativos têm distribuição contínua, sendo essa uma das características mais

marcantes na distinção dos caracteres qualitativos.

A distribuição contínua se deve a que os muitos locos envolvidos no controle desses caracteres

ao segregarem formam inúmeras classes, muito próximas uma das outras, já que os genes têm

pequenos efeitos. Com a ação do meio ambiente essas classes desaparecem dando origem a uma

distribuição contínua.

Note-se que a continuidade ‚ apenas fenotípica, as classes genotípicas são distintas entre si.

Há caracteres poligênicos com distribuição descontínua, apesar de dependerem de muitos genes

e do ambiente. Como por exemplo, número de espigas, número de ovos, etc. Neste caso o controle é

quantitativo, mas dado ao tipo de característica ela se apresenta de forma descontínua.

Devido às propriedades dos caracteres quantitativos sua análise segue uma metodologia

diferente dos caracteres Qualitativos. Estes são analisados pela distribuição de freqüências,

descontínua, utilizando principalmente o teste X2. Os caracteres quantitativos são analisados utilizando

suas médias e Variâncias e os métodos estatísticos adequados para seu estudo.

0

5

10

15

20

25

0 1 2 3 4 5 6 7

Valores Fenotípicos

Fre

qü

ên

cia

s

0

5

10

15

20

25

1 2 3 4 5 6 7 Valores Genotípicos

Genotípicos

Fre

qü

ên

cia

s

40

5. COMPONENTES DA VARIÂNCIA FENOTÍPICA

5.1. COMPONENTES DA VARIÂNCIA DO CARÁTER QUANTITATIVO

Considerando-se que um caráter quantitativo sofre influência do genótipo e do ambiente, para o

estudo dos componentes da variância fenotípica pode-se considera o modelo básico:

yij = u + Gi + eij onde: yij = valor fenotípico do genótipo i no ambiente j;

u = média geral;

Gi = efeito do genótipo i (desvio);

eij = desvio aleatório devido ao ambiente. Assim, a variância fenotípica seria,

(Yij)2 __

[ (Yij)]

2

(u+Gi+eij)2

__ [ (u+Gi+eij)]2

S2y =

N =

N

N __

1 N __

1

então

[u2+Gi

2+eij

2 + 2(uGi+ueij+Gieij)] __ (u)

2+(Gi)

2+(eij)

2 + 2[uGi + ueij+ Gieij]

S2y

= N

N __

1

Organizando as operações, teremos:

u

2- (u)

2 Gi

2- (Gi)

2 eij

2- (eij)

2 uGi- uG

i

ueij

-

uei

j

Gieij

-

Gieij

= N

+ N

+ N

+2 N

+2 N

+2 N

N - 1 N - 1 N - 1 N - 1 N - 1 N - 1

Então: Mas:

S2y = S

2u + S

2G + S

2e + 2{ Cov(u;G) + Cov(u; e) + Cov(G;e)} S

2u = 0

Cov(u;G) = 0

Cov(u; e) =0

Isso poderia ser deduzido diretamente se nos lembrássemos que a variância de uma soma é

igual a soma das variâncias mais duas vezes as covariâncias entre os elementos da soma.

Assim: S2y = S

2G + S

2e + 2Cov(G,e)

Admitindo que genótipos e ambientes são independentes,

então Cov(Gi,eij)=0

Assim, pode-se de forma geral afirmar que

S2y = S

2G + S

2e

Os genótipos serão independentes sempre que forem distribuídos ao acaso pelos diversos

ambientes, o que em geral ocorre. Em situações experimentais, essa distribuição aleatória dos

genótipos pelo ambiente deve ser garantida para que haja independência desses efeitos.

41

5.2. COMPONENTES DA VARIÂNCIA EM POPULAÇÕES PANMÍTICAS OU ALÓGAMAS

Ao nível de um loco, considerando uma população panmítica, com um modelo, em que:

p é a freqüência do gene B, Genótipo fi Gi Gi 2

q é a freqüência do gene b, BB p2 u u

2

u é o efeito do loco e Bb 2pq au a2u

2

a é o grau de dominância bb q2 -u u

2

1

Como S2=fixi

2-(fixi)

2

S2G= p

2u

2 + 2pqa

2u

2 + q

2u

2 - [u(p

2-q

2) + 2pq au]

2

S2G= 2pq [u + (1-2p)au]

2 + (2pqau)

2 como = u + (1-2p)au

S2G= 2pq

2 + (2pq au)

2

Usando a noção de valor aditivo vista no capitulo anterior pode-se dividir o valor genotípico em

aditivo e não aditivo, ou dominante. Assim, dividindo o valor genotípico, pode-se também dividir a

variância genotípica. Isso é de fundamental importância, já que o valor aditivo é proporcional ao número

de alelos favoráveis, que efetivamente poderão ser transmitidos aos descendentes. Então a avaliação

de uma população para a seleção deverá ser feita pela variação dos valores aditivos e não dos valores

genotípicos.

A expressão da variação aditiva pode ser obtida como na tabela abaixo.

Genótipo fi Gi Valor Aditivo Desvio (ou Valor de Dominância)

BB p2 u 2q u-m-2q = -2q

2au

Bb 2pq au (q-p) au-m-(q-p) = 2pqau

bb q2 -u -2p -u-m+2p = -2p

2au

Soma 1 m 0 0 0

fi = 1 e xi=0 então (fixi)2=0 logo S

2=fixi

2

onde = u + (q-p)au m=(p-q)u+2pqau

S2A= fixi

2-(fixi)2 já que fixi=zero → efeito aditivo é um desvio da média dos genótipos

S2A= fixi

2

S2A= p

24q

2

2 + 2pq(q-p)

2

2 + q

24p

2

2

S2A= 2pq

2 [ 2pq + q

2 + p

2 -2pq +2pq] → já que p

2 + 2pq + q

2 = 1

S2A = 2pq

2

S2D =p

2 4q

4a

2u

2 +2pq 4p

2q

2 a

2u

2 +q

2 4p

4 a

2u

2

S2D= [2pq au]

2 [ q

2 + 2pq + p

2 ]

S2D = [2pq au]

2

Então, S2G = S

2A + S

2D

42

Neste modelo o efeito aditivo é independente do de dominância, o que é claro, já que o valor do

genótipo é dado pela soma dos efeitos aditivos e de dominância, e a variância genotípica é também a

soma das variâncias aditivas e de dominância, sendo, portanto, a covariância entre os efeitos aditivos e

de dominância igual a zero. Isto só será observado nos caso de populações panmíticas, e é devido a

combinação aleatória dos genes, o que faz com que qualquer efeito aditivo possa ocorrer com qualquer

efeito de dominância, havendo portanto, independência.

Uma outra maneira de entender essa divisão da variância genotípica é imaginar um modelo em

que, para o genótipo BiBj tenhamos o valor genotípico:

Gij = m + i + j + dij, em que:

Gij é o valor genotípico do indivíduo com genes "ï" e "j", composto por:

m - média geral, constante para todos os genótipos;

i - efeito do alelo Bi,

j - efeito do alelo Bj e

dij - efeito da interação entre Bi e Bj (ou efeito da dominância). Fazendo a análise como modelo fatorial teríamos:

Combinações

p B q b

p B p2 BB pq Bb

q b pq Bb q2 bb

Valores

Fator I

p B q b Médias Efeitos

Fator J p B p

2 u pq au pu + qau q

q b pq au q2 (-u) pau - qu -p

Média pu + qau pau - qu u(p-q)+2pqau

Efeitos q -p

Em que = u + (1-2p)au

Neste caso a variância total será:

S2t = p

2 u

2 + 2pq a

2u

2 +q

2 u

2 - [u(p-q)+2pqau]

2 = S

2G = S

2A + S

2D.

A variância devida ao fator I será: S2I= p (q)

2 + q (-p )

2 = pq

2 = (1/2) S

2A

A variância devida ao fator J será: S2J= p (q)

2 + q (-p )

2 = pq

2 = (1/2) S

2A

Então a variância devida à interação é S2D. Assim:

- Variância aditiva - variância dos efeitos dos alelos de um loco;

- Variância de dominância - variância devida à interação entre alelos no mesmo loco.

Se extrapolarmos para um caráter quantitativo, com vários locos, teremos efeitos aditivos e de

dominância em cada loco, além de efeitos epistáticos que podem ocorrer entre os diferentes locos.

43

Assim, considerando o genótipo BiBj ClCk ...o modelo adequado seria:

Gijlk= m + i + j + dij+ l + k + dlk.+ il + ik +jl + jk +dilk.+ dilk.+ dijl + dijk + ddijlk +....

Ou seja, além dos efeitos próprios de cada loco, devem ser incluídos efeitos de interações de

alelos nos diferentes locos. Assim, considerando todos esses efeitos independentes;

S2G = S

2Ab+ S

2Ac+ ...+..S

2An+ S

2Db + S

2Dc +....+ S

2Dn + S

2I

considerando todas as covariâncias iguais a zero e S2A= S

2Ai = S

2A1+S

2A2+...,

S2D= S

2Di = S

2D1+S

2D2 +..., então pode-se estabelecer:

S2G = S

2A + S

2D + S

2I, ao nível do caráter quantitativo.

Sendo S2I a soma de todas as variâncias devidas às interações entre alelos de locos diferentes,

ou epistasias.

As covariâncias citadas serão iguais a zero, quando não existirem ligações fatoriais entre os

genes que controlam o caráter quantitativo.

Epistasias são interações entre os genes, ou seja, o efeito conjunto de dois ou mais genes

quando juntos não pode ser expresso pela simples soma dos seus efeito isolados. Esse fenômeno é

considerado raro nos caracteres quantitativos, mas, já que são muitos genes para um mesmo caráter, é

possível que ocorra.

Ligação fatorial ocorre quando genes estão localizados em um mesmo cromossomo, a uma

distância tal que não se observa 100% de quiasmas entre eles. Quando isso ocorre, as combinações

genéticas nos gametas produzidos por indivíduos heterozigotos não serão independentes, havendo

maior probabilidade de se formarem gametas com combinações paternas, do que recombinantes.

Assim as covariâncias entre os efeitos dos genes não terão valores iguais a zero. Neste caso pode-se

ter duas situações. A fase de associação, onde os genes dominantes estão juntos no gameta de um dos

pais e os genes recessivos então no gameta do outro progenitor. A fase de repulsão, onde o gene

dominante de um loco esta junto com o recessivo do outro em um progenitor e ao contrario no outro. A

fase de repulsão ou associação depende apenas do genótipo dos progenitores dos indivíduos

heterozigotos. As covariâncias observadas, nos dois casos, têm valores idênticos, com sinais contrários.

Assim, se a probabilidade de repulsão ou associação for a mesma, isto é, se ocorrer equilíbrio de

ligação, a covariância final será zero, mesmo havendo ligação. Este fato se observa em populações

panmíticas.

Assim, a expressão S2G = S

2A + S

2D será aproximadamente verdadeira na maioria dos casos, e

pode ser considerada como geral, para fins práticos.

Em melhoramento de populações alógamas, a decomposição da variância fenotípica em

componentes é feita com base na correlação intra-classe em famílias da população.

Em geral três tipos de famílias são importantes em populações alógamas: famílias maternas,

famílias de irmãos perfeitos e famílias de auto-fecundação.

44

Famílias maternas são as obtidas pela simples colheita das sementes de uma planta. Por

exemplo, uma espiga de milho é uma família cujos indivíduos são filhos de uma planta mãe com

diferentes pais, já que a polinização é ao acaso.

Famílias maternas em geral podem ser consideradas como famílias de meio-irmãos,

particularmente se a população for grande.

Famílias de irmãos perfeitos são obtidas pela polinização cruzada entre duas plantas específicas.

Famílias de auto-fecundação são obtidas pela auto-fecundação de plantas da população. Em

geral são designadas pela letra S seguida de um número, que indica o número de auto-fecundações

feitas. Por exemplo, S1, família obtida de uma auto-fecundação, S2, família obtida de duas auto-

fecundações, ou seja, pela auto-fecundação de uma S1.

A variação pode ser dividida em: "entre famílias", que representa as diferenças entre as

mesmas, e "dentro de famílias", que representa as diferenças entre plantas dentro das famílias.

Os valores das variâncias entre e dentro das famílias é função dos coeficientes de parentesco

entre os indivíduos das famílias e das variâncias genéticas e ambientais, e pode ser resumidos como no

quadro abaixo.

Para a determinação dos valores dos componentes pode-se fazer um experimento, onde os

tratamentos são famílias. O delineamento pode ser qualquer um, mais os mais empregados são o

"látice" e o "blocos ao acaso", ambos com Esperanças de Quadrados Médios semelhantes. Qualquer

que seja o delineamento deve-se fazer uma estimativa da variância "dentro" de parcelas para estimar a

variação dentro das famílias e as famílias devem ser tomadas ao acaso dentro da população, embora

nem sempre isso aconteça, já que geralmente há interesse em usar famílias obtidas de plantas

selecionadas.

Vamos supor um bloco ao acaso com informação dentro das parcelas, onde os tratamentos são

J famílias tomadas ao acaso de uma população. O modelo matemático pode ser representado por:

Yijk = m + bi + pj + eij + dijk ,

Onde: m é a média geral,

bi é o efeito de blocos, com i variando de 1 a I,

pj é o efeito de progênie, com j variando de 1 até J,

eij é o efeito do erro entre parcelas e

dijk é a variação residual dentro das parcelas, com k variando de 1 até K.

As somas de quadrados são calculadas pelas seguintes expressões:

Variância S2

A S2D S

2E

Entre meio irmãos 1/4 0 0

Dentro de meio irmãos 3/4 1 1

Entre irmãos perfeitos 1/2 1/4 0

Dentro de irmãos perfeitos 1/2 3/4 1

Entre S1 1 1/4 0

Dentro de S1 1/2 1/2 1

45

Quadro da Análise da Variância

F V GL S Q Q M E(QM)

Repet. I - 1 (1/JK)Yi..2 - C

Progênies J - 1 (1/IK) Y.j.2 - C M1 S

2d + K S

2e + IK S

2p

Erro (I-1)(J-1) SQPAR - SQR - SQP M2 S2d + K S

2e

Parcelas IJ - 1 (1/K) Yij.2 - C

Dentro (K-1)IJ SQT - SQPAR M3 S2d

Total IJK - 1 Yijk2 - C

C= Y...2/IJK

Nesse experimento

M3 estima S2d - variância média dentro das famílias empregadas, conforme o quadro anterior.

M2 estima a soma S2d+KS

2e, então

(M2 - M3)/K estima S2e - variância do erro experimental.

M1 estima a soma S2d + K S

2e + IK S

2p, então

(M1-M2)/IK estima S2p, que é a variância entre progênie.

A variância total (fenotípica) é S2F= S

2d + S

2e + S

2p

5.2. COMPONENTES DA VARIÂNCIA FENOTÍPICA EM UMA POPULAÇÃO AUTÓGAMA

Plantas autógamas são aquelas que tendem naturalmente a auto-fecundação. Embora a taxa de

auto-fecundação natural seja variável, para se estudar mais facilmente o assunto será considerado que

esta seja constante e igual a 100%. Nesta situação hipotética todas as plantas se auto-fecundam,

produzindo a cada geração 50% mais menos heterozigotos. Assim, supondo-se a situação extrema de

uma população onde inicialmente só há heterozigotos, para um loco (loco A, por exemplo), a taxa de

heterozigose cairá de 100% na primeira geração, para 50% na segunda, 25% na terceira, e assim

sucessivamente até tornar-se insignificante. Após muitas gerações de auto-fecundação a população

será constituída de indivíduos homozigotos, na proporção 50% AA e 50% aa. Após atingir esse estado

ela não mais se alterará, estando, portanto em equilíbrio.

Distribuição Genotípica nas gerações de auto-fecundação

Nº de gerações

0 Aa (100%)

1 AA(25%) Aa(50%) aa(25%)

2 AA(37,5%) Aa(25%) aa(37,5%)

3 AA(43,75) Aa(12,5%) aa(43,75)

↓ ↓ ↓ ↓

∞ AA(50%) (0) Aa aa(50%)

Se forem considerados vários locos, em um caráter poli gênico, por exemplo, este decréscimo

ocorrerá individualmente para todos eles, sendo os genótipos formados após o equilíbrio, as

combinações dos homozigotos para os locos que estavam inicialmente em heterozigose. Por exemplo,

se forem dois locos inicialmente com indivíduos AaBb, no equilíbrio ter-se-á 25% AABB, 25% AAbb,

25% aaBB e 25% de aabb. Assim, pode-se ver que o número de genótipos homozigotos formados em

uma população autógama será 2N, sendo N o número de locos inicialmente em heterozigose.

46

A queda da taxa de heterozigose, que para um loco é 50% por geração, será menor quando

forem considerados vários locos, já que indivíduos com alguns locos em homozigose e outros em

heterozigose são considerados heterozigotos. Partindo-se inicialmente de um heterozigoto, a proporção

de locos em homozigose por geração de auto-fecundação, pode ser obtida pela expressão:

P = [(2M - 1) / 2

M]N Onde: N → de pares de genes segregantes e

M → nº.de gerações de auto-fecundação.

Pode-se notar que a queda na heterozigose será mais lenta quando forem considerados muitos

locos. Por exemplo, se forem considerados 5 locos segregantes, em 6 gerações a heterozigose será

92,4%, já com 20 locos segregantes será apenas 73%.

Mesmo assim, após certo número de gerações, pode-se considerar que a proporção de

heterozigotos nas populações autógamas é insignificante. Convém lembrar que a taxa de auto-

fecundação na prática nunca é 100%, portanto sempre haverá um resíduo de heterozigose. Para efeito

didático esse resíduo será considerado nulo.

Se considerar-se uma população natural, dificilmente ela terá se originado de heterozigoto, como

foi mostrado antes. Portanto fica mais real considerar-se uma população onde as freqüências gênicas

sejam p, para o alelo A e q para o alelo a. Na tabela abaixo se pode ver que o processo será

basicamente o mesmo, com a diferença que as freqüências das linhagens produzidas não serão meio,

mas p para o homozigoto AA e q para o homozigoto aa.

Distribuição Genotípica em uma população autógama natural

Número de

Gerações

pA e qa

0 p2 AA 2pq Aa q

2 aa

1 (p2+pq/2)AA pq Aa (p

2+pq/2)aa

↓ ↓ ↓ ↓

n p AA 0 Aa q aa

Como conseqüência dessas auto-fecundações as populações autógamas apresentam as

seguintes características:

1) Praticamente não há heterozigotos.

2) A população é composta por misturas de linhas puras (linhagens homozigotas), que provêm

da auto-fecundação de indivíduos homozigotos.

3) A variação entre linhagens é de origem genética, podendo haver também variação ambiental,

Já a variação dentro de uma linhagem é apenas ambiental.

4) Genes que conferem menor adaptação ao meio são facilmente eliminados pelos processos

evolutivos, principalmente seleção natural e oscilação genética, já que se manifestam sempre em

homozigose.

5) Não há reserva de genes recessivos, o que diminui a variabilidade.

47

6) A população permanece estável se não houver seleção, migração genética, oscilação

genética, mutações ou cruzamentos.

7) Após um cruzamento, a população chegará ao estado estável em muitas gerações.

Como se pôde ver no parágrafo anterior, em uma população autógama em equilíbrio, tem-se

variação entre linhagem, que é genética e ambiental, e variação dentre das linhagens, que é apenas

variação ambiental. A variação genética, nesse caso, será composta apenas de variância Aditiva e parte

da variância epistática, chamada Aditiva (que é devida à interação entre efeitos aditivos de diferentes

locos). A variância de dominância não está presente nesse caso, pois não existem heterozigotos na

população. Assim, mesmo que os genes tenham ação de dominância, ela não se manifestará.

Partindo-se de um cruzamento, a situação torna-se diferente, já que haverá heterozigotos nas

gerações seguintes, porém com proporções decrescentes a cada geração. Sendo assim, os

componentes da variância serão diferentes a cada geração de auto-fecundação, havendo um aumento

da variância aditiva e um decréscimo da variância de dominância, até que esta seja de novo

insignificante. Na tabela seguinte, pode-se ver a variação dessas variâncias ao longo das gerações.

Na tabela foi assumindo como base a geração F2. Assim, o número 1 representa a variância

integral, como aparece no F2, as demais frações referem-se à proporção em relação a essa geração.

Pode-se ver que ao longo das gerações de auto-fecundação, a variância aditiva tende a 2, ou

seja o dobro da esperada para o F2, e a de dominância tende a zero.

Componentes das variâncias fenotípicas das populações autógamas

Geração N aut VA VD VE

P1 0 0 1

P2 0 0 1

F1 0 0 1

F2 1 1 1 1

Entre linhas F3 1 1/4 0

Dentro de linhas F3 1/2 1/2 1

Total de F3 2 3/2 3/4 1

- -

FN+1 N [2-(1/2) N-1

] [2N-1]/4

N-1 1

N - número de auto-fecundações da geração

48

6. CORRESPONDÊNCIA ENTRE FENÓTIPO E GENÓTIPO

Imaginando-se o processo de seleção mais simples, onde o melhorista escolhe os melhores

indivíduos, verifica-se que o valor disponível para o melhorista é o valor fenotípico. Assim, um indivíduo

poderá ser selecionado ou não de acordo com o valor fenotípico por ele expresso. Para que essa

seleção seja efetiva os indivíduos selecionados devem transmitir aos seus descendentes os melhores

genes. Isso, no entanto só ocorrerá se aos melhores fenótipos selecionados pelo melhorista

corresponderem os melhores genótipos bem como os melhores genes. Por isso pode-se dizer que a

seleção só será eficiente se houver correspondência entre o fenótipo e o genótipo, em especial com os

genes nele contido.

As maneiras de se estudar a correspondência entre variáveis, são o coeficiente de regressão

linear, o coeficiente de correlação e o coeficiente de determinação.

Coeficiente de regressão linear indica a inclinação de uma reta que melhor explica o

relacionamento entre duas variáveis.

Assim se X e Y são as variáveis e Y é colocado no eixo vertical de um gráfico e X no eixo

horizontal, colocando-se os pontos que representam os valores pareados (X,Y) no gráfico, nota-se uma

certa distribuição. Se as variáveis são não correlacionadas essa distribuição será aleatória e tenderá a

formar um círculo, não mostrando portanto nenhuma tendência. Se as variáveis são correlacionadas, a

forma da distribuição será de uma elipse, indicando uma tendência dos dados. A reta de regressão é a

reta média que passa o mais próximo possível de todos os pontos de modo que se tem o menor

somatório dos quadrados das distâncias dos pontos à reta.

A equação de uma reta pode ser escrita como:

Y = a + bX Y → variável dependente,

X → variável independente,

a → o coeficiente linear, (valor de Y quando X=0)

b → coeficiente angular da reta, ou coeficiente de inclinação da reta.

Este coeficiente é dado pela tangente do ângulo formado pela reta com o eixo de X, de modo

que, dado dois pontos, pode ser dado também pela divisão do cateto oposto do triângulo formado pela

reta e as perpendiculares ao eixo de X que passam pelos pontos, pelo cateto adjacente. Esse fato é

muito útil, pois assim pode-se escrever:

Y = b X. ou seja uma diferença em Y é igual a diferença correspondente em X vezes b.

Pode-se obter o valor do coeficiente de regressão pela formula:

bXY =

cov(X,Y)

S2X

Por convenção escreve-se sempre a letra b seguida das variáveis usadas como índice, sendo

sempre a primeira a variável independente. Assim lê-se coeficiente de regressão de Y sobre X.

49

Para aplicar esse coeficiente à relação fenótipo x genótipo deve-se considerar o genótipo como

variável dependente, já que este é desconhecido. A covariância entre fenótipo e genótipo pode ser

obtida com o auxilio do modelo usado anteriormente:

Yij = u + Gi + eij

Assim, Cov(F,G) = Cov [(u + Gi + eij), Gi]

Como a covariância é uma soma de produtos dividida pelo grau de liberdade, pode-se usar a

propriedade distributiva dos produtos e fazer:

Cov(F,G) = Cov(u,Gi) + Cov (Gi,Gi) + Cov (eij,Gi)

A primeira covariância é nula, pois envolve uma constante. A segunda é a covariância da variável

Gi com ela própria, sendo portanto sua variância (S2G). A terceira deve tender a zero, já que como foi

discutido antes, genótipo e ambiente são variáveis independentes.

Assim, Cov(F,G) = S2G Portanto

Vê-se portanto que a relação entre os desvios dos valores fenotípicos e os desvios dos valores

genotípicos para um caráter quantitativo, em uma população é igual a relação entre a variância

genotípica e a variância fenotípica. Pode-se dizer que para uma unidade de valor fenotípico aumentada

no fenótipo, haverá um acréscimo médio correspondente de bFG nos valores dos genótipos dos

indivíduos. Assim, quanto maior for bFG, maior a correspondência entre o fenótipo e o genótipo, e mais

fácil será selecionar, já que selecionando os bons fenótipos esta se selecionando os bons genótipos.

Coeficiente de correlação é um valor sempre associado ao coeficiente de regressão.

Enquanto, o coeficiente de regressão mostra a forma como duas variáveis se relacionam, o coeficiente

de correlação indica o grau de associação entre elas.

O coeficiente de regressão (b) indica a tendência média da distribuição conjunta das duas

variáveis, os pontos formados poderão estar mais ou menos dispersos em relação a reta de regressão.

O coeficiente de correlação (R) indica justamente o grau de dispersão dos pontos em torno da

reta. O coeficiente de correlação varia de -1 a +1.

R=0 → pontos distribuídos ao acaso em torno da reta, e não há associação entre as variáveis.

R=1 → os pontos estarão exatamente sobre a reta, sem desvios → A associação é máxima.

R=-1 → os pontos estarão exatamente sobre a reta, mas nesse caso a inclinação da reta é negativa, o que indica associação inversa entre as variáveis.

A expressão do coeficiente de correlação é:

R =

Cov(X,Y)

SX SY Aplicando-se para o caso da correspondência entre o fenótipo e o genótipo tem-se:

R =

Cov(F,G) =

S2G

= SG R

= √ bFG

SF SG SF SG SF

bFG =

Cov(F,G)

= S

2G

S2F S

2F

50

Reforçando a importância da razão entre as variâncias genotípica e fenotípica como parâmetro

para avaliar populações que serão submetidas a seleção.

O coeficiente de determinação (R2) - indica o grau de influência que a variação de uma variável

tem sobre a variação de outra.

Sendo assim, R2 = bFG, que é a razão entre as variâncias genotípicas e fenótipicas.

A razão entre estas variâncias é conhecida como herdabilidade no sentido amplo, e é

representada geralmente como R2.

A herdabilidade no sentido amplo poderia ser usada como indicadora da eficiência da seleção,

onde não houvesse efeitos de dominância, porém na presença destes é de pouco valor, já que os

mesmos mascaram os valores dos genes, fazendo com que indivíduos com genes diferentes

expressem valores genotípicos semelhantes. Em vista disso, o valor mais indicado para orientar a

seleção é o valor aditivo.

O valor aditivo é proporcional ao número de alelos favoráveis em um genótipo, e expressa a

superioridade que pode ser transmitida à descendência. Por isso é importante estudar a

correspondência entre o fenótipo e o valor aditivo.

Este estudo pode ser feito da mesma forma que o relativo aos valores genotípicos, bastando

para isso considerar-se o modelo simplificado:

Yij = u + Ai + Di + eij

Neste modelo o efeito do genótipo Gi foi dividido em efeito aditivo Ai e efeito de dominância Di.

Esses efeitos são independentes entre si, como vimos no capítulo 5, além de serem independentes do

ambiente, já que o genótipo o é.

Assim,

Cov(F,A) = Cov[(u+Ai+Di+eij), Ai]

Cov(F,A)= S2A

Sendo assim temos:

bFA =

S2A

= R

2FA

= h

2 RFA

= SA

= h

S2F SF

A relação entre a variância aditiva e a variância fenotípica é chamada de herdabilidade no

sentido restrito, ou simplesmente de herdabilidade, e é um indicador da eficiência da seleção, e pode

ser interpretado como sendo o acréscimo em valor aditivo correspondente a um acréscimo de uma

unidade de fenótipo. Os valores aditivos são proporcionais ao número de genes favoráveis. Assim, se

h2 for alto, os bons fenótipos corresponderão aos bons valores aditivos e também aos genótipos que

transmitirão à descendência maior número de alelos favoráveis.

Este valor será útil ainda na previsão dos efeitos da seleção, pelo cálculo do ganho genético.

51

7. SEMELHANÇA ENTRE PARENTES

Desde muito tempo o ser humano observa que indivíduos aparentados são semelhantes, como

pais e filhos, por exemplo, e que essa semelhança pode ser maior ou menor de acordo com o grau de

parentesco. Neste capítulo vamos aprender como quantificar o grau de parentesco e a semelhança

entre parentes, e ver como isso pode ser usado no melhoramento genético.

Em primeiro lugar é preciso saber-se que indivíduos aparentados são semelhantes porque têm

genes em comum.

Podemos dizer que dois genes podem ser idênticos por terem a mesma função no organismo,

mesmo que tenham origens diferentes. Dois genes podem ser idênticos também por sua origem, isto é,

um é cópia do outro ou ambos são cópias de um gene anterior em um ancestral comum.

Assim, pode-se usar essa noção de genes idênticos por descendência (IPD) para quantificar o

grau de parentesco, já que genes IPD só ocorreram em parentes. As medidas de parentesco então

serão na verdade probabilidades de indivíduos terem genes IPD.

As medidas apresentadas aqui se referem a dois genes, que podem estar em um ou dois

indivíduos. Medidas de parentescos mais gerais, para quatro genes podem ser encontradas em

COCKERAM E WEIR (1993) e são especialmente úteis para populações endogâmigas.

7.1. Coeficiente de Coancestralidade

Define-se como a probabilidade de tomarem-se genes ao acaso, em um loco, em dois indivíduos

e esses genes serem idênticos por descendência.

Sendo assim, se considerarmos o indivíduo x com os alelos X1 e X2 e o indivíduo y com os alelos

Y1 e Y2, o coeficiente de coancestralidade será:

fxy = {P[X1=Y1] +P[X1=Y2] +P[X2=Y1] +P[X2=Y2]}/4

Note-se que fxy = fyx.

Se considerarmos pai e filho, sabemos que dos dois alelos presentes no pai um passou para o

filho e que o outro alelo do filho é de procedência materna. Assim, se a mãe não tem parentesco com o

pai, a probabilidade de se tomar genes ao acaso, um no pai e outro no filho, e eles serem IPD, é de 1/4.

Esse valor pode ser facilmente calculado usando-se o quadro a seguir.

Filho

A1

(1/4) A2

(1/4) Gene Materno

(1/2)

Pai A1 (1/2) (1/8) --- ---

A2 (1/2) --- (1/8) ---

fPF= (1/8) + (1/8) = (1/4)

Nesse quadro A1 e A2 são os alelos paternos e M o alelo de origem materna.

Esta maneira de calcular é geral e pode ser usada em qualquer caso. Por ela pode-se por

exemplo descobrir que o coeficiente de coancestralidade do indivíduo com ele mesmo é 1/2. Há no

52

entanto um meio mais fácil de chegar ao valor do coeficiente que funciona sempre que se pode traçar

um "pedigree" dos indivíduos considerados.

Observando que em qualquer caso a probabilidade de um gene passar de pai para filho (ou mãe

para filho) é sempre 1/2, para genes autossômicos, estabeleceu-se a expressão:

fxy = (1/2)N+1

Onde é símbolo do somatório, que deve ser feito considerando cada ancestral comum, e N é o

número de passagens de genes de progenitor para descendente.

Lembramos que para efeito desse cálculo o indivíduo é considerado ancestral dele mesmo.

Por exemplo no caso anterior, pai e filho, há uma passagem. Assim, fPF=(1/2)2 = 1/4. Obtém-se

assim o mesmo resultado com menor esforço.

Considerando irmãos perfeito, temos dois ancestrais comuns (pai e mãe), cada qual

apresentando duas passagens de genes. Assim, fIP = (1/2)3 + (1/2)

3 = 1/4

7.2. Coeficiente de Endogamia

É definido como a probabilidade, em um loco, de os dois genes de um indivíduo serem idênticos

por descendência. Em qualquer indivíduo os genes em um loco autossômico são um de origem paterna

e outro de origem materna. Além disso, dada a natureza do processo reprodutivo, esses alelos podem

ser considerados como tomados ao acaso um no pai e o outro na mãe (os gametas se combinam ao

acaso). Assim, a probabilidade dos dois alelos serem idênticos por descendência será igual a

coancestralidade dos pais.

Podemos estabelecer então que

FZ = fXY , se X e Y são os pais de Z

Como fica claro só haverá endogamia se os pais forem aparentados.

7.3. Coeficiente de Parentesco

É a probabilidade média dos genes em um indivíduo serem idênticos por descendência aos

genes de outro indivíduo.

Considerando o indivíduo x, com genes X1 e X2, e o indivíduo y, com genes Y1 e Y2, a

probabilidade média dos genes de x estarem também em y.

xy = Rxy = {P[X1=Y1 ou X1=Y2] + P[X2=Y1 ou X2=Y2]}/2

Rxy = [P(X1=Y1)+ P(X1=Y2)+ P(X2=Y1)+ P(X2=Y2)]/2

Ou seja, Rxy = 2 fxy

Sendo assim podemos usar a fórmula prática para esse cálculo:

Rxy = (1/2)N

53

7.4. Coeficiente de Dominância

É a probabilidade dos dois genes em um indivíduo serem idênticos por descendência aos dois

genes no mesmo loco no outro indivíduo ao mesmo tempo.

Considerando o indivíduo x, com genes X1 e X2, e o indivíduo y, com genes Y1 e Y2, esta

probabilidade é:

Dxy = P(X1=Y1) . P(X2=Y2) + P(X1=Y2) . P(X2=Y1)

Considerando o gene marcado com o número 1 como de origem paterna e o gene marcado com

o número 2 de origem materna, e dada a natureza aleatória da combinação dos gametas, podemos

dizer que X1 é um gene tomado ao acaso no pai de x e Y1 um gene tomado ao acaso no pai de y.

Assim,

Dxy = fpxpy . fmxmy + fpxmy . fmxpy

Outra forma de se obter esse resultado ‚ pela fórmula:

Dxy = 4 (1/2)N

onde N é o número de passagens de genes em um pedigree que forma um circuito fechado.

Essa fórmula porém deve ser usa com cuidado.

7.5. Efeito da Endogamia sobre o parentesco

Todos os cálculos de probabilidade feitos até aqui, partiram da premissa de os ancestrais

originais tinham dois genes diferentes, ou seja que não era endogâmico. Indivíduos endogâmicos têm

uma probabilidade de terem genes idênticos em seus locos. Isso obviamente alterará o parentesco.

Consideremos o exemplo usado para o cálculo da coancestralidade, pai e filho, supondo agora

que o pai tem uma endogamia expressa pelo coeficiente Fp.

Então ele terá constituição A1A1 com probabilidade Fp e A1A2 com probabilidade 1-Fp.

Se ele for A1A1 o filho será A1 . E nesse caso o coeficiente de coancestralidade será 1/2.

Se for A1A2 o coeficiente será 1/4, como foi visto.

Então o valor médio será:

fPF = (1/4) (1-Fp) + (1/2) Fp ou fPF = (1/4) (1+Fp)

Em todos os casos essa forma se repete e, como as probabilidades referentes aos ancestrais

são independentes, o coeficiente deve ser multiplicado por (1+Fac) para cada ancestral comum.

O coeficiente de parentesco deve também ser corrigido, quando os próprios indivíduos

considerados forem endogâmicos sendo:

Rxy = (1/2)N (1+Fac)/ [(1+Fx)(1+Fy)]

0.5

Essa correção, no entanto, altera muito pouco o resultado.

54

7.6. Covariância entre parentes

Pelo fato de terem genes em comum, indivíduos aparentados têm valores semelhantes para

seus fenótipos. Essa semelhança pode ser expressa pela covariância entre eles, e a mesma dependerá

do parentesco.

Para um único loco, podemos considerar o modelo:

Gij = m + i + j + ij onde Gij - valor do genótipo composto pelo alelo Ai Aj,

m - média, (inclui os efeitos de todos os outros genes que afetam o caráter),

i - efeito do alelo “i”,

j - efeito do alelo ”j” e

ij - efeito conjunto dos alelos “i” e “j” (efeito de dominância).

Supondo todos os efeitos independentes, o que de fato ocorre em populações panmíticas, então:

Cov(Gij,Gi‟j‟) = Cov[(m + i + j + ij),( m + i‟ + j‟ + i‟j‟)]=

Cov( m,m) + Cov(m, i‟ ) + Cov(m ,j‟) + Cov(m , i‟j‟) +

Cov( m, i) + Cov(i, i‟ ) + Cov(i ,j‟) + Cov(i, i‟j‟) +

Cov( m, j) + Cov(j, i‟ ) + Cov(j ,j‟) + Cov(j , i‟j‟) +

Cov( m, ij) + Cov(ij, i‟ ) + Cov(ij ,j‟) + Cov(ij , i‟j‟)

Todos os termos que envolvem m são nulos, já que m é uma constante.

Os termos que envolvem efeitos aditivos e de dominância ( e ) também são nulos pois esses

efeitos são não correlacionados em uma população panmítica. Então:

Cov(Gij,Gi’j’) = Cov(i, i’ ) + Cov(i ,j’) + Cov(j, i’ ) + Cov(j ,j’) + Cov(ij , i’j’)

Considerando que o alelo Ai tem freqüência p e valor aditivo q , e o alelo Aj tem freqüência q e

valor aditivo -p, onde ={ u + (q-p)au}, como foi visto anteriormente, então:

Alelo i freq. Alelo j freq. i j

A p A p q q

A p A q q -p

a q A p -p q

a q A q -p -p

0 0

Cov(i, j ) = p2q

2

2 - p

2q

2

2 - p

2q

2

2 + p

2q

2

2 = 0 na população panmítica, para não

parentes, onde os genes se combinam realmente ao acaso.

Se os indivíduos forem parentes os alelos i e j têm uma probabilidade fxy de serem idênticos por

descendência, e, portanto não estarem combinados ao acaso. Assim, 1- fxy dos alelos estão

combinados ao acaso e têm covariância zero e fxy são idênticos e têm covariância

Alelo Freq i i’

A p q q

a q -p -p

0 0

55

Cov(i,i’) = pq2

2 + p

2q

2 = pq

2 = (1/2)

2A

Assim Cov(Gij,Gi’j’) = 4 fxy (½)2A + Cov(ij , i’j’)

Os efeitos de dominância para os genótipos no mesmo modelo adotado acima são:

para AA → ij = -2q2au

Aa → ij =2pq au

aa → ij = -2p2au.

Da mesma forma que a covariância aditiva, nesta teremos valor zero se os efeitos de dominância

forem pareados ao acaso. Mas se os indivíduos tiverem os mesmos efeitos de dominância, o que ocorre

quando são parentes com probabilidade igual a Dxy , teremos:

Gij freq Gi’j’ ij i’j’

AA p2 AA -2q

2au -2q

2au

Aa 2pq Aa 2pq au 2pq au

aa q2 aa -2p

2au -2p

2au

Média 0 0

Cov(ij , i‟j‟) = p2 (-2q

2au) (-2q

2au) + 2pq (2pq au)(2pq au) + q

2(-2p

2au)(-2p

2au)

Cov(ij , i‟j‟) = 4p2q

2 au

2[ q

2 + 2pq + p

2]

Cov(ij , i’j’) = 4p2q

2 au

2 =

2D

Assim, Cov(ij , i‟j‟) = 0, com probabilidade 1- Dxy e

Cov(ij , i‟j‟) = 2D , com probabilidade Dxy .

Então

Cov(Gij,Gi’j’) = 2 fxy 2A + Dxy

2D

A derivação original dessa expressão foi apresentada por COCKERHAM (1954), que incluiu também

epistasias, como segue:

Cov(x,y) = xy S2A + Dxy S

2D + xy

2 S

2AA + Dxy

2 S

2DD + xyDxy S

2AD + .......

Onde:

S2A - variância aditiva,

S2AA - variância devido a epistasia aditivo aditivo (envolvendo dois alelos, um em cada loco),

S2D - variância de dominância,

S2AD - variância de efeito epistático aditivo dominante (dois alelos de um loco e um do outro),

S2DD - variância de efeito epistático dominante dominante (dois alelos de um loco e dois do outro).

A expressão se extende para efeitos epistáticos de três locos, quatro locos, etc. Mas observa-se

que os coeficientes são os mesmos para um loco elevado ao número de locos envolvidos. Como estes

coeficientes são em geral menores que um (coeficientes maiores que um ocorrem em alguns casos de

endogamia), os coeficientes das variâncias epistáticas são sempre menores que das variâncias aditiva e

de dominância. Podemos então em geral desprezar estas últimas.

56

8. PROGRESSO GENÉTICO

Chama-se progresso genético a alteração na média dos descendentes dos indivíduos

selecionados, em relação à descendência de toda a população. Esse valor é de importância prática e

teórica, na avaliação dos programas de seleção e na comparação dos métodos de seleção, a fim de

determinar qual o melhor método para cada situação particular.

Pode-se calcular o progresso genético de duas maneiras:

Progresso genético realizado, que é aquele que se observa após a prática da seleção, pode

ser calculado pela subtração da média da população antes da seleção da média dos descendentes dos

indivíduos selecionados.

Progresso genético esperado é calculado por técnicas de regressão linear, supondo-se para

isso que o relacionamento entre os valores fenotípicos de indivíduos em gerações subsequentes e

linear. É mais usado para comparações teóricas entre métodos ou para avaliar o potencial de

populações para o uso de certos métodos de seleção.

Para esse cálculo podem-se imaginar duas variáveis, a primeira é o valor em que a seleção será

baseada, que será a variável independente. A segunda é o valor que deverá ocorrer na descendência,

que é a variável dependente.Assim, supondo o modelo:

Yi = a + bXY Xi onde Yi é o valor do descendente;

Xi é o valor do ancestral selecionado

bXY é o coeficiente de regressão linear entre esses valores e

a é o coeficiente linear.

Para eliminar o inconveniente do coeficiente linear, trabalha-se usando a média como base. Para

isso, supõe-se que a média das gerações envolvidas seja a mesma, o que de fato seria esperado se

não houvesse seleção. A reta de regressão sempre passa pela média, então se pode afirmar que:

Ym = a + bXY Xm onde m indica a média para as variáveis.

Assim, subtraindo da primeira equação a segunda, tem-se

Yi -Ym = bXY (Xi - Xm) → outra forma de representar a linha reta.

Xi-Xm é a diferença entre o indivíduo selecionado e a média da população - Diferencial de Seleção,

Yi -Ym – Progresso Genético - é o progresso obtido com essa seleção e

bXY é o mesmo coeficiente anterior.

Considera-se Ym = Xm como foi visto antes.

O coeficiente bXY é obtido a partir da covariância entre parentes e da variância de X (S2x).

A covariância entre parentes é função do parentesco genético e, em populações panmíticas,

pode ser expressa de forma aproximada por:

Cov(X,Y) = RXY S2A + DXY S

2D onde X e Y são os parentes considerados,

RXY o coeficiente de parentesco aditivo,

S2A a variância aditiva,

DXY o coeficiente de dominância e

S2D a variância de dominância.

57

8.1. SELEÇÃO FENOTÍPICA

Suponha-se um caso simples, onde se faça seleção em apenas um dos progenitores, pai ou

mãe, e o resultado da seleção seja observado nos filhos na geração seguinte.

Nesse caso → X é o valor fenotípico do progenitor selecionado e

→ Y o valor esperado no seu filho na geração seguinte.

A equação Yi-Ym = bXY (Xi-Xm) pode ser estabelecida para cada indivíduo selecionado, assim

pode-se trabalhar com a média do grupo selecionado e com a média dos descendentes destes, ao invés

de valores individuais.

Assim, Yi passa a ser a média dos descendentes dos indivíduos selecionados,

Ym=Xm é a média da população,

Xi a média dos valores fenotípicos dos indivíduos selecionados e

bXY será função da covariância pai e filho e da variância fenotípica dos pais.

Chamando

Yi -Ym de PG (Progresso Genético) e Xi-Xm de DS (Diferencial de Seleção),

e considerando Variância dos Pais = Variância Fenotípica (S2F)

PG = bPF (DS)

cov(pai, filho) = RPFS2A+dPFS

2D = (1/2) S

2A

bPF =

(1/2) S2A

= (1/2) h

2

S2F

Então se nós selecionarmos os pais pelos seus valores fenotípicos, tomando as mães ao acaso

teremos:

PG = (1/2) h2 DS

Seleção nos dois sexos

Se os pais e as mães forem selecionados, considerando uma população panmítica, então,

teremos dois progressos genéticos sendo obtidos independentemente, um pela seleção de gametas

masculinos e outro pela seleção de gametas femininos. Considerando que a seleção em um sexo não

interfere na seleção no outro sexo (o que é apenas aproximado), então:

PG = PG(♀) + PG(♂) = bMF(DS♀) + bPF(DS♂) = (1/2)h2(DS♀) + (1/2)h

2(DS♂).

Essa forma de expressar o PG é mais própria para animais, onde a seleção é separada para os sexos.

Se: DS♀ = DS♂ = DS então PG = h2(DS)

que é mais válido para plantas, onde muitas vezes os dois sexos estão em um só indivíduos.

Intensidade de Seleção

O cálculo do diferencial de seleção é muitas vezes trabalhoso e exige a medição de todos os

indivíduos. Quando se pretende apenas avaliar a população ou em estudos teóricos, é mais prático usar

58

o diferencial de seleção dado em desvios padrões fenotípicos, ou como também é chamada, a

intensidade de seleção.

Para populações que tenham distribuição normal e com seleção truncada, isto é, quando se faz

a seleção a partir de certo valor, cortando a distribuição de modo que qualquer valor acima deste será

selecionado e qualquer valor abaixo será descartado, pode-se obter o diferencial de seleção de forma

indireta, usando-se a Tabela de Z. Para isso deve-se calcular i = Z/P, onde Z é a ordenada da curva

normal standartizada no ponto de truncamento e P a probabilidade de valores acima deste ponto (ou

seja a serem selecionados).

f(z)= {EXP[-zi2/2]}/(2)

(.5)

A tabela abaixo apresenta valores de i para alguns valores de percentagem de seleção:

Tabela 8.1. Valores de intensidade de seleção (i) associados a diferentes percentagens de indivíduos

selecionados para caráter quantitativo com distribuição normal (Cruz, 2005)

Percentagem de

Selecionados

P (%)

Intensidade

de Seleção

i

Percentagem de

Selecionados

P (%)

Intensidade

de Seleção

i

Percentagem de

Selecionados

P (%)

Intensidade

de Seleção

i

1 2,665 18 1,458 35 1,058

2 2,431 19 1,428 36 1,039

3 2,268 20 1,400 37 1,020

4 2,154 21 1,372 38 1,002

5 2,063 22 1,346 39 0,984

6 1,985 23 1,320 40 0,966

7 1,918 24 1,295 41 0,948

8 1,858 25 1,271 42 0,931

9 1,804 26 1,248 43 0,913

10 1,755 27 1,225 44 0,896

11 1,709 28 1,202 45 0,880

12 1,667 29 1,180 46 0,863

13 1,627 30 1,159 47 0,846

14 1,590 31 1,138 48 0,830

15 1,554 32 1,118 49 0,814

16 1,521 33 1,097 50 0,800

17 1,489 34 1,078

Indivíduos selecionados

59

O diferencial de seleção poderá ser obtido fazendo:

DS = i SF onde SF é o desvio padrão fenotípico.

Assim, o progresso genético para um só sexo pode ser escrito como:

PG = (1/2) h2 i SF

Como h2 = S

2A/S

2F então PG = (1/2) (S

2A/SF) i

ou ainda PG = (1/2) h SA i

Expressões que podem também ser usadas para estudos teóricos, já que basta saber a

percentagem que se pretende selecionar para se ter o progresso, mesmo sem medir diretamente os

indivíduos.

Expressões para o progresso genético esperado em processos de seleção com outros

parentescos podem ser deduzidas da mesma forma, baseando-se na covariância entre parentes.

8.2. SELEÇÃO PELO TESTE DE PROGÊNIE.

Suponha-se agora um caso onde se faça seleção com base na progênie de um dos

progenitores, pai ou mãe, e o resultado da seleção seja observado em outros filhos na geração

seguinte.

Nesse caso X é o valor fenotípico médio dos filhos na progênie sob teste e

Y o valor esperado no outro filho na geração seguinte.

Da mesma forma a equação Yi-Ym= bXY (Xi-Xm) pode ser estabelecida para cada indivíduo

selecionado, assim pode-se trabalhar com a média do grupo selecionado e com a média dos

descendentes destes, ao invés de valores individuais.

Assim, Yi passa a ser a média dos descendentes dos indivíduos selecionados,

Ym = Xm é a média da população,

Xi a média das progênies sob teste e

bXY será função da covariância entre os irmãos na progênie sob teste com seus irmãos futuros e da variância fenotípica das médias das progênies.

Chamando Yi - Ym de PG e

Xi - Xm de DS, e supondo que a progênie seja de meios irmãos,

PG = bMI (DS)

cov(Meios Irmãos) = RMI S2A + dMI S

2D = (1/4) S

2A

S2m = S

2MI + S

2DMI/n

bMI =

(1/4) S2A

S2m

Então se nós selecionarmos as mães pelos valores fenotípicos médios das progênies de meios

irmãos, tomando os pais ao acaso teremos:

PG = (1/4) S2A.DS/S

2M

60

Seleção nos dois sexos

Se os pais e as mães forem selecionados da mesma forma, considerando uma população

panmítica, então, teremos dois progressos genéticos sendo obtidos independentemente, um pela

seleção de gametas masculinos e outro pela seleção de gametas femininos. Considerando que a

seleção em um sexo não interfere na seleção no outro sexo (o que é apenas aproximado), então:

PG = PG(♀) + PG(♀) = bMI(DS1) + bMI(DS2) = (1/4)S2A(DS1)/S

2m + (1/4)S

2A(DS2)/S

2m)

Essa forma de expressar o PG é mais própria para animais, onde a seleção e separada para os

sexos.

Se: DS1 = DS2 = DS então PG = (1/2)S2A(DS)/S

2m

que é mais válido para plantas, onde muitas vezes os dois sexos estão em um só indivíduos.

8.3. SELEÇÃO ENTRE E DENTRO DE FAMÍLIAS

A seleção com base em famílias em plantas anuais traz uma dificuldade extra, pois uma vez

obtidas as sementes para o teste de progênie, as plantas mães morreriam, não podendo ser usadas de

novo para produzir as sementes melhoradas. O melhorista pode então guardar parte das sementes

obtidas para usar como geração melhorada. Como quase sempre o interesse é fazer seleção

recorrente, as famílias selecionadas devem ser intercruzadas em plantios especiais, chamados blocos

de recombinação, para obter novas famílias para o novo ciclo de seleção. O objetivo no bloco de

recombinação é promover uma reprodução o mais próxima da panmítica possível. O plantio dos blocos

de recombinação permite uma nova seleção fenotípica dentro das famílias no bloco de recombinação.

Neste caso a seleção entre famílias poderá ser feita em um ou dois sexos. Já a seleção dentro sempre

será em um só sexo, pois não há como controlar a polinização dentro do bloco.

Considerando famílias de Meios irmãos, a variância aditiva restante dentro das famílias é (3/4)

S2A. Portanto a seleção fenotípica dentro das famílias oferece um ganho genético igual a

PG= (1/2) (3/4)S2A DS/ S

2d

sendo S2d a variância dentro de famílias.

A seleção entre se refere agora às médias das famílias dos meios tios dos indivíduos da geração

melhorada, e o ganho será:

PG= (1/8) S2A DS/ S

2m

O ganho total então considerando seleção entre em um só sexo será:

PG= (1/8)S2A DS/ S

2m.+ (3/8)S

2A DS/ S

2F.

O ganho total então considerando seleção entre nos dois sexos será:

PG= (1/4)S2A DS/ S

2m.+ (3/8)S

2A DS/ S

2F.

Expressões para outros tipos de seleção podem ser obtidas de forma semelhante.

61

8.4. CORRELAÇÃO INTRACLASSE

Vamos supor uma situação onde é possível subdividir uma população em classes, segundo um

certo critério. O critério usado poderá ser qualquer um, por exemplo sexo, procedência, família, etc..

Se este critério for importante para a variação da característica que se está estudando, espera-

se que os indivíduos dentro das classes sejam mais parecidos entre si do que indivíduos tomados ao

acaso na população.

A correlação intraclasse mede a semelhança relativa entre os indivíduos dentro das classes em

relação à variação da população.

Para isso podemos estabelecer o seguinte modelo:

Yij = m + Ei + Dij onde: Yij - o valor do indivíduo de ordem j na classe j;

m - a média da população;

Ei é efeito próprio da classe "i" e

Dij é o efeito próprio do indivíduo "j" dentro da classe "i".

Neste modelo Ei representa tudo que contribui para as diferenças entre as classes, e Dij tudo

que não contribui para diferença entre as classes, mas contribui para as diferenças individuais dentro

das classes. Sendo assim, o efeito Dij ‚ obrigatoriamente independente dos outros Dij's e do efeito Ei,

mesmo que seja da mesma classe.

Vamos admitir também que Dij tenha distribuição normal.

Assim,

S2Y = S

2E + S

2D , já que Cov(E,D) tende para zero;

além disso,

Cov[(Yij);(Yij')] = Cov[(m + Ei + Dij);(m + Ei + Dij')]= S2E

Imagine-se que, uma vez determinadas as classes na população todos os indivíduos fossem

tomados ao acaso e colocados em duas colunas, de modo que formassem pares sempre com outro

indivíduo da mesma classe. Assim ter-se-iam duas colunas representadas por Yij e Yij', onde cada Yij

estaria pareado com Yij' da mesma classe. Assim, ter-se-iam duas amostras tomadas ao acaso que

juntas formam a população.

A média e a variância dessas amostras são estimativas da média e variância da população. A

covariância entre os dados pareados pode ser representada por :

Cov[(Yij);(Yij')] = S2E

Assim a correlação entre esses dados será:

rYijYij' = Cov[(Yij);(Yij')]/ (SYij SYij')

Mas SYij SYij' é igual a S2Y, pelo exposto acima. Assim:

rYijYij' = S2E / [S

2E + S

2D]

62

Esta correlação é representada usualmente pela letra t e é obtida na prática com o auxilio da

analise da variância.

Organizando-se os dados de I classes com J elementos cada, como se fosse um experimento

inteiramente casualizado, pode-se gerar o quadro a seguir:

Classe Valores soma (Yi.)

1 Y11 Y12 Y13 ........... Y1J Y1.

2 Y21 Y22 Y23 ........... Y2J Y2.

3 Y31 Y32 Y33 ........... Y3J Y3.

I YI1 YI2 YI3 ........... YIJ YI.

Soma Y..

A Análise da variância pode ser resumida no quadro:

Fontes de Variação GL SQ QM E(QM)

Entre classes I-1 (1/J) Yi.2- Y..2/IJ M1

2D + J

2E

Dentro de classes I(J-1) Yij2 -(1/J) Yi.2 M2

2D

Total IJ-1

A esperança dos quadrados médios, E(QM), representa o valor algébrico do mesmo, segundo o

modelo matemático adotado. Assim, pode-se obter a estimativa da variância entre por

S2E = (M1-M2)/J

A estimativa da variância dentro será: S2D = M2 e

t = S2E /( S

2E + S

2D) ou

t = [(M1-M2)/J]/{[(M1-M2)/J]+M2}

t= (M1-M2)/ {M1-M2 + JM2} = (M1-M2)/ {M1+M2(J-1)}

O conceito de correlação intraclasse é geral e pode ser aplicado a qualquer conjunto de dados

que possa ser subdividido em classes. O valor obtido representa a semelhança relativa média dos

elementos dentro das classes e serve para avaliar o grau de importância da origem comum dos

indivíduos sobre a variação dentro de uma população.

No melhoramento será utilizado para medir a Repetibilidade e a herdabilidade, como será visto

adiante.

8.4. REPETIBILIDADE

É um tipo de correlação intraclasse, onde cada classe é formada pelos valores obtidos a partir de

um indivíduo de uma determinada população. Esses valores são repetidos no tempo ou espaço, tais

como: produção de leite, de ovos, frutos, etc. Refere-se portanto a diferentes manifestações do mesmo

caráter.

63

Pode ser interpretado como a capacidade dos indivíduos de uma população repetir a

performance de um determinado caráter em diferentes manifestações do mesmo.

R = S2E /( S

2E + S

2D) R é a repetibilidade;

S2E é a variância "entre" indivíduos e

S2D é a variância média "dentro" das performances dos indivíduos.

Para interpretar o valor da repetibilidade lembre-se que S2E é a variação entre indivíduos, e

portanto, inclui toda a variação genética e mais as variações ambientas entre indivíduos, que sejam

comuns a todas as medidas feitas. Essa variação ambiental é chamada de ambiente geral ou

permanente. S2E é composta por diferenças ambientais que se manifestam nas diferentes medidas do

mesmo indivíduo, portanto pode ser chamado de variação ambiente especial ou temporária.

O valor da repetibilidade pode ser considerado por isso o valor máximo da herdabilidade. Seria o

valor da herdabilidade no sentido amplo, se não houvessem variações devidas a ambiente permanente.

O valor calculado para uma determinada população só serve para essa população. Não se pode

extrapolar esses valores, já que os valores das variâncias genéticas, incluídas na repetibilidade são

próprios de cada população, pois dependem das freqüências gênicas. A variação ambiente também irá

variar de uma condição para outra. Assim, espera-se para cada medida desse parâmetro valores

diferentes, embora para um mesmo caráter eles possam tender a ser parecidos.

Com o valor da Repetibilidade (R) poderemos ter uma idéia do número de repetições (de

produções) necessário para avaliar um determinado indivíduo de uma população.

Por exemplo:

Porca número de parições número de crias A 1 8 B 2 7,6 C 6 7,4

Qual das porcas seria usada para a seleção?

Não se conhecendo o valor da repetibilidade ou se o valor for baixo, a porcas escolhida seria a

C, pois não seria muito provável a repetição de produção da porcas A.

Uma vez que o valor da repetibilidade seja elevado, a preferência de escolha será da porcas A,

pois haverá uma grande probabilidade dela repetir essa performance.

O valor máximo de R é 1, o que aconteceria se não houvesse variação dentro, ou seja, as

manifestações do caráter fossem sempre iguais.

Quando se conhece o valor da repetibilidade de um determinado caráter, podemos saber

quantas repetições são necessárias para avaliar os indivíduos com um grau de precisão determinado.

Quanto menor o valor da repetibilidade maior será o número de repetições necessárias para poder

avaliar um determinado caráter. Na medida em que se aumenta o número de repetições ocorre um

aumento na precisão de avaliação desses indivíduos. Porém, a taxa de aumento de precisão diminui

com o número de repetições.

64

Matematicamente, para se calcular esse aumento de precisão, usa-se o conceito de

Repetibilidade da Média.

Já que S2m = S

2E + S

2D /J, no modelo adotado, então

Rm = S2E / S

2m = S

2E / [S

2E + S

2D /J] = S

2E J /[ S

2E J + S

2D]

Rm = R S2F J / [R S

2F J + (1-R) S

2F]

Rm = R J/[ R J + 1 -R] = R J / [1 + R(J-1)]

Com o valor da R conhecida, pode-se saber quantas repetições serão necessárias para alcançar

um valor de Rm desejada, ou, de outra forma, saber o número de repetições necessárias para avaliar

um indivíduo, com um grau de precisão estabelecido.

Se um caráter for submetido à seleção pela média, a herdabilidade correspondente será:

h2m = S

2A / S

2m = S

2A J / S

2F[1+R(J-1)] = h

2 J /[1+R(J-1)]

Por outro lado pode-se estabelecer a capacidade provável de produção dos indivíduos como:

CP = MR + Rm (MA - MR). sendo MR média do rebanho, e

MA média do indivíduo A

Por exemplo no caso das porcas apresentado acima, se a repetibilidade do caráter no rebanho

for 0,6 e a média do rebanho for 5,5, temos:

Porca número de parições número de crias Rm CP A 1 8 0,6 7 B 2 7,6 0,75 7,07 C 6 7,4 0,9 7,21

Assim, conclui-se que seria melhor selecionar a porca C.

Valores da repetibilidade da média com número de repetição variável

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1

0 5 10 15 20 25

número de repetições

R=0,9

R=0,2

65

9. ESTIMAÇÃO DA HERDABILIDADE NO SENTIDO RESTRITO

Abordaremos aqui somente os métodos baseados no grau de parentesco entre indivíduos, que

são de maior aplicação no melhoramento. Esses métodos são baseados na equação da covariância

entre indivíduos aparentados de COCKERHAM, vista na seção anterior, Cov(X;Y) = RXY S2A + DXY S

2D,

onde RXY e o coeficiente de parentesco e DXY o coeficiente de dominância entre os indivíduos usados

para estimar a herdabilidade, S2A é a variância Aditiva e S

2D a variância de dominância da população.

9.1. MÉTODOS BASEADOS NA CORRELAÇÃO INTRACLASSE

Como vimos no capítulo 8 a correlação intra-classe, mede o grau de importância da origem

comum dos indivíduos na variação da população, de modo que, se a origem comum se referir a sua

origem genética, este coeficiente dará uma indicação da importância dos genes na determinação das

diferenças entre os indivíduos e será relacionado com a herdabilidade. A rigor a correlação intra-classe

para qualquer tipo de família pode ser usada para a determinação da herdabilidade. Na prática são mais

usadas as que envolvem famílias de meios irmãos e de irmãos perfeitos.

9.1.1. Estimação da h2 pelo uso de correlação intra-classe em famílias de meio irmãos.

A correlação intraclasse entre meio irmãos pode ser expressa como

tMI = CovMI/S2F = (1/4) (S

2A / S

2F) = (1/4) h

2

Assim, fazendo-se um experimento onde as famílias de meio irmãos, tomadas ao acaso em uma

população, sejam os tratamentos, pode-se calcular os valores da variância "entre famílias", S2EF e da

variância "dentro de famílias", S2DF, obtendo tMI = S

2EF / (S

2EF + S

2DF) = (1/4) h

2.

Para a realização do experimento, deve-se tomar um grupo de machos ao acaso na população,

tomando em seguida um grupo de fêmeas, também ao acaso, para cada macho. As fêmeas devem ser

usadas uma única vez gerando um único descendente. A anáise da variância deve ser feita conforme

mostrado no capitulo 8.

9.1.2.Estimação da h2 pelo uso de correlação intraclasse em famílias de irmãos perfeitos.

Várias espécies produzem naturalmente ao se reproduzir múltiplos descendentes, formando

famílias de irmãos perfeitos, como os suínos, coelhos, etc... A correlação intra-classe entre irmãos

perfeitos pode também ser usada para estimar a herdabilidade, mas com certas restrições. Essa

correlação pode ser expressa como:

tIP = CovIP/VP = [(1/2) S2A + (1/4) S

2D]/ S

2F = (1/2) h

2 + (1/4) S

2D / S

2F.

Vê-se que além dos efeitos aditivos, os efeitos de dominância também contribuem para a

semelhança entre os irmãos perfeitos, sendo assim a correlação intra-classe para essas famílias não

66

poderá estimar diretamente a herdabilidade. Somente no caso de caracteres com ausência de

dominância em todos os locos gênicos é que a equação h2= 2 tIP seria correta. Se aceitarmos que a S

2D

seja pequena ou desprezível poderíamos usar essa expressão de forma geral, mas como a dominância

é importante para muitos caracteres o uso dessa expressão levará freqüentemente a erros na

estimação da herdabilidade, que estará então superestimada.

Além da dominância outras fontes de variação podem interferir na semelhança entre irmãos

perfeitos. Quando os indivíduos ao nascer necessitam de cuidados maternos por um certo período,

todos os indivíduos estarão sujeitos a um ambiente comum, já que deverão estar obrigatoriamente

juntos a sua mãe. Dessa forma estarão sujeitos aos mesmos fatores ambientais, o que tenderá a torna-

los mais semelhantes, aumentando o valor da correlação intra-classe. Além disso, cada mãe tem

capacidade diferente de amamentar o cuidar de seus filhos, alem de darem contribuições semelhantes

aos mesmos na vida intra uterina. Assim, os indivíduos são também mais parecidos pelo fato de serem

filhos da mesma mãe. Portanto, considerando todas estas contribuições para a semelhança de irmãos

perfeitos, a expressão completa para a correlação intra-classe é

tIP = (1/2) h2 + (1/4) S

2D / S

2F + S

2AC/ S

2F + S

2EM/ S

2F , sendo S

2AC a contribuição do ambiente

comum para a variância "entre" e S2EM a contribuição do efeito materno.

Vê-se que o valor da correlação intra-classe entre irmãos perfeitos não estima corretamente a

herdabilidade, podendo ser usado apenas como uma indicação do seu valor máximo, já que não se

pode dizer que os efeitos não aditivos sejam nulos.

Para obter uma estimativa não tendenciosa de h2 em espécies que produzam vários

descendentes por parição é então necessário obter dados de meios irmãos, cruzando cada macho com

diversas fêmeas, obtendo famílias de meio irmãos contendo irmãos perfeitos.

9.1.3. Precisão da estimativa da herdabilidade pela correlação.

Segundo Falconer (1960), em um experimento com N famílias e n indivíduos por família, a

variância amostral da correlação intra-classe será:

2t= 2[1+(n-1)t]

2 (1-t)

2/n(n-1)(N-1).

Obviamente quanto maior o denominador, n(n-1)(N-1), menor será o erro associado à estimativa

de t. Quando tamanho do experimento não representar problema serão obtidas estimativas melhores

em experimentos maiores, especialmente o número de famílias N.

Quando o tamanho o experimento (nN) for fixo, pode ser demonstrado que a variância terá o

mínimo em n=1/t, aproximadamente. O valor do tamanho ideal da família depende então do valor de t (e

consequentemente da herdabilidade). No caso de famílias de irmãos completos h2=2t

(aproximadamente) e n= 2/h2. Já para meios irmãos h

2= 4t e n= 4/h

2.

67

A variância amostral para a herdabilidade pode ser obtida da variância amostral da correlação

intraclasse. Já que h2=2t, no caso de irmãos completos, então:

2h2= 4

2t = 8[1+(n-1)t]

2 (1-t)

2/n(n-1)(N-1)

No caso de meios irmãos h2=4t, então:

2h2= 16

2t = 32[1+(n-1)t]

2 (1-t)

2/n(n-1)(N-1)

9.1.4. A significância de h2

Quando de estima um parâmetro qualquer existe a expectativa de determinar se o mesmo é ou

não significativo. No caso de h2, o valor ser significativo implica em testar a hipótese de que o valor

verdadeiro seja zero, com uma probabilidade qualquer, por exemplo 5%. Como a correlação intraclasse

é baseada nos componentes da variância, assim como o valor de F, pode-se traçar um paralelo entre os

dois. Temos:

QMf = 2d + n

2f QMd =

2d

t = 2f /[

2d +

2f]

F= QMf/QMd = [2d + n

2f ]/

2d = 1 + n

2f /

2d

Assim, um F significativo implica que o valor de 2f não é nulo. Portanto o teste F para famílias

também testa a herdabilidade, e esta deverá ser considerada significativa (isto é, diferente de zero)

sempre que o F de famílias for significativo.

9.1.5 Estimação da h2 pelo uso de correlação intra-classe em famílias de meio irmãos

contendo irmãos perfeitos.

Para obter a estimativa de h2 em espécies que produzam vários descendentes por parição

obtém-se dados de meios irmãos, cruzando cada macho com diversas fêmeas, obtendo famílias de

meio irmãos contendo irmãos perfeitos. Poder-se-ia utilizar apenas um descendente por fêmea,

analisando os dados como mostrado no tópico 9.1.1., mas isso representaria uma enorme perda de

informações, alem de diminuir desnecessariamente a precisão experimental. Usa-se portanto a análise

que se segue, aproveitando todos os dados.

Para executar esse experimento um grupo de machos será tomado ao acaso e cada um será

acasalado com um grupo de fêmeas, também tomadas ao acaso na população, e cada fêmea devera

produzir um grupo de descendentes. Cada fêmea será usada uma única vez.

Para tornar essa explicação geral, vamos supor que o numero de fêmeas e o numero de

descendentes por fêmea sejam ambos variáveis, o que reflete melhor a situação real. Supondo que Yijk

seja o valor fenotípico do descendente de ordem k, da fêmea de ordem j acasalada com o macho de

ordem i, que Ni seja o numero de fêmeas acasaladas com o macho de ordem i e que nij seja o numero

68

de descendentes da fêmea de ordem j, acasalada com o macho de ordem i, os dados obtidos poderiam

ser tabulados como se segue:

Machos Fêmeas Descendentes Totais

1

1 Y111 Y112 Y113. Y11n11

2 Y121 Y122 Y123 Y12n12

3 Y131 Y132 Y133 Y13n13

. . . . . .

N1 Y1N11 Y1N12 Y1N13 Y1N1n1N1

2

1 Y211 Y212 Y213. Y21n11

2 Y221 Y222 Y223 Y22n12

3 Y231 Y232 Y233 Y23n13

N2 Y2N11 Y2N12 Y2N13 Y2N2n2N2

.............. .............. .............. .............. .............. .............. .............. I

1 Y111 YI12 YI13. YI1nI1

2 Y121 YI22 YI23 YI2nI2

3 Y131 YI32 YI33 YI3nI3

NI YINI1 YINI2 YINI3 YINInINI

Tem-se a seguinte analise da variância:

Fontes de variação GL S Q Q M E (QM)

Entre machos I-1 SQM M1 Vd + k2 Vf/m + k3 Vm

Entre Fêmeas dentro de machos N.-I SQF M2 Vd + k1 Vf/m

Entre descendentes dentro de fêmeas dentro de machos n..- N. SQD M3 Vd

Total n..-1

Sendo, N. total de fêmeas usadas; n.. total de descendentes no experimento;

SQM = (Yi..2/ni.) - Y...

2/n..

SQF = (Yij.2/nij) - (Yi..

2/ni.)

SQD = Yijk2 - (Yij.

2/nij)

K1 = [1/(N.-I)] { n.. - i [ ( nij2)/ni.]}

K2 = [1/(I-1)] { nij2[(1/ni.) - (1/n..)]

k3 = [1/(I-1)] { n.. - ( ni.2) /n..}

Se o numero de fêmeas por macho e o numero de descendentes por fêmeas forem constantes,

estas expressões se tornam mais simples. Se chamarmos Ni = J e nij = K, então

Gl f/m = I (J-1) e Gl d/f = IJ(K-1)

SQM = (1/JK) (Yi..2) - Y...

2/IJK

SQF = (1/k) (Yij.2) -(1/JK) (Yi..

2)

SQD = Yijk2 - (1/k) (Yij.

2)

69

K1 = K, K2 = K e k3 = JK

Assim, pode-se obter os valores de S2m, S

2f/m e S

2d.

S2m = Cov (MI) = (1/4) S

2A

S2f/m = Cov (IP) - Cov(MI) = (1/4) S

2A + (1/4) S

2D

e h2 = 4 S

2m /[ S

2m + S

2f/m + S

2d]

9.2. ESTIMAÇÃO DE h2 PELO USO DA REGRESSÃO DOS VALORES FENOTÍPICOS DOS FILHOS SOBRE OS

VALORES FENOTÍPICOS DOS PAIS.

Outra forma de estimar a h2 é usar a regressão dos valores dos filhos sobre os valores paternos.

De acordo com a expressão da covariância entre parentes:

Cov(Pai,Filho) = Cov (Mãe,filho) = (1/2) S2A

Assim: bPF = bMF = (1/2) S2A / S

2F = (1/2) h

2

Se for usada a media dos valores paternos, (P+M)/2, como variável independente, o valor da

covariância continuará o mesmo, mas a variância dessa variável será S2F/2, assim,

bPmF = (1/2) S2A / [S

2F/2] = h

2

Quando se processa esse tipo de estimativa, é comum termos vários descendentes por

progenitor, o que permite calcular essa estimativa de três maneira diferentes. Na primeira se usa o valor

dos progenitores repetidos com cada descendente formando as duas variáveis para a qual será

calculada a regressão.

X (valor do Prog repetido) Y (valor dos filhos)

X1 P1 Y1 F11

X2 P1 Y2 F12

X3 P1 Y3 F13

. .

. .

XQ P2 YQ F21

XQ+1 P2 YQ+1 F22

. .

. .

XN-2 PI YN-2 FI1

XN-1 PI YN-1 FI2

XN PI YN FI3

bXY = [XiYi - ( Xi . Yi)/N]/ Xi2 - (Xi)

2/N]

O valor obtido será igual a h2/2 ou h

2, conforme se use a média dos pais ou o valor de um só pai.

Ao fazer este cálculo, dá-se muita importância as famílias numerosas, que terão seus valores

repetidos muitas vezes, podendo distorcer o resultado de h2.

70

Uma outra maneira de proceder o cálculo é usar a media dos filhos junto com o valor dos

progenitores para o cálculo de b.

X →Valor do progenitor e Y→ Valores dos filhos

X1 = P1 F11 F12 ...F1n1 Y1 = F1./n1

X2 = P2 F21 F22 ...F2n2 Y2 = F2./n2

. . . . . .

. . . . . .

XN = PN FN1 FN2 ...FNnN YN = FN./nN

O cálculo é feito da mesma forma que no caso anterior. Com esse cálculo será dada a mesma

importância às famílias grandes e pequenas. Se a correlação intra-classe do caráter for alta, haverá a

tendência dos valores dentro das famílias serem parecidos, e assim não haverá prejuízos se usarmos a

média para representar os descendentes de cada família. Neste caso o cálculo com a media poderá ser

o mais acertado. Se a correlação intra-classe for baixa haverá muita variação dentro das famílias e o

mais certo é repetir os descendentes. Assim o uso de um ou outro método dependerá da correlação

intra-classe, que por sua vez esta ligada a própria herdabilidade que se quer calcular, como vimos no

item anterior.

Para obter um cálculo mais preciso, e sem essas duvidas quanto à correlação intra-classe, pode-

se usar uma terceira maneira de calcular "b", que é o uso da média dos filhos ponderada pelo número

de descendentes das famílias e pela correlação intra-classe. Para isso procede-se como no caso 2, mas

cada valor de média de filhos será ponderado por um valor W i, calculado com base no número de

descendentes e da correlação intra-classe.

Para isso calcula-se

W i = ni / (1 + ni T) onde ni é o número de descendentes por família

T = (tMI - b2)/ (1- tMI) para cálculo com uso de apenas um progenitor

T = (tIP - b2/2)/ (1- tIP) para cálculo com uso da media dos progenitores

k = W i

bxy = [ W iXiYi-( W iXi)( W iYi)/k]/[ W iXi2 - (W iXi)

2/k]

Esse valor é mais trabalhoso para se obter e exige uma estimativa prévia de b, que pode ser

obtida pelo método 2, além da correlação intra-classe, mas é mais preciso que os anteriores.

71

10. GRAU MÉDIO DE DOMINÂNCIA

A preocupação em conhecer o controle genético dos caracteres a serem melhorados é

justificável, pois quanto mais se conhecer sobre a herança desses melhor se decidirá a respeito dos

métodos a serem empregados no seu melhoramento. A herdabilidade (h2) nos dá uma idéia da

importância dos efeitos aditivos para a herança do caráter. Para estudar a importância da dominância

usa-se, entre outra medidas, o grau médio de dominância, que pode ser obtido com se segue.

Retornando ao modelo já utilizado, quando estudamos a média em uma população, temos

genótipo Valor

BB u Onde "u” é o valor que indica a importância Bb au do loco para a determinação do caráter e bb -u "a" é o grau de dominância.

Lembramos que: a = 1 indica dominância completa, a = 0, indica ausência de dominância, 0<a<1 indica dominância parcial e a>1 indica sobredominância

Bases para a determinação:

supondo um só loco, com apenas dois alelos temos

S2A = 2pq [u + (q-p) au]

2 S

2D = (2pq au)

2

Se adicionalmente supormos que p = q = 0,5, temos:

S2A = (1/2) u

2 e S

2D = (1/4) a

2u

2

logo [2 S2

D / S2A] = a

2

assim, a = [2 S2D / S

2A]

Se considerarmos um caráter com N locos teremos,

VA = (1/2) [ u12 + u2

2 + u3

2 + ..... + uN

2] = (1/2) ui

2

VD = (1/4) ai2ui

2

Para que isso seja correto é necessário que os efeitos dos locos seja totalmente independentes,

ou seja que não haja ligação fatorial (ou que haja equilíbrio de ligação) e que não haja epistasia

(interação entre genes de locos diferentes), reprodução panmítica ou equivalente.

Nessa situação deveríamos calcular o valor médio dos graus de dominância de todos os locos

envolvidos, mas isso não é possível. Assim, usa-se um valor aproximado, chamado de grau médio de

dominância e simbolizado por "a", ou gmd, e que é a média quadrática dos graus de dominância

ponderada pelos efeitos dos locos (u). Esse valor é obtido simplesmente estendendo a fórmula

deduzida para um loco para o caso do N locos. Assim

"a" = [2 VD/VA] = [ ( ai2ui

2)/ ( ui

2) ]

Note que a média quadrática só é igual a média simples se os valores forem constantes, o que

poderia acontecer se todos os locos fossem homodinâmicos.

Condições de validade ou restrições à fórmula.

72

Essa fórmula só dará resultados exatos se as seguintes condições estiverem presentes na

população:

1. comportamento diplóide normal

2. apenas dois alelos por loco

3. freqüências gênicas iguais a 0,5 em todos os locos

4. não haver epistasias

5. população panmítica ou F2 de linhagens puras

6. equilíbrio ou ausência de ligação fatorial

7. genes homodinâmicos

A primeira condição geralmente é satisfeita nos animais. A segunda dificilmente será satisfeita já

que inúmeros alelos podem existir para cada loco em populações naturais. Uma tentativa de obter essa

condição seria usar populações obtidas a partir do cruzamento de linhas consangüíneas. A terceira

também dificilmente se verifica. Pode haver uma aproximação se as linhas consangüíneas cruzadas

forem contrastantes para o caráter. A quarta não se verifica, embora de modo geral considere-se que as

epistasias sejam de pouca importância para os caracteres quantitativos. A quinta pode ser conseguida

pelo intercruzamento aleatório dos animais por algumas gerações. A sexta se verifica em populações

panmíticas. Nos F2 só se verifica se o número de genes favoráveis e desfavoráveis nas duas linhagens

cruzadas for o mesmo. A sétima não se verifica.

Pelas considerações acima pode-se ver que o valor calculado com grau médio de dominância é

apenas uma aproximação e deve ser encarado apenas com indicativo das ações gênicas que ocorrem

nos genes que controlam o caráter e não como indicação exata da ação gênica média.

O cálculo do grau médio de dominância é feito pelo cálculo de VA e VD, por qualquer método,

desde que se procure satisfazer, pelo menos em parte as condições discutidas anteriormente.

Amaneira mais usada é pelos experimentos com progênies de meio irmãos contendo irmãos

perfeito onde

Vm = Cov(MI) = (1/4) VA em que Vm é variância entre machos

Vf(m) = Cov(IP)-cov(MI) = (1/4) VA + (1/4) VD em que Vf(m) é a variância de fêmeas dentro de

machos.

Apostila de Genetica Vegetal 2006-2

Documents

Transcript of Apostila de Genetica Vegetal 2006-2