Apostila de Genetica Vegetal 2006-2
-
Upload
marco-rezende -
Category
Documents
-
view
52 -
download
0
Transcript of Apostila de Genetica Vegetal 2006-2
1
Universidade Federal Rural do Rio de janeiro
Instituto de Biologia
Departamento de Genética
GENÉTICA VEGETAL
MAURICIO BALLESTEIRO PEREIRA
ANA LÚCIA CUNHA DORNELLES
Sumário.
1. INTRODUÇÃO: MENDEL, O INÍCIO DA GENÉTICA
2. FUNDAMENTOS DE GENÉTICA MOLECULAR
2.1. ESTRUTURA DO DNA
2.2. REPLICAÇÃO DO DNA
2.3. TRANSCRIÇÃO DO DNA
2.4. TRADUÇÃO – SÍNTESE DE PROTEÍNAS
3. GENÉTICA DE POPULAÇÕES
3.1. DEFINIÇÃO DE POPULAÇÃO
3.2. FREQÜÊNCIA GÊNICA E GENOTÍPICA
3.3. PADRÕES REPRODUTIVOS DAS POPULAÇÕES
3.4. FREQÜÊNCIAS EM UMA POPULAÇÃO PANMÍTICA.
3.5. FREQÜÊNCIAS EM UMA POPULAÇÃO ENDOGÂMICA
3.6. FREQÜÊNCIAS EM UMA POPULAÇÃO EXOGÂMICA
3.7. FATORES QUE AFETAM AS FREQÚÊNCIAS GÊNICAS DAS
POPULAÇÕES.
3.7.1. MUTAÇÃO GÊNICA
3.7.2. MIGRAÇÃO GENÉTICA.
3.7.3. OSCILAÇÃO GENÉTICA.
3.7.4. SELEÇÃO.
3.8. VARIÂNCIA E MÉDIA DA POPULAÇÃO. EFEITO MÉDIO DA
SUBSTITUIÇÃO DO GENE.
3.9. VALOR REPRODUTIVO, VALOR GENÉTICO OU VALOR ADITIVO
2
4. CARACTERES QUANTITATIVOS
4.1. SISTEMAS DE GENES
4.2. PROPRIEDADES DO CARÁTER QUANTITATIVO
4.2.1. CONTROLE POR MUITOS PARES DE GENES
4.2.2. EFEITOS PEQUENOS POR GENES SOBRE O FENÓTIPO
4.2.3. AÇÃO GÊNICA
4.2.4. AÇÃO DO AMBIENTE
4.2.5. DISTRIBUIÇÃO DE FREQÜÊNCIAS
5. COMPONENTES DA VARIÂNCIA FENOTÍPICA.
5.1. VARIÂNCIA GENOTÍPICA E VARIÂNCIA AMBIENTE. CONCEITO
DE VALOR FENOTÍPICO E VALOR GENOTÍPICO.
5.2. COMPONENTES DA VARIÂNCIA GENOTÍPICA. VARIÂNCIA
ADITIVA, VARIÂNCIA DE DOMINÂNCIA E VARIÂNCIA EPISTÁTICA. VALOR
ADITIVO
6. CORRESPONDÊNCIA ENTRE FENÓTIPO E GENÓTIPO.
6.1. CORRELAÇÃO ENTRE VALOR FENOTÍPICO E VALOR GENOTÍPICO.
COEFICIENTE DE DETERMINAÇÃO.
6.2. REGRESSÃO DO VALOR GENOTÍPICO SOBRE O VALOR
FENOTÍPICO. HERDABILIDADE NO SENTIDO AMPLO.
6.3. REGRESSÃO DO VALOR ADITIVO SOBRE O VALOR FENOTÍPICO.
HERDABILIDADE NO SENTIDO RESTRITO.
7. SEMELHANÇA ENTRE PARENTES.
7.1. PARENTESCO GENÉTICO
7.2. COVARIÂNCIA ENTRE INDIVÍDUOS APARENTADOS.
8. PROGRESSO GENÉTICO POR SELEÇÃO.
8. CORRELAÇÃO INTRA-CLASSE. REPETIBILIDADE.
9. ESTIMAÇÃO DA HERDABILIDADE NO SENTIDO RESTRITO
10. GRAU MÉDIO DE DOMINÂNCIA
3
1. INTRODUÇÃO: MENDEL, O INÍCIO DA GENÉTICA
Desde a Antigüidade, os seres humanos perceberam as semelhanças entre parentes,
principalmente no que diz respeito a pais e filhos. Diversas explicações foram sendo utilizadas à medida
que o nível de conhecimento humano foi se alterando. Uma explicação muito popular até ao início deste
século era a de que a herança dos caracteres se dava por fluidos orgânicos existentes no sangue e que
passavam de pais para filhos. Contribuía para essa hipótese as observações de que em muitos
caracteres os filhos apresentavam valores intermediários aos pais. Além disso, os filhos apresentavam
uma mistura de características dos pais.
Em 1866, Gregor Mendel publicou os resultados de uma pesquisa que, pela primeira vez
elucidou a herança de caracteres. Mendel trabalhou com ervilhas de jardim, Pisum sativa L., uma planta
autógama de alta variabilidade. O seu procedimento altamente criterioso permitiu resultados claros para
sete caracteres dessa planta, que seguiam um padrão semelhante.
Para o seu trabalho Mendel escolheu plantas que por várias gerações produziram sempre
características inalteradas, por isso afirmou que elas eram puras para essas características, e pelo
cruzamento de plantas com características diferentes pode estabelecer o padrão de herança.
Por exemplo, ele tomou plantas puras para a característica “cor da semente”, que pode ser verde
ou amarela. Cruzou plantas puras para essas características, obtendo uma geração híbrida, que
posteriormente foi chamada F1. Todas as plantas da F1 tinham sementes verdes. A seguir
autofecundou as plantas F1, obtendo a geração F2. Essa geração apresentou plantas com sementes
verdes e amarelas na proporção 3 para 1, aproximadamente. Depois Mendel autofecundou ainda as
plantas F2, colhendo separadamente cada planta, e percebeu que todas as plantas com sementes
amarelas (1/4 do total) produziram somente plantas com sementes amarelas, mas entre as plantas com
sementes verdes (3/4 do total) 1/4 produziram somente plantas com sementes verdes, mas 2/4
produziram a proporção 3 para 1 de sementes verdes e amarelas.
Para explicar os resultados Mendel supôs que as plantas paternas com sementes verdes tinham
um fator (hoje chamamos gene), para determinação desse fenótipo. Assim como as plantas paternas
com sementes amarelas tinham um fator para o fenótipo sementes amarelas. As plantas F1 tinham o
fator para sementes verdes, já que apresentavam esse fenótipo, mas deveriam ter também o fator para
sementes amarelas, já que seus descendentes apresentavam esse fenótipo. Deduziu então que todas
plantas deveriam ter dois fatores, já que as F1 tinham, e que as plantas puras tinham fatores iguais
(homozigotas). Deduziu também que esses fatores não se misturavam pois em F2 apareceram plantas
puras filhas de F1 que tinha os dois fatores. Pelo resultado do F2 deduziu que os fatores se separavam
na gametogênese e se combinavam de novo, ao acaso, na fecundação.
4
Esquematicamente:
Geração Paterna
P1
(sementes verdes)
x P2
(sementes amarelas)
AA x aa
Determinantes A a
Geração F1
100% sementes verdes Aa x Aa
Determinantes A e a A e a
Geração F2
1/4 AA
sementes verdes puras
1/2 Aa
sementes verdes híbridas
1/4 aa
sementes amarelas puras
Como vimos anteriormente, Mendel apresentou os resultados de sete caracteres, todos com o
mesmo padrão de herança. A análise conjunta de dois caracteres apresentou outro resultado importante
que pode ser exemplificado usando o caráter cor das sementes, com fenótipos sementes verdes e
sementes amarelas, e o caráter tipo de tegumento, com os fenótipos sementes lisa e rugosa.
Nesses caracteres os fenótipos sementes verdes e sementes lisas são dominantes. Mendel
cruzou plantas com sementes verdes e lisas puras com plantas com sementes amarelas e rugosas
também puras. Na geração F1 obteve apenas plantas sementes verdes e lisas, as quais
autofecundadas geraram uma geração F2 com 9/16 das plantas com fenótipo sementes verdes e lisas,
3/16 plantas sementes verdes e rugosas, 3/16 plantas sementes amarelas e lisas e 1/16 plantas
sementes amarelas e rugosas. Com isso Mendel deduziu que as combinações entre fatores de
diferentes pares eram independentes (ao acaso).
Esquematicamente:
Geração Fenótipo Proporção Genótipo Proporção
P1 sementes verdes e lisas 100% AABB 100%
P2 sementes amarelas e rugosas 100% aabb 100%
F1 sementes verdes e lisas 100% AaBa 100%
5
AABB 1/16
F2 sementes verdes e lisas 9/16 AABb 2/16
AaBB 2/16
AaBb 4/16
sementes verdes e rugosas 3/16 Aabb 1/16
Aabb 2/16
sementes amarelas e lisas 3/16 aaBB 1/16
aaBb 2/16
sementes amarelas e rugosas 1/16 aabb 1/16
Por esse resultado Mendel postulou que:
1a Lei de Mendel
(1) A herança dos caracteres se dá por fatores não miscíveis, que ocorrem aos pares em qualquer
indivíduo.
(2) As duas formas contrastantes de um caráter são determinadas pelos dois componentes de um par
de fatores.
(3) Quando um indivíduo apresenta os dois fatores diferentes apenas um deles se manifesta, o qual ‚
chamado de "Dominante".
(4) Os dois componentes de um par de fatores se separam na gametogênese, se combinando ao acaso
na fecundação.
2a Lei de Mendel
(5) Qualquer componente de um par de fatores se combina independentemente (ao acaso) com
qualquer componente de outro par.
O trabalho de Mendel teve o mérito de pela primeira vez expor uma explicação razoável e com
base experimental, para a herança de caracteres. Muitos pesquisadores repetiram a metodologia de
Mendel para outros caracteres em outras espécies encontrando ora resultados semelhantes ora
resultados conflitantes. Por isso os seus resultados demoraram a serem admitidos como gerais. A teoria
da dominância, por exemplo, mostrou-se um caso particular e não geral como Mendel havia suposto. A
sua 2a Lei também não se mostrou geral, já que os genes ligados não segregam independentemente.
Mesmo assim, suas descobertas deram o início a uma nova ciência, a Genética, da qual Mendel é
considerado o pai.
As continuidades dos estudos de genética, após os trabalhos de Mendel, se desenvolveram em
diversas áreas. A necessidade de localizar os genes permitiu o surgimento da citogenética, que resultou
de uma fusão de conhecimentos da citologia e da genética e permitiu a identificação dos cromossomos
como portadores da informação genética. Um conhecimento mais aprofundado dos cromossomos e de
6
sua constituição permitiu o desenvolvimento da Genética Molecular, que têm permitido a uma grande
compreensão dos mecanismos bioquímicos envolvidos na herança dos caracteres.
A identificação de que a herança de uma forma geral não segue exatamente as leis de Mendel,
ao invés de desmenti-las, simplesmente demonstrou que os processos são mais complexos que o
observado com as características por ele estudadas. Por exemplo:
→ genes localizados no mesmo cromossomo não apresentam segregação independente;
→ a maioria das características não é determinada por apenas um gene e sim por diversos
genes;
→ além do efeito dos genes, os efeitos do ambiente também são determinantes em muitas
características;
→ alguns genes são influenciados (estimulados, inibidos, etc..) pelos produtos de outros genes.
Além dos pontos acima citados, existe ainda o aspecto importantíssimo que os indivíduos vivem
em populações e que os processos genéticos e evolutivos acontecem em função da estrutura destas
populações.
Como base para o Melhoramento Genético Vegetal, discutiremos nos próximos capítulos
diversos aspectos básicos ligados a: Genética Molecular, Genética de Populações e Genética
Quantitativa, conhecimentos que nos permitirão uma compreensão das técnicas e métodos utilizados
para definição de programas de melhoramento e avaliação de genótipos a serem lançados como
cultivares.
7
2. FUNDAMENTOS DE GENÉTICA MOLECULAR
2.1. ESTRUTURA DO DNA
Logo após a redescoberta dos trabalhos de Mendel, em 1900, a principal pergunta que surgiu na
comunidade científica era: “onde estavam localizados, na célula, os „fatores‟ que determinavam os
caracteres”.
Naquela época os avanços da microscopia vinham permitindo grandes avanços em citologia, e
foram os citologistas que, ao observarem a estrutura dos ovócitos (com grande quantidade de
citoplasma) e os espermatozóides (praticamente sem citoplasma), chegaram a conclusão que as
estruturas responsáveis pela herança estavam no núcleo e não no citoplasma. Além disto, estudando o
comportamento dos cromossomos na meiose, observaram uma correspondência muito grande entre
estes e os „fatores‟ de Mendel, e concluíram, após alguns testes, que os genes estavam nos
cromossomos → “Teoria Cromossômica da Herança”.
Estas conclusões permitiram uma compreensão de como os genes eram transmitidos de célula a
célula durante o desenvolvimento do indivíduo (mitose), assim como esta transmissão acontecia de uma
geração para outra (meiose, formação de gametas e fertilização).
Estas descobertas estimularam um incremento nas pesquisas sobre a composição e a estrutura
dos cromossomos, buscando uma maior compreensão sobre o que eram os genes, de que substâncias
eram compostos, como se multiplicavam e como eram transmitidos.
A composição dos genes foi um dos aspectos que gerou algumas polêmicas, pois a substância
que constitui os genes precisa possuir três propriedades fundamentais para que os genes
desempenhem seus papéis biológicos:
1º - Replicação – a molécula portadora da informação genética precisa ter a capacidade de ser
copiada em dois momentos do ciclo vital. O primeiro, na meiose, na produção das células responsáveis
pela continuidade da espécie, que irão produzir a nova geração, os gametas (animais e vegetais). Em
um segundo momento, na mitose, quando, a partir da primeira célula de um organismo, ocorrem
diversas multiplicações durante o seu desenvolvimento.
2º - Produção da Forma – informação necessária para a formação e o funcionamento do
organismo. Toda a informação necessária para que as estruturas sejam produzidas e realizem suas
funções a que se destinam deve estar contida nos genes.
3º - Serem Mutáveis – a molécula hereditária é uma molécula passível de alteração (mutações),
eventos que, mesmo ocorrendo raramente, é a base para a variação dentro e entre espécies, e a longo
prazo o fator primário para determinar a evolução e possibilitar o melhoramento genético.
Em um primeiro momento, foi observado que, dentro do núcleo da célula existiam principalmente
três tipos de moléculas com características para serem as portadoras da informação genética
(complexidade de estrutura), o DNA, o RNA e proteínas. Por apresentar uma grande instabilidade em
8
sua participação no conteúdo celular, e por não fazer parte da constituição dos cromossomos, o RNA foi
logo descartado. Apenas em 1944 trabalhos com transformação de bactérias, publicados por Avery,
MacLeod e McCarty, forneceram as evidências definitivas de que o material genético é o DNA.
Antes mesmo da descoberta da estrutura do DNA por Watson & Crick em 1953, a composição
do DNA já era conhecida. O DNA (Ácido desoxirribonucléico) é composto de apenas quatro diferentes
moléculas básicas chamadas nucleotídeos. Cada nucleotídeo é composto por um fosfato, uma
desoxirribose e uma de quatro bases nitrogenadas:
Nucleotídeos Purínicos
Adenina (A) Guanina (G)
Nucleotídeos Pirimídicos
Timina (T) Citosina (C)
A estrutura de dupla hélice definida por Watson & Crick foi fundamentada a partir de duas
evidências:
1º - Trabalhos de Franklin & Wilkins com dados de raios X da estrutura do DNA sugeriam que o
DNA era longo e fino, e que tinha duas partes similares que eram paralelas, uma a outra, ao longo da
molécula.
NH2
N 6 N
7 5 1
8
9 4 2
Fosfato N 3
N
O O Base Nitrogenada
5’ (Adenina)
O – P – O – CH2
O 4’ 1’
H3 H
Desoxirribose
3’ 2’
OH H
O
4 H
CH3 5 3 N
Base Nitrogenada
6 2 (Timina)
1 O
Fosfato N
O O
5’
O – P – O – CH2
O 4’ 1’
H3 H
Desoxirribose
3’ 2’
OH H
NH2
4
5 3 N
Base Nitrogenada
(Citosina)
6 2 O
1
Fosfato N
O O
5’
O – P – O – CH2
O 4’ 1’
H3 H
Desoxirribose
3’ 2’
OH H
O
H
N 6
7 5 1 N
8
NH2
9 4 2
Fosfato N 3
N
O O Base Nitrogenada
5’ (Guanina)
O – P – O – CH2
O 4’ 1’
H3 H
Desoxirribose
3’ 2’
OH H
9
2º - A quantidade total de nucleotídeos pirimídicos (T + C) é sempre igual a quantidade total de
nucleotídeos purínicos (A + G), sendo T=A e C=G, e que A+T não é necessariamente igual a C+G.
A estrutura em dupla hélice é constituída então de duas cadeias de nucleotídeos ligados entre si
por ligações fosfodiester, em que um grupo fosfato, que está ligado ao Carbono 5‟ da desoxirribose se
ligará ao grupo –OH no Carbono 3‟ da desoxirribose adjacente. As duas hélices são mantidas juntas por
pontes de hidrogênio entre as bases, como demonstrado no esquema abaixo, o que explica a
especificidade A-T e C-G.
3‟ 5‟
5‟ 3‟
Um outro aspecto importante é que as fitas de nucleotídeos possuem sentidos opostos, ou seja,
elas são antiparalelas, sendo um filamento 5‟ → 3‟ e o outro 3‟ → 5‟.
A estrutura tridimensional (helicoidal) é uma conseqüência da composição da molécula de DNA.
Os cromossomos, como são visualizados durante as divisões celulares, estão em uma forma
compactada. Tendo em vista que as moléculas de DNA são extremamente longas, por exemplo, o
genoma humano, possui aproximadamente três bilhões de pares de bases, o que faz com que cada
célula diplóide possua cerca de 2 metros de DNA compactados em 46 cromossomos, sendo cada
cromossomo constituído por uma molécula de DNA e por diversas proteínas envolvidas na
compactação.
Em um primeiro nível de compactação, o DNA se enrola como um carretel em estruturas
formadas por oito moléculas de proteínas denominadas histonas, formando os nucleossomos. Os
nucleossomos, organizados em uma forma que se assemelha a contas de um colar, assumem uma
forma helicoidizada denominada solenóide. Existem evidências de que a solenóide ainda sofre um
outro processo de helicoidização a redor de uma estrutura protéica denominada arcabouço.
G G A
T C
C T
A
C
G
Nucleotídeo
10
2.2. REPLICAÇÃO DO DNA
Como já vimos, o DNA consiste de uma dupla hélice composta de duas fitas de
desoxirribonucleotídeos que são antiparalelas e complementares.
Para que ocorra duplicação, ou replicação, as duas fitas de DNA, que estão, unidas entre si por
pontes de hidrogênio, deverão ser abertas, pois cada uma destas fitas servirá de molde para formar
uma nova molécula de DNA. Assim, a partir de uma molécula original de DNA, serão formadas duas
moléculas filhas, em que uma das fitas é recém sintetizada a partir da fita molde da molécula original.
Esta forma de replicação é chamada de semiconservativa, como pode ser observado no esquema
abaixo:
Dupla fita “fechada” – Molécula Original
Moléculas Filhas
O processo de replicação de DNA é bastante complexo, onde diversas enzimas e outros
componentes participam. Descreveremos aqui apenas o processo básico.
A replicação do DNA propriamente dita é catalisada pela enzima DNA polimerase. Embora já
tenham sido identificadas diversas DNA polimerases (apenas em E. coli existem três), algumas com
funções específicas, as atividades básicas desta enzima são:
1. atividade de polimerase, catalisa o crescimento da cadeia de DNA no sentido 5’→ 3’;
5’
T C
A G A A T T C C C G
3’
A A T T C G G G T
C
A A T T C G G G T
C
A G A A T T C C C G
A A T T C G G G T
C
A G A A T T C C C G
Fita
Molde
Nova
Fita
Nova
Fita
5’ 3’
Fita
Molde
Sentido da
Replicação
Sentido da
Replicação
11
2. atividade de exonuclease 3‟ → 5‟, com o objetivo de remover bases pareadas erradas;
3. atividade de exonuclease 5‟ → 3‟, degradação da dupla hélice, usada principalmente na
remoção dos “primers” de RNA.
Aparentemente estas três atividades são realizadas por sítios ativos situados em partes
diferentes da molécula.
A replicação do DNA inicia com uma Origem de Replicação e então continua bidirecionalmente
em uma Forquilha de replicação.
Em organismos procariotos replicação acontece a partir de uma única origem de replicação. Em
eucariotos o processo acontece a partir de diversas origens de replicação por cromossomo.
A DNA polimerase é uma enzima com capacidade de ampliar uma cadeia de DNA, mas é
incapaz de iniciá-la, pois ela necessita de um grupamento 3‟-OH livre para atuar. Sendo assim, antes do
início da síntese de DNA, é necessário que, na origem da replicação, seja sintetizado um pequeno
fragmento de RNA (RNA iniciador ou “primer”), com aproximadamente 10 a 60 nucleotídeos, pela
enzima primase. A partir do “primer” então a nova cadeia de DNA será produzida pela DNA polimerase.
A DNA polimerase sintetiza novas cadeias apenas no sentido 5‟ → 3‟, movendo-se no sentido 3‟
→ 5‟ do filamento molde. Como já foi comentado, o processo de replicação ocorre de forma bi-direcional
nas duas fitas da molécula de DNA, sendo assim enquanto uma das fitas é sintetizada de forma
contínua, a outra necessariamente será sintetizada de forma descontínua como pode ser observado na
figura abaixo:
f
o
r
q
u
i
l
h
a
d
e
R
e
p
l
i
c
a
ç
ã
o
Origem de Replicação
Forquilha de Replicação
3’
5’ 3’
Fragmentos de Okazaki Filamento Contínuo
Origem de Replicação
Primers
5’
12
A DNA polimerase sintetiza um novo fragmento até o início do fragmento anterior retirando
inclusive o “primer” que lhe deu origem, graças a sua atividade exonuclease 5‟ → 3‟. A união dos
diversos fragmentos de Okasaki, da fita descontínua, são então, unidos pela enzima ligase (única
enzima capaz de unir duas cadeias de DNA).
Ao final da replicação, um aspecto importante é que uma das extremidades do cromossomo, a
da fita descontínua, ficará mais curta, pois o primer que foi ali adicionado não será substituído por DNA
pela DNA polimerase, como os demais fragmentos. Para resolver este problema existe a enzima
telomerase que adiciona seqüência simples repetidas às pontas do cromossomo, deixando-a completa.
2.3. TRANSCRIÇÃO DO DNA
Como vimos anteriormente o DNA contém toda a informação necessária para o funcionamento e
desenvolvimento do organismo. Mas que tipo de informação é esta?
Esta informação do DNA tem como resultado a produção de proteína, sejam elas proteínas
estruturais ou enzimas, todas as estruturas celulares são compostas por proteínas ou foram produzidas
a partir de atuação proteínas.
Mas para que a informação contida no DNA resulte em proteínas as regiões deste DNA, onde se
encontram os genes, devem ser copiadas ou transcritas em moléculas unifilamentares de RNA (ácido
ribonucléico).
O RNA, apesar de também ser um ácido nucléico, possui algumas características peculiares que
o tornam apto para ser a “cópia funcional” do DNA:
RNA é unifilamentar, sendo assim o RNA pode possuir uma variedade de formas
tridimensionais, algumas bastante complexas, como ribossomos e tRNA, que o permite realizar uma
diversidade de atividade, principalmente na tradução.
O RNA possui em sua composição a ribose em vez da desoxirribose.
O RNA também é composto pelas bases nitrogenadas Adenina (A), Guanina (G) e Citosina
(C), mas a Uracila (U) é encontrada no lugar da Timina.
Existem algumas classes de RNA:
RNAs Informacionais – são os intermediários na decodificação de DNA e cadeias polipeptídicas
(proteínas) → mRNA – RNA mensageiro. Nos procariotos, o mRNA é o transcrito primário, ou seja o
produto direto da transcrição, em eucariotos o transcrito primário precisa passar por um processamento,
ainda no núcleo, para ser o mRNA, e então passar para o citoplasma onde será traduzido em proteína.
RNAs funcionais – nunca são traduzidos em polipeptídios, são RNAs que possuem funções
específicas nas células:
13
tRNAs – RNAs transportadores – se ligam a aminoácidos específicos e os transportam
ao complexo Ribossomo + mRNA durante a tradução;
rRNAs – RNAs ribossômicos – combinam-se a diversas proteínas para formar os
ribossomo, que são complexos moleculares encarregados de realizar a síntese de proteínas.
Além destes existes ainda outros tipos de RNAs com funções ainda não bem esclarecidas que
são encontrados tanto no núcleo como no citoplasma, os snRNAs (RNAs pequenos nucleares) e os
scRNAs (RNAs pequenos citoplasmáticos).
De uma forma similar a replicação, a transcrição também é uma reação de polimerização,
baseada no pareamento complementar de bases nitrogenadas, tendo como fita molde o DNA. Consiste
em um processo catalisado pela enzima denominada RNA polimerase, que se liga ao DNA e se
desloca ao longo da fita molde adicionando a nova cadeia ribonucleotídeos. Assim ao
desoxirribonucleotídeo citosina (C), alinha-se um ribonucleotídeo guanina (G), ao desoxirribonucleotídeo
guanina (G), alinha-se um ribonucleotídeo citosina (C) e ao desoxirribonucleotídeo adenina (A) alinha-se
um ribonucleotídeo uracila (U), pois o RNA não possui timina em sua composição. Também da mesma
forma que na replicação a transcrição acontece no sentido 5‟ → 3‟. A transcrição, no entanto, acontece
em apenas um dos filamentos da molécula de DNA, sendo por isto assimétrica. O mesmo filamento de
DNA não é necessariamente transcrito ao longo de todo o cromossomo.
A transcrição acontece basicamente em três estágios:
Início – para que se dê início à transcrição de um determinado gene, é necessário que a RNA
polimerase, com o auxílio do fator (sigma), reconheça, na molécula de DNA, a região em que este
gene está localizado. Estas regiões do DNA que precedem as seqüências que codificam os genes,
regiões -35 e -10, e que são reconhecidas pela RNA polimerase são chamadas promotores. Ao
reconhecer as seqüências promotoras na molécula de DNA, a RNA polimerase se liga a elas levemente,
formando o complexo promotor fechado, quando então desenrola o DNA e se liga fortemente a
molécula de DNA, libera o fator , formando o complexo promotor aberto, e começa a síntese de
RNA.
Alongamento – como já foi dito, a síntese de RNA acontece sempre no sentido 5‟ → 3‟. Tendo
como substrato os trifosfatos de nucleosídeos (NTP: ATP, GTP, CTP e UTP), que além de fornecerem
os ribonucleosídeos vão também fornecer a energia necessária a reação, com a quebra do trifosfato de
alta energia pela reação:
NTP + (NMP)n DNA (NMP)n+1 + PPi Mg
2+ + RNA polimerase
Durante todo o processo de alongamento, o complexo de transcrição aberto resulta em uma
“bolha de transcrição”, que se desloca ao longo da dupla fita de DNA
14
Término – A finalização da transcrição gênica se dá quando a RNA polimerase reconhece sinais
para o término. Em geral estes sinais são seqüências de nucleotídeos que produzem alterações
tridimensionais na molécula de RNA em formação que sinalizam para a liberação da RNA polimerase e
conseqüentemente para o final da transcrição.
Estes passos acima descritos correspondem ao processo de transcrição em procariotos, em
eucariotos, o processo é basicamente o mesmo, porém, possui algumas diferenças que é importante
que sejam salientadas:
1ª - Uma grande diferença se dá em decorrência do fato que em eucariotos o DNA está no
núcleo, o RNA é então produzido no núcleo e precisa ser levado para o citoplasma, onde ocorre a
síntese protéica. Em procariotos, como não possuem núcleo, a transcrição e a tradução ocorrem no
mesmo local, podendo inclusive a tradução iniciar antes mesmo da molécula de RNA estar toda
sintetizada.
2ª - Enquanto em procariotos existe só uma espécie de RNA polimerase, em eucariotos já foram
reconhecidas pelo menos três, todas com estruturas mais complexas que a existente em procarioros:
RNA polimerase I – catalisa a síntese de rRNA
RNA polimerase II – catalisa a síntese de mRNA
RNA polimerase III – catalisa a síntese de tRNA, snRNA e scRNA.
3ª - Em eucariotos cada molécula de mRNA sintetizada corresponde a uma cadeia polipeptídica,
enquanto que em procariotos, uma molécula de mRNA pode codificar várias proteínas.
4ª - Em eucariotos o transcrito primário de mRNA será processado antes de ser transportado
para o citoplasma. O processamento consiste basicamente em:
Adição de um cap (7-metilguanosina) à extremidade 5‟;
5’
3’
Sentido da
transcrição
3’
Filamento não molde do DNA
5’
3’
RNA sendo
Transcrito
5’
Filamento molde do DNA
A A A A T T C G G G T
T T G G G A A T T C G G G T
T C C
A A T T C G G G T
T G G A A C T G
A A T T C G G G T
T C
A A T T C C C G
A G
15
Adição da cauda poli (A) (seqüência de 150 - 200 adenosinas) à extremidade 3‟;
Recomposição (“Splicing”) – remoção das partes internas do transcrito .
Os segmentos de DNA que codificam a estrutura da proteína são interrompidos por seqüências
intercalares não codificadoras – introns. A recomposição remove os introns e junta todas as regiões
codificantes chamadas exons para formar o mRNA
5ª - Recomposição alternativa – em eucariotos pode acontecer a produção de mRNAs
diferentes e conseqüentemente proteínas diferentes a partir do mesmo transcrito primário. Isto acontece
em diferentes tipos celulares ou em estágios diferentes do desenvolvimento.
2.4. TRADUÇÃO – SÍNTESE DE PROTEÍNAS
Antes de qualquer coisa vamos discutir como foi possível chegar ao Código Genético. Ou seja:
“Como a seqüência de nucleotídeos dita a seqüência de aminoácidos”
Sendo os nucleotídeos considerados letras, poderíamos considerar os aminoácidos palavras e
assim, diferentes combinações de nucleotídeos resultariam no código para identificar diferentes
aminoácidos.
A primeira questão a ser respondida foi se o código genético era superposto ou não:
aa3
aa2 Código superposto
aa1
A U U G C U C A G
aa1 aa2 aa3 Código não superposto
Experimentos em que se provocavam mutações em que se trocava apenas um nucleotídeo por
outro em um gene, observava-se alteração em apenas um aminoácido na cadeia polipeptídica
resultante, sendo assim, ficou demonstrado que o código não é superposto, pois do contrário haveria
um número maior de aminoácidos trocados.
A questão seguinte foi a de quantas letras resultava em um código, ou seja, quantos
nucleotídeos resultariam em um aminoácido. Sendo o RNA composto de quatro nucleotídeos diferentes
e havendo 20 aminoácidos, o código deveria ser tal que as diferentes combinações de nucleotídeos
fossem no mínimo 20.
Então: 1 nucleotídeo → 41 código para apenas quatro aminoácidos → DESCARTADO
2 nucleotídeos → 42 código para apenas 16 aminoácidos→ DESCARTADO
3 nucleotídeos → 43 código para 64 aminoácidos → ACEITO
Este resultado conclui que existem códigos em excesso, mais tarde foi confirmado que para
vários aminoácidos existem várias combinações de nucleotídeos – O código genético é redundante.
Além disto existe algumas seqüências que codificam para a finalização do processo de tradução.
16
O Código genético é o seguinte:
S e g u n d a L e t r a
U C A G
P
r
i
m
e
i
r
a
L
e
t
r
a
U
UUU Fen UCU
Ser
UAU Tir UGU Cis U
T
e
r
c
e
i
r
a
L
e
t
r
a
UUC UCC UAC UGC C
UUA Leu UCA UAA Fim UGA Fim A
UUG UCG UAG Fim UGG Trp G
C
CUU
Leu
CCU
Pro
CAU His CGU
Arg
U
CUC CCC CAC CGC C
CUA CCA CAA Gin CGA A
CUG CCG CAG CGG G
A
AUU
Ile
ACU
Tre
AAU Asn
AGU Ser U
AUC ACC AAC AGC C
AUA ACA AAA Lis AGA Arg A
AUG Met ACG AAG AGG G
G
GUU
Val
GCU
Ala
GAU Asp GGU
Gli
U
GUC GCC GAC GGC C
GUA GCA GAA Glu GGA A
GUG GCG GAG GGG G Deve-se observar que:
Cada uma das 64 combinações de nucleotídeos tem sentido;
Pelo menos alguns aminoácidos são codificados por dois ou mais trincas de nucleotídeos;
os tRNAs possuem um anticódon que reconhece o códon do mRNA;
Cada molécula de tRNA tem uma forma tridimensional única que permite o reconhecimento
da sintetase correta, que será a enzima que catalisará a união do rRNA ao aminoácido correto formando
o complexo denominado amoniacil-tRNA (tRNA carregado). Alguns aminoácidos possuem apenas um
tRNA correspondente, enquanto que para outros, existem vários tRNAs alternativos. Além disto alguns
tRNAs podem levar seus aminoácidos em resposta a vários códons com pareamento “frouxo” em uma
das extremidades – Códon oscilante;
Os tRNAs e rRNAs são produtos finais de genes específicos.
Síntese de Proteínas
A maior parte das reações da síntese de proteínas acontecem nos ribossomos que são
estruturas constituídas de duas subunidades, uma maior, composta de duas moléculas de rRNA e
proteínas (denominadas L1, L2, etc...), e uma subunidade menor, composta de uma molécula de rRNA
e proteínas (denominadas S1, S2, etc...). Os ribossomos possuem sítios específicos para se ligarem ao
17
mRNA e aos tRNAs e ainda a fatores protéicos específicos. Quando não estão realizando a síntese
protéica, as subunidades do ribossomo ficam dissociadas na solução citoplasmática.
50 S
+
70 S
30 S A síntese de proteínas é o resultado de uma série de reações químicas , ou seja:
1ª reação – acontece no citosol, ligação dos aminoácidos às moléculas específicas de tRNA por
uma ligação de alta energia. Reação catalisada por uma enzima específica para cada aminoácido –
sintetase. Então:
aa1 + tRNA1 + ATP Sintetase aa1-tRNA1 + AMP + PPi
tRNA1 carregado
2ª reação e as seguintes – acontece no ribossomo. União de um aminoácido a outro, a energia
é proveniente da ligação de alta energia do tRNA carregado, a reação é catalisada pela peptidil
transferase:
aa1-tRNA1 + aa2-tRNA2 Peptidil transferase aa1-aa2-tRNA2 + tRNA1 (liberado)
Este processo de adição de aminoácidos continua até que o aminoácido final é adicionado.
O processo de síntese de proteínas pode ser dividido em três etapas:
Iniciação – nesta fase, que conta com a participação de fatores de iniciação e GTP, como
fornecedor de energia, o mRNA se liga a subunidade menor do ribossomo, logo após ocorre a ligação
do tRNA iniciador (fMet-tRNA na maioria dos procariotos) no sítio P do ribossomo (sítio em que se
liga o peptidil-tRNA levando a cadeia em formação) e a seguir ocorre a montagem das duas unidades
do ribossomo deixando-o em condições de passar para a fase de alongamento.
18
Alongamento – nesta fase os seguintes passos:
complexos de aminoacil-tRNA, com a participação de fatores de alongamento e GTP,
se ligam ao sítio A do ribossomo,
ocorre a reação, mediada pela peptidil transferase, em que a cadeia polipeptídica do
peptidil-tRNA, que está no sítio P, se liga ao aminoácido do aminoacil-tRNA que está no sítio A;
ribossomo se move em códon, libverando o tRNA descarregado do sítio P e
transferindo o peptidil-tRNA recém formado do sítio A para o sítio P;
este processo de alongamento se repete o número de vezes necessárias para
completar a cadeia polipeptídica em formação.
Término – o processo de síntese protéica é finalizado quando no sítio A apresenta um dos
códons de término (Fim). Estes codons são identificados por fatores de liberação que se ligam ao sítio
A. O polipeptídeo formado é então liberado do sítio P e os ribossomos se dissociam em duas
subunidades.
O conjunto de genes que codificam para proteínas em um organismo é chamado Proteoma,
diversos trabalhos têm sido realizados como o objetivo de identificar, diferentes organismos, o número
de genes que codificam proteínas, assim como a “divisão de trabalho” dentro do proteoma, objetivando
compreender que tipos de genes são necessários para que um organismo funcione.
19
3. GENÉTICA DE POPULAÇÕES
Os indivíduos não se encontram isolados na natureza, mas reunidos em populações,
reprodutivamente ativas.
Ao estudar a genética experimental, nós retiramos os indivíduos das suas populações naturais, e
o submetemos a cruzamentos escolhidos, para observar, pela descendência, os diversos fenômenos
envolvidos na herança. Mendel, por exemplo, concluiu com sucesso seus experimentos cruzando
artificialmente plantas de ervilha, obtendo gerações F1 e F2.
Em muitos casos não é possível estudar a genética por meio de cruzamentos artificiais. Muitas
vezes é interessante estudar os indivíduos em seu estado natural, por exemplo, nos estudos de
genética ecológica. Em certos casos a reprodução artificial é muito difícil, como em muitas espécies
selvagens. Ou ainda pode haver dificuldades de ordem ética para os cruzamentos, como na espécie
humana.
Nestes casos o estudo da herança deve ser feito na população em seu estado natural. O estudo
do comportamento dos genes nas populações pode ainda fornecer uma base teórica para os trabalhos
de melhoramento vegetal e animal.
3.1. DEFINIÇÃO DE POPULAÇÃO
Uma população, do ponto de vista da genética, pode ser definida como um grupo de indivíduos
da mesma espécie, que ocupam uma mesma área ao mesmo tempo, e que são potencialmente
intercruzáveis.
3.2. FREQÜÊNCIAS GÊNICAS E GENOTÍPICAS
Uma população pode ser caracterizada, para determinado loco (forma aportuguesada de locus,
plural locos), pelas freqüências com que cada genótipo aparece. Por exemplo:
População 1 População 2
Genótipo Nº de
Indivíduos
Freqüências
Genotípicas
Genótipo Nº de
Indivíduos
Freqüências
Genotípicas
AA 100 D 100/400=0,25 AA 200 D 200/500=0,40
Aa 200 H 200/400=0,50 Aa 200 H 200/500=0,40
aa 100 R 100/400=0,25 aa 100 R 100/500=0,20
Total 400 1 Total 500 1
Note que a soma das freqüências é sempre igual a 1 (isto ocorre com qualquer distribuição de
freqüências relativas, já que a soma de todas as partes é sempre igual ao todo), então sempre
D + H + R = 1
20
A partir das freqüências genotípicas pode-se facilmente chegar às freqüências gênicas, basta
para isso observar que o genótipo AA tem 100% de genes A, o genótipo Aa tem 50% de genes A e 50%
de genes a e o genótipo aa tem 100% de genes a. Assim a freqüência de A, que chamaremos de p,
será igual a freqüência dos homozigotos AA mais metade da freqüência dos heterozigotos, ou seja,
f(A)= p = D + (1/2) H (I)
assim como a freqüência de a, que chamaremos q, será:
f(a)=q = R + (1/2) H. (II)
Note mais uma vez que p+q=1.
Nos exemplos acima temos:
População 1 p = 0,25 + (1/2) 0,50 = 0,50 População 2 p = 0,40 + (1/2) 0,40 = 0,60
q = 0,25 + (1/2) 0,50 = 0,50 q = 0,20 + (1/2) 0,40 = 0,40
A freqüência genotípica caracteriza uma população, mas a freqüência gênica não, já que para
uma distribuição de freqüências gênicas, infinitas distribuições de freqüência genotípicas são possíveis.
Por exemplo, se afirmarmos que certa população tem freqüências gênicas:
p = 0,4 para o alelo A e q = 0,6 para o alelo a
não podemos fazer nenhuma afirmativa sobre as freqüências genotípicas.
Estas podem ser D=0,4, H=0,0 e R=0,6 , ou D=0,3, H=0,2 e R=0,5, ou outra qualquer.
Para podermos fazer qualquer afirmativa a respeito das freqüências genotípicas é necessário um
conhecimento da forma como os genes se combinam na população. Cada gameta contém um único
gene de cada loco, assim, as formas como os genes se combinam para formar os genótipos da nova
geração é determinada pela forma como os gametas se combinam para formar os novos indivíduos de
população. É então necessário estudar os padrões reprodutivos das populações.
3.3. PADRÕES REPRODUTIVOS DAS POPULAÇÕES
Panmixia - é o sistema reprodutivo onde todos os indivíduos de uma população têm a mesma
chance de se acasalarem entre si. Isto é, a reprodução é totalmente ao acaso. É difícil imaginar algum
tipo de população que seja estritamente panmítica. Veja por exemplo, se a população é de espécie
dióica, não haverá cruzamentos entre indivíduos do mesmo sexo. Se forem monóicos, poderão ocorrer
cruzamentos mais freqüentes entre indivíduos com certas características especiais, como os que
floresçam na mesma época, etc.
No entanto, como esta população tem características especiais, e muitas populações estão em
condições próximas à panmixia, iremos dar atenção especial a ela e a usaremos como modelo para
nosso estudo.
21
Endogamia - é o cruzamento entre indivíduos com grau de parentesco maior do que o de dois
indivíduos tomados ao acaso na população. Como indivíduos aparentados têm uma chance maior de
terem os mesmos genes alelos, teremos um aumento da homozigoze em decorrência desse processo.
Exogamia - é o oposto à endogamia, isto é, o cruzamento de indivíduos com parentesco menor
que dois indivíduos tomados ao acaso na população, e leva a um aumento na freqüência de
heterozigotos.
Além desses sistemas podemos ter sistemas de acasalamentos próprios para certas
populações, como por exemplo, a autofecundação obrigatória em certas plantas (chamadas
autógamas), ou sistemas em que a autofecundação e o cruzamento ocorrem com certas proporções
(parcialmente autógamas) ou ainda fecundações recíprocas em animais hermafroditas, etc.
O sistema de acasalamento é extremamente importante nas populações, pois determina as
combinações de gametas que poderão ocorrer e assim os genótipos na geração seguinte.
3.4. FREQÜÊNCIAS GÊNICAS E GENOTÍPICAS NA POPULAÇÃO PANMÍTICA.
As freqüências gênicas nos gametas produzidos em uma população serão iguais às freqüências
gênicas na população. De fato, no processo de meiose, cada indivíduo produz seus gametas de acordo
com os genes que tem, um homozigoto AA produzirá 100% de gametas A, um heterozigoto (Aa)
produzirá 50% de gametas A e 50% de gametas a e um homozigoto aa produzirá somente gametas a.
Teremos então p gametas A e q gametas a produzidos pelos machos e o mesmo pelas fêmeas,
supondo iguais proporções entre os sexos. Como panmixia indica reprodução aleatória, a combinação
dos gametas também o será, assim:
gametas femininos
gametas masculinos p A q a
p A p2 AA pq Aa
q a pq Aa q2 aa
Notamos então que, qualquer que sejam as freqüência genotípicas iniciais, em uma geração de
panmixia, elas passam a ser p2, 2pq e q
2, para os genótipos AA, Aa e aa, respectivamente, e esses
valores dependem apenas das freqüência gênicas na geração paterna.
Aplicando as fórmulas I e II às novas freqüências genotípicas teremos:
p1=D1+(1/2) H1 ou p1 = p2 + pq
sendo q=1-p então: p1 = p2 + p(1-p) = p
2 + p - p
2 = p, e q1 = q
2 + pq =q
Ou seja uma população panmítica não altera suas freqüências gênicas de uma geração para
outra. Se o sistema de acasalamento continuar panmítico as freqüência genotípicas e gênicas não irão
se alterar geração após geração. Desta forma se diz que a população está em equilíbrio ou Equilíbrio
de Hardy-Weinberg.
22
Teorema de Hardy-Weinberg:
“Em uma população suficientemente grande para que não ocorra oscilação genética, onde os
acasalamentos ocorram ao acaso (Panmixia), sendo todos os indivíduos igualmente férteis e viáveis e
onde não ocorra seleção, mutação ou migração, as freqüências genotípicas e genéticas permanecerão
constantes ao longo das gerações”
Isto poderia ser observado, de forma mais trabalhosa usando as freqüências dos genótipos.
No quadro abaixo temos todos os acasalamentos possíveis em uma população panmítica, com
suas freqüências respectivas, e os descendentes gerados.
Confirma-se observando os resultados que uma população panmítica não altera suas
freqüências gênicas e genotípicas de uma geração para outra e que estas permanecem nas proporções
p2, 2pq e q
2, sendo p e q as freqüências gênicas.
Machos Fêmeas Freqüência do cruzamento Descendência
AA AA p4 AA
Aa 2p3q 0,5 AA e 0,5 Aa
aa p2q
2 Aa
Aa AA 2p3q 0,5 AA e 0,5Aa
Aa 4p2q
2 0,25 AA, 0,5 Aa e 0,25 aa
aa 2 pq3 0,5 Aa e 0,5 aa
aa AA p2q
2 Aa
Aa 2pq3 0,5 Aa e 0,5 aa
aa q4 aa
Totais dos descendentes f(AA)= p4 + 2p
3q + p
2q
2 = p
2 (p
2 + 2pq + q
2) = p
2
f(Aa)= 2p3q + 4p
2q
2 + 2pq
3 = 2pq (p
2 + 2pq + q
2) = 2pq
f(aa)= p2q
2 + 2pq
3 + q
4 = q
2 (p
2 + 2pq + q
2) = q
2
3.5. FREQÜÊNCIAS GÊNICAS E GENOTÍPICAS EM POPULAÇÕES ENDÓGAMAS
Como vimos, a endogamia é o cruzamento entre indivíduos com grau de parentesco maior do
que o de dois indivíduos tomados ao acaso na população. Este tipo de acasalamento irá afetar as
freqüências genotípicas na população porque indivíduos formados dessa maneira terão maior chance
de terem genes semelhantes nos seus locos e, portanto, serem homozigotos. O acasalamento que
promove maior grau de endogamia é a autofecundação, pois oferecerá a maior chance de gametas com
genes semelhantes se unirem na fecundação, por isso iremos usar este tipo de acasalamento para
demonstrar os efeitos da endogamia sobre as freqüências genotípicas.
23
Vamos imaginar uma população inicialmente panmítica, com freqüências p e q para os alelos A e
a. Então os genótipos devem estar nas freqüências:
Descendência
Genótipos Freqüência AA Aa aa
AA p2 p
2
Aa 2pq (1/2)pq pq (1/2)pq
aa q2 q
2
Freq. na descendência (1/2)(p2+p) pq (1/2)(q
2+q)
Se em certa geração a reprodução for toda por autofecundação, a geração seguinte terá uma
diminuição da freqüência dos heterozigotos e um aumento da freqüência dos homozigotos em valor
igual. Notamos que neste caso a freqüência dos heterozigotos diminuiu numa proporção igual a 1/2.
Esta proporção de diminuição na freqüência dos heterozigotos é chamada de coeficiente de
endogamia e é simbolizado pela letra F. O cálculo desse coeficiente em situações práticas será
examinado em um outro capítulo.
Pode ser demonstrado que, uma população que tenha um coeficiente de endogamia F a
freqüência dos genótipos estará em equilíbrio nas proporções:
Genótipos Freqüência
AA p2+ pqF = p
2(1-F)+ pF
Aa 2pq(1-F) = 2pq(1-F)
aa q2+ pqF = q
2(1-F)+ qF
O coeficiente de endogamia F varia de 0 a 1.
Pode-se ver então que quando o F = 0 → população é panmítica.
Quando o F=1 → a população é autógama completa, e será constituída somente de
homozigotos. Quanto maior o valor de F maior a proporção de homozigotos na população.
3.6. FREQÜÊNCIAS GÊNICAS E GENOTÍPICAS EM POPULAÇÕES EXÓGAMAS
A exogamia é uma tendência geral na natureza, principalmente entre os animais. pode-se
observar em muitas espécies de plantas e de animais mecanismos e comportamentos que protegem a
população da endogamia, promovendo a exogamia. Em populações muito grandes a exogamia não
difere praticamente da panmixia. De fato, se a população é muito grande, composta de muitas famílias,
e as famílias não são grandes a probabilidade de dois indivíduos da mesma família se acasalar por
acaso (portanto sob panmixia) é muito reduzida. Assim, em populações grandes comportamentos
exogâmicos não alteram muito a população. No entanto em populações pequenas, com poucas
24
famílias, onde o tamanho da família é grande em relação ao da população, a exogamia exerce um papel
muito importante na prevenção da endogamia.
Em uma população, com N indivíduos, podem-se ter CN2 acasalamentos, se cada família tiver n
indivíduos a probabilidade de acasalamento dentro de cada família será Cn2. A probabilidade de
acasalamentos endogâmicos será P= f Cn2 / CN
2 em que f é o número de famílias, ou seja:
P = (n-1)/(N-1). Logo essa probabilidade será maior em populações menores
Suponhamos uma situação simplificada onde uma população é composta por n famílias, todas
com o mesmo tamanho, e que não haja possibilidade de acasalamentos dentro das famílias. Cada
família tem sua própria freqüência gênica, digamos p1, p2,...pn, de modo que a freqüência na população
é a média pi/n. Ao acasalar com todos os indivíduos das outras famílias, uma família produziria uma
proporção de homozigotos AA igual a pj (pi - pj)/(n -1).
Fazendo a média para todas as famílias teremos:
D=(1/n) [p1 (pi - p1)/(n -1)+ p2 (pi - p2)/(n -1)+...+ pn (pi - pn)/(n -1)]
D= p2- [1/n] S
2p . → Se pi for constante D= p
2 simplesmente.
Há então uma diminuição da homozigose que é proporcional à variância da freqüência gênica
nas famílias e inversamente proporcional ao número de famílias.
Outra forma de escrever é D=[n/(n-1)] p2 - pi
2/ [n(n-1)] → vê-se que se o número de famílias
for grande, de modo que a divisão [n/(n-1)] 1 e o segundo termo seja insignificante, a exogamia não
causará diferença em relação à panmixia.
3.7. FATORES QUE ALTERAM AS FREQÜÊNCIAS GÊNICAS DAS POPULAÇÕES
Como vimos, as populações panmíticas não alteram suas freqüências gênicas e genotípicas ao
longo das gerações. Dessa forma nenhuma alteração poderia acontecer e não haveria obviamente
evolução ou melhoramento. No entanto existem processos naturais que alteram as freqüências gênicas
das populações promovendo as mudanças necessárias a constante adaptação das populações ao meio,
sempre em alteração. Esses fatores são: a mutação gênica, a oscilação genética, a migração genética,
a seleção natural e os acasalamentos preferenciais. São esses os fatores essenciais à evolução, sem
os quais a variação existente seria estatística.
Veremos a seguir cada um destes fatores.
3.7.1. Mutação Gênica
Os genes são formados por cadeias de moléculas especiais chamadas DNA (ácido
desoxirribonucléico). Essas cadeias são longas seqüências pareadas de bases aminadas.
Existem dois tipos de bases aminadas: purinas (Adenina e Guanina) e pirimidinas (Timina e
Citosina) que se pareiam de forma específica, formando pela sua seqüência um código que determina o
25
aminoácido que deverá ser alocado em cada posição na proteína codificada pelo gene. Qualquer
mudança nesta seqüência de bases causará uma mudança na proteína codificada, podendo então
alterar sua função no organismo.
Diversos fatores podem determinar a alteração da seqüência de DNA. Um erro na replicação do
mesmo, no momento da sua duplicação, no processo de reprodução celular (mitose ou meiose), por
exemplo. Existem também radiações capazes de atingir o DNA, causando quebras em sua estrutura e
que redundam em mutações, como raios X, raios gama, etc, além de substâncias químicas capazes de
reagir com o DNA e causar essas alterações.
Os genes existentes e que exercem funções no organismo se mantiveram na população por que
mostraram sua utilidade no longo período evolutivo da espécie. As mutações são alterações químicas
que podem atingir qualquer parte do DNA indiferentemente, e, portanto causam mudanças
completamente aleatórias. É extremamente improvável que uma mutação venha a trazer vantagem
imediata ao organismo que a sofreu, ela será na maioria dos casos prejudicial. No entanto, o acúmulo
de muitas mutações em uma população é benéfico em longo prazo, pois algumas delas poderão ser
úteis em outras situações futuras, ajudando a população a fazer frente a novos ambientes.
As mutações ocorrem continuamente em todas as populações, em baixíssima freqüência. Para
que haja acúmulo de mutações é necessário que elas não sejam eliminadas no processo evolutivo.
Como isso ocorre iremos discutir mais adiante.
Para quantificarmos o efeito das mutações sobre as freqüências gênicas vamos supor que a
taxa de mutação do gene A1 para A2 seja u e que a taxa de mutação do gene A2 para A1 seja v e que
as freqüências originais sejam po e qo, para os alelos A1 e A2, então:
p1 = po - upo + vqo q1 = qo + upo - vqo
Se upo > vqo a freqüência de A1 diminui.
Se upo < vqo a freqüência de A2 diminui.
Obviamente estes valores tenderão a um equilíbrio quando vqe = upe e consequentemente
pe = v/(u+v) e qe = u/(u+v)
3.7.2. Migração Genética
Por migração genética se entende a saída ou entrada de indivíduos de uma população. Como
estudaremos o processo independente da seleção, está excluída qualquer escolha de indivíduos no
processo. Portanto a saída de indivíduos não causará qualquer impacto na população, já que estes
serão tirados ao acaso. Já a entrada de indivíduos na população causará alteração nas freqüências,
pois as freqüências gênicas nos imigrantes serão as da população de origem.
Para que haja imigração é necessário que os imigrantes se integrem à nova população. Isso só
se dará se eles passarem a se reproduzir normalmente na nova população. A imigração muitas vezes
26
requer uma mudança de ambiente. Por isso os indivíduos imigrantes devem ter a capacidade de
sobreviver no novo ambiente. Esta característica é conhecida como capacidade de dispersão. Os
imigrantes têm também que se reproduzir com os indivíduos da nova população, então nenhuma
barreira reprodutiva pode existir entre eles. Barreiras reprodutivas são mecanismos que podem impedir
ou dificultar a reprodução, tal como diferenças na época de florescimento. Podem ser pré-zigóticas,
como diferentes condições ecológicas ótimas para os indivíduos das duas populações envolvidas,
incompatibilidade reprodutiva entre os indivíduos das populações, diferentes agentes polinizadores, ou
pós-zigóticas, como inviabilidade do híbrido, esterilidade do híbrido, inviabilidade do F2, etc.
Supondo duas populações:
População original "O", onde po = no/To, e outra população "I", onde pi = ni/Ti,
sendo no o número de genes A na população "O", ni o número de genes A na população "I", To o
total de genes deste loco na população "O" e Ti o total de genes deste loco na população "I".
Com a junção das duas populações temos p1 = (no + ni)/(To + Ti).
Mas no = poTo e ni = piTi. → Assim, p1 = (poTo + piTi)/(Ti+To).
Se chamarmos de m a proporção de imigrantes na população resultante, m = Ti/(Ti + To);
Então : p1 = po (1-m) + pi mi ou p1 = po + m (pi - po)
Então a freqüência gênica na população resultante na migração natural é a média ponderada
das freqüências gênicas das populações que se uniram.
Como não houve alteração da estrutura reprodutiva, se a população era originalmente panmítica,
ela continuará mantendo as proporções típicas dessas populações, mas com as novas freqüências, isto
é, p12, 2p1q1, q1
2.
No melhoramento vegetal a população formada pela junção de duas ou mais populações é
chamada de “composto”. A freqüência gênica em um composto será então a média ponderada das
freqüências gênicas das populações que o compõe. O peso será o número de indivíduos de cada
população. Um composto recém formado não é uma população em equilíbrio. Teoricamente entraria em
equilíbrio na primeira geração de reprodução panmítica, mas na prática o equilíbrio só vai ocorrer após
algumas gerações.
Uma outra forma pela qual os genes de uma população podem ser introduzidos em outra é pelo
cruzamento de indivíduos de uma população com indivíduos de outra. Neste caso o número de
indivíduos de cada grupo deixa de ser importante, pois na geração descendente cada indivíduo será
fruto da junção de um gameta proveniente de uma população com um gameta proveniente da outra.
Assim, a proporção de genes das duas populações será a mesma e a nova freqüência gênica será a
média aritmética simples das freqüências nas populações originais.
A população resultante desta hibridação não manterá as proporções p12, 2p1q1 e q
2, já que não é
proveniente de reprodução panmítica, e deverá ter mais heterozigotos que o esperado segundo essas
proporções, como mostrado no diagrama abaixo.
27
População 2
População 1 p2 A q2 a
p1 A p1p2 AA p1q2 Aa
q1 a p2q1 Aa q1q2 aa
Uma observação importante é que o valor máximo para o freqüência de heterozigotos em uma
população panmítica é 0,5 (meio). Isso pode ser facilmente demonstrado determinando o máximo para
a função 2p(1-p). Numa população híbrida o valor poderá exceder 0,5 e será tanto maior quanto mais
contrastantes forem as populações cruzadas, podendo chegar a 1.
Caso a população híbrida se reproduza ao acaso, formando o que se costuma chamar de
“geração avançada de um híbrido” dará origem a um composto de duas populações obtido pela
reprodução panmítica do cruzamento entre as duas. Assim, as freqüências gênicas seriam a média das
freqüências nas populações cruzadas:
pc = p1 + p2 qc = q1 + q2
2 2
3.7.3. Deriva Genética ou Oscilação Genética
Quando se tira uma amostra representativa de uma população qualquer, pode ser que esta seja
parecida com a população, mas não necessariamente igual. Por exemplo, vamos supor uma caixa onde
colocamos 100 bolas, sendo 40 pretas e 60 brancas. Se tirarmos a menor amostra aleatória na caixa,
uma bola tomada ao acaso, a probabilidade de ser preta ou branca será 40% e 60%, respectivamente.
É óbvio que não há bolas brancas e pretas ao mesmo tempo, então ou teremos uma bola preta (100%
bolas pretas na amostra) ou teremos uma bola branca (100% bolas brancas na amostra). Nos dois
casos houve um erro amostral. Se tirarmos amostras maiores haverá maior chance de se aproximar do
verdadeiro valor da população, mas este só ocorrerá pelo acaso. O único grupo que garante a presença
de 40% de bolas pretas e 60% de bolas brancas é o formado por todas as bolas, portanto a população.
Note que, se tirarmos 99 bolas já haverá um erro.
Note-se que se a caixa contivesse somente bolas de uma cor, qualquer amostra tirada teria
100% de bolas dessa cor, proporção exatamente igual a da população.
É importante notar que o erro amostral ocorre em todas as amostras de populações variáveis, e
será maior quanto menor for o tamanho da mesma. Este erro é imprevisível em seu efeito, já que‚
totalmente aleatório, mas sua variância pode ser prevista estudando a natureza do processo.
Na reprodução das populações, uma geração é formada de uma amostra dos gametas possíveis
na geração anterior. A população de gametas pode ser considerada infinita, já que trata-se de todas as
combinações possíveis dos genes segregantes na população. Já a amostra tem tamanho 2N, sendo N o
número de indivíduos na geração de filhos, pois cada descendente foi formado pela junção de 2
28
gametas. É óbvio que haverá um erro amostral, pois os gametas são tomados ao acaso. Sendo assim a
freqüência gênica na geração descendente não será a mesma que na geração paterna, mesmo que
nenhum processo especial esteja ocorrendo. Este fenômeno só não ocorrerá para locos não
segregantes, onde todos os indivíduos da população sejam homozigotos e iguais, ou para uma
população infinita de descendentes.
Este erro é então imprevisível quanto à direção e inversamente proporcional ao tamanho da
população descendente.
O erro pode ser representado pela variância (S2) da freqüência gênica de diversas amostras de
tamanho 2N retiradas de uma mesma população.
Supondo que esta população tem freqüência p e q para os alelos A e a, temos:
Amostra de tamanho 1 (um gameta) Amostras de tamanho 2 (um indivíduo) tipo Prob Freq. Variância tipo Prob Freq. Variância
A p 1 S2p=p - p
2 = p(1-p) = pq AA p
2 1
a q 0 Aa 2pq 0,5 S2p=p
2 + pq/2 - p
2 = pq/2
aa q2 0
Amostra de tamanho 4 (dois indivíduos) Tipos prob. Freq. Variância
AA e AA p4 1 Generalizando, a variância da Freqüência Gênica será
AA e Aa 2p3q 0.75
AA e aa p2q
2 0.5 S
2p = pq/2N, onde
Aa e AA 2p3q 0.75 S
2p = pq/4 N = número de indivíduos descendentes
Aa e Aa 4p2q
2 0.5
Aa e aa 2pq3 0.25 Vê-se que: S
2p = 0
aa e AA p2q
2 0.5 se p=0 ou q=0
aa e Aa 2pq3 0.25 ou se N for infinito
aa e aa q4 0
O efeito desse fenômeno, ao longo das gerações, se mostra pela variação nas freqüências
gênicas, sem motivo aparente. Estas mudanças são não direcionais e dão a impressão que as
freqüências estão flutuando, quando vistas em um gráfico. Daí o nome dado ao fenômeno, "genetical
drift", ou deriva genética ou ainda oscilação genética.
É fácil perceber que se a freqüência gênica em dado momento chegar a zero ou um, neste
processo, ela não mais sairá deste ponto. Podemos dizer que esses valores funcionam como barreiras
absorventes. Quando a freqüência chega a zero diz-se que o gene foi perdido. E quando a freqüência
chega a um diz-se que o gene foi fixado. Se não houver nenhum outro fator influindo no processo, a
probabilidade de fixar ou perder certo gene é proporcional à sua freqüência inicial.
A fixação ou a perda de genes ocorre aleatoriamente para genes favoráveis ou desfavoráveis, e
29
leva ao aumento da homozigose e perda de variabilidade.
A oscilação genética é um importante fator evolutivo, influindo diretamente na diferenciação de
populações e formação de raças naturais. Deve ser levado em conta quando se objetiva a preservação
da variabilidade genética, como em bancos de germoplasma, e na seleção em longo prazo, pois tende a
diminuir o limite final da seleção.
3.7.4. Seleção
O conceito de seleção está ligado às diferenças na capacidade dos indivíduos com diferentes
genótipos de deixarem descendentes para a geração seguinte. Se determinado genótipo é capaz de
deixar uma maior proporção de descendentes que a de outro, seus genes estarão representados na
geração seguinte com maior freqüência.
A seleção está ligada então à viabilidade, que pode ser definida como a capacidade de
sobrevivência de um genótipo em um meio ambiente. Esta capacidade pode ser medida pela freqüência
de determinado genótipo ou gene, nos sobreviventes em um meio. Ou pela proporção de descendentes
deixados de uma geração para outra por um determinado tipo.
A viabilidade depende da adaptação e da fertilidade conferida pelo genótipo.
Na seleção artificial o conceito de viabilidade fica substituído pelo critério de seleção usado pelo
melhorista, muito embora os processos sejam bem semelhantes.
Seleção contra genes recessivos
Vamos supor um modelo em que s é a taxa de seleção, isto é, a taxa de eliminação de
determinado genótipo, e 1-s ‚ então a taxa de viabilidade.
Em casos de dominância o genótipo do heterozigoto dominante é igual ao do homozigoto, então
também serão iguais suas viabilidades.
Genótipos Freqüências Viabilidade Freqüências
AA p2 1 p
2/(1-q
2s)
Aa 2pq 1 2pq/(1-q2s)
Aa q2 1-s q
2(1-s)/(1-q
2s)
Soma 1 1-q2s 1
F(a) = q1 = [q2(1-s) + pq]/(1-q
2s) q1 = q(1-qs)/(1-q
2s)
Esta expressão nos mostra o valor da freqüência do alelo recessivo após uma geração de
seleção contra os homozigotos recessivos com taxa s.
Vamos estudá-la para entender este processo.
Note que q varia de 0 a 1, assim como s. Para valores de q=0 ou q=1 a seleção é obviamente
impossível.
Quando s=zero indica a ausência de seleção e s=1 indica seleção máxima, que só ocorre nos
genes letais recessivos, e em melhoramento genético.
30
Se s=0 então pela fórmula q1 = q, como esperado.
Note que o denominador da fórmula jamais pode assumir valor zero. O numerador, só atingirá
este valor se q = 0, ou q e s iguais a 1.
Portanto, partindo de um valor qualquer diferente de zero ou um para “q” nunca se
atingirá valor zero para “q1”. Isto indica que, nos casos de dominância, o processo de seleção
não é capaz de, por si só, eliminar um gene da população, por mais prejudicial que ele seja.
Para confirmar vamos estudar o caso mais extremo, o dos genes letais recessivos, onde s=1.
q1 = q(1-q)/(1-q2) q1 = q/(1+q)
Nota-se de novo que q1 não será zero a não ser que q já o seja.
Esta expressão nos chama a atenção para outro fato. Note-se o denominador (1+q). Se q for
muito pequeno, digamos próximo a zero, então 1+q será praticamente 1, e pode-se dizer então que q1 é
praticamente igual a q. Isto indica a pouca eficiência desse processo em alterar a freqüência de genes
recessivos raros.
De fato, se nessas condições (s=1): q = 0,5 então → q1 = 0,33 , q = 0,2 então → q1 = 0,166 , q = 0,1 então → q1 = 0,0909.
Nota-se claramente que à medida que o valor da freqüência do gene recessivo diminui, o efeito
da seleção sobre ele diminui.
Podemos alterar esta fórmula para qt = q/(1 + tq), onde qt é a freqüência gênica após t gerações
de seleção com taxa 1 contra os homozigotos recessivos. Modificando esta fórmula chega-se a
t= (1/qt)- (1/q).
Mais uma vez pode-se confirmar a afirmativa feita.
Para diminuir à metade a freqüência de um gene com freqüência inicial 0,6 são necessárias 1,66
gerações. Para diminuir à mesma proporção um gene com freqüência inicial de 0,1 serão necessárias
10 gerações. Este fenômeno se deve ao fato de que a seleção só age sobre os homozigotos
recessivos. O gene recessivo presente no heterozigoto está isento de seleção, mantendo sempre uma
freqüência residual do mesmo.
Note que se q diminui muito, tende a zero, q2 tende a zero mais rápido que 2pq. Logo a
proporção de genes recessivos em heterozigotos passa a ser mais importante para a freqüência dos
genes recessivos que a proporção dos homozigotos recessivos. Isto pode ser mais bem visto se
estudarmos a relação entre genes recessivos nos heterozigotos e nos homozigotos, (pq/q2) = p/q.
Se q tende a zero, este valor tende a infinito.
Então a seleção agirá sobre alelos recessivos, diminuindo a sua freqüência, até‚ atingir um ponto
tal, quando este alelo for suficientemente raro, em que seu efeito será desprezível.
De fato, populações panmíticas acumulam inúmeros alelos recessivos prejudiciais, em
freqüência baixíssima, sem que sejam eliminados pela seleção. Ao longo do processo evolutivo, estes
31
alelos se manifestam em homozigose dando origem a indivíduos mal adaptados ou letais, o que dá a
esses genes aspecto totalmente indesejável. Daí o nome "carga genética", como se fossem um peso a
ser carregado pela população. No entanto, esse processo exerce um papel fundamental na evolução da
espécie, pois permite o acúmulo de inúmeros genes mutantes diferentes, que poderão ficar à disposição
do processo seletivo caso haja uma mudança nas condições ambientais. Esses alelos constituem uma
reserva de variabilidade genética para o processo evolutivo e para o melhoramento.
Seleção com ausência de dominância
Neste caso os heterozigotos são intermediários entre os homozigotos e, portanto a sua
viabilidade também deve ser.
Temos :
Genótipos freqüências Viabilidade Freqüência
AA p2 1 p
2/(1-qs)
Aa 2pq 1-(s/2) 2pq [1-(s/2)]/(1-qs)
Aa q2 1-s q
2(1-s)/(1-qs)
Soma 1 1-qs
F(a) = q1 = q (1 – s) – pqs/2
1 - qs
Examinaremos apenas o caso extremo em que s=1.
q1 = (pq/2)/(1-q) q1 = q/2
Neste caso também, apesar da eficiência da seleção contra o recessivo ser muito maior que na
dominância, não será possível ao processo de seleção eliminar o gene prejudicial. Neste caso no
entanto a diminuição da freqüência é rápida, havendo pequena chance de acúmulo dos genes
mutantes.
Seleção contra genes dominantes
Neste caso temos: Genótipos Freqüências Viabilidade
:AA p2 1-s
Aa 2pq 1-s
aa q2 1
Não é preciso examinar profundamente o modelo, para se ver que a seleção contra alelos
dominantes é muito mais efetiva que contra alelos recessivos. Qualquer alelo dominante prejudicial será
rapidamente eliminado da população. Isto explica por que na natureza, quase todos os genes
dominantes representam formas bem adaptadas e férteis, enquanto encontramos inúmeros genes
recessivos que geram em homozigose indivíduos com problemas de adaptação ou fertilidade. É
importante lembrar que no melhoramento essa situação pode não se manter. Genes recessivos podem
representar formas altamente desejáveis enquanto dominantes podem ser inferiores.
32
O efeito da seleção e a freqüência gênica
Este efeito pode ser observado pela alteração causada pela seleção em uma geração.
Na dominância este valor é q = pq2s/[1-q
2s].
Na ausência de dominância q = pqs/2[1-qs].
Se considerarmos s pequeno, o que é, em geral, verdade nos programas de melhoramento,
teremos aproximadamente:
Na dominância → q = pq2s Na ausência de dominância → q = pqs/2.
Note que estes valores tem seu máximo em q = 0,6666., com dominância, e em q = 0,5, para
ausência de dominância, diminuindo para os extremos até‚ chegar a zero quando q=0 ou q=1. Portanto,
de uma forma geral a seleção é mais eficiente para locos com freqüência gênicas intermediárias,
diminuindo sua eficiência para locos com freqüências gênicas mais extremas.
Efeito da seleção
0
0,02
0,04
0,06
0,08
0,1
0,12
0,14
0,16
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1q
∆q
dominância s=0,1
dominância s=0,5
dominância s=0,9
dominância s=1
sem dominância s=0,1
sem dominância s=0,5
sem dominância s=0,9
sem dominância s=1
3.8. MÉDIA DE UMA POPULAÇÃO
Para estudarmos a média em populações poderíamos imaginar o seguinte modelo genético:
Genótipo Freqüências Valor Genotípico
BB p2 z + 2u
Bb 2pg z + u + au
bb q2 z
Neste modelo p e q são as freqüência de B e b, z é um valor básico para o caráter em questão,
u é o efeito de um gene B e a é o grau de dominância. Este modelo, apesar de ser compreensível e
explicável biologicamente, causa um aumento da complexidade para a dedução das variâncias.
Um modelo simplificado, mais adequado seria obtido pela subtração do valor z+u de todos os
genótipos. Assim,
33
Genótipo Freqüências Valor Genotípico Freq. x V. Genot.
BB p2 u p
2u
Bb 2pg au 2pqau
bb q2 -u - q
2u
Média da População p2u + 2pqau - q
2u
Neste modelo os valores simbolizados são os mesmos, mas as médias obtidas são apenas
comparativas, já que os valores foram codificados. A variância será a mesma do modelo anterior. Este
modelo tem sido usado em muitos estudos clássicos de genética quantitativa e se tornou de uso
comum. Assim, para uma população panmítica, conforme representado acima, tem-se:
m = p2u + 2pqau - q
2u = u(p
2 - q
2) + 2pqau como: p
2 – q
2 = (p + q)(p – q) (2 alelos/loco)
m = u(p - q) + 2pq au
Nota-se que o valor da média é função do efeito do gene "u", do grau de dominância “a”, que
são fatores inerentes ao gene e não podem ser mudados pelo melhorista, e da freqüência dos genes.
Esta expressão, pela substituição de q por 1-p, pode ser escrita também como:
m =-u+2(u+au) p - 2au p2
O que mostra que no caso de ausência de dominância a média é uma função linear em p, ou
seja, o aumento de p causa um aumento linear da média. O mesmo não ocorre na dominância, onde a
média é uma função de segundo grau.
Ausência de dominância:. a=0 → Então m = -u + 2u p.
Max m'= 2u = 0 já que é uma reta o máximo é no infinito
Dominância completa: a=1 m = -u + 4u p -2u p2
Max m'= 2(u+au) - 4aup=0 → u+au = 2aup
se a = 1 no ponto de máximo p=1
Sobredominância (supor a=2): então substituindo em p = (1+a)/ 2a
p= 3/4, portanto o máximo da média não é com o máximo de freq de genes favoráveis.
3.9. VALOR REPRODUTIVO, VALOR GENÉTICO OU VALOR ADITIVO
Por valor ou efeito aditivo (genético ou ainda reprodutivo), entende-se o valor que e transmitido à
descendência. De outra forma pode-se entender como o valor dos genes do indivíduo. Pode ser
calculado a partir do efeito observado na própria descendência de cada indivíduo, quando cruzado ao
acaso com toda a população.
Neste caso cada descendente é formado por um gameta do indivíduo considerado e outro
tomado ao acaso da população. Se os gametas fossem todos tomados na população, não haveria
alteração na média, pois não haveria alteração na freqüência dos genes. Assim qualquer alteração na
média da descendência deverá ser atribuída à superioridade ou inferioridade genética do indivíduo
cruzado com a população. Note que só metade dos genes da descendência é proveniente do indivíduo
34
sob teste, assim a diferença observada com relação à média da população e considerada metade do
efeito aditivo do indivíduo.
Assim, considerando-se o modelo proposto acima, para o indivíduo BB, tem-se:
Gametas da População Indivíduo BB Gameta B Valor Média
p B p BB u pu
q b q Bb au qau
pu + q au
Média da descendência de BB Média da população
½ V.A.(BB) = pu + qau - u(p-q) - 2pqau = +qau + qu - 2pqau = q[u + au - 2pau]
= q[u + (1-2p)au] = 1/2 VA.
Chamando-se [u + (1-2p)au] de Alfa "". V.A.(BB)= 2q
1/2V.A.(bb) = -p[u + (1-2p)au] V.A.(bb) = -2p
1/2V.A.(Bb) = 1/2(q-p)[u + (1-2p)au] V.A.(Bb) = (q-p)
Note-se que o valor aditivo é proporcional ao número ou a freqüência de alelos favoráveis no
genótipo, o que pode ser verificado observando-se as diferenças entre os valores. O genótipo bb tem
zero alelos favoráveis e seu valor e -2p . O heterozigoto tem um alelo favorável e seu valor é (q-p) .
A diferença é α. O homozigoto BB tem dois alelos favoráveis e seu valor é 2q, sendo a diferença α.
Assim, para cada alelo favorável adicionado ao genótipo há um acréscimo de α. Este valor ficou
conhecido como efeito médio de substituição gênica (FALCONER, 1960).
Valor Fenotípico, Valor Genotípico e Valor Fenotípico Médio
Para um caráter quantitativo, tanto o genótipo como o ambiente, atuam na determinação do
caráter. Pode-se então admitir que o valor do fenótipo, de forma simplificada, seja dado por uma
expressão como P = G + E. Ou seja, o fenótipo é a soma do genótipo mais o ambiente. O valor
fenotípico é facilmente compreendido, já que é o valor observado nos indivíduos medidos. Já o valor
genotípico, que é o valor atribuído ao genótipo, não poderia ser medido de forma alguma, já que o
genótipo não se manifesta sem a influencia do ambiente. Assim, para entendermos qual é o valor do
genótipo, pode-se considerar que o mesmo seja o valor médio de todos os fenótipos manifestados por
um genótipo quando submetido a todos os ambientes possíveis. Assim, dentro de certa limitação, pode-
se entender o valor genotípico como sendo o valor fenotípico médio.
35
Comparações de Médias
A expressão da média, dada anteriormente, pode ser usada para fazer comparações entre
médias de diferentes materiais genéticos, levando a compreensão de diversos fenômenos.
Por exemplo, a heterose manifestada por híbridos ou compostos obtidos de populações
diferentes pode ser estudada por esse método.
Um composto de duas populações é obtido pela reprodução panmítica do cruzamento entre as
duas.
Assim, as freqüências gênicas seriam a média das freqüências nas populações cruzadas e a
média seria,
Média do Composto das duas populações
mc = u ( p0+pi - 1 + p0+pi ) + (p0+pi) (1 - p0+pi) au
2 2 2
Heterose H = mc - mp Hc= mc - (mo+mi)/2 Hc=1/2 au(p0-pi)
Para um híbrido, cujas freqüências gênicas são as mesmas, mas não está em equilíbrio:
Gametas na Pop i
piB qib
Gametas na p0 B p0pi BB p0qi Bb
Pop Original q0b piq0 Bb q0qi bb
F(Bb) = p0(1-pi)+pi(1-p0)
Média do híbrido entre populações mH = u[p0pi-q0qi]+(pi+p0-2pip0)au
A heterose do híbrido será: HH= mH - (mo+mi)/2 = au(p0-pi)2 HH = au(p0-pi)
2
Nota-se assim que a heterose do híbrido é superior a do composto, e que ambas são função do
efeito do loco (u), do grau de dominância (a), e do quadrado da diferença entre as freqüências gênicas
dos progenitores (populações) cruzados.
36
4. CARÁTER QUANTITATIVO
4.1. SISTEMAS DE GENES
Mendel demonstrou com seus estudos que as características hereditárias eram controladas por
fatores imiscíveis, que obedeciam a regras de combinação específica. Seus estudos, no entanto só
elucidaram uns poucos casos de herança simples, restando ainda muitíssimas dúvidas, que só com
outras pesquisas foram resolvidas. Por exemplo, ele não apontou nenhuma solução para a herança de
características que se apresentavam de forma contínua, sem apresentação de tipos definidos, como a
altura ou peso de plantas ou parte delas. Neste capítulo nos dedicaremos a entender estes caracteres,
chamados quantitativos e como os genes atuam para sua determinação.
Os Genes não atuam sozinhos, mas em conjunto. Mesmo caracteres que são controlados por
um único gene dependem, na sua formação de muitos outros. De forma didática iremos dividir os
diversos sistemas de genes em dois tipos, os sistemas de genes seriados e os sistemas de genes
múltiplos (poligenes).
Sistemas de genes seriados são aqueles em que os genes atuam em série, de modo que a
atuação de um ocorre em um passo posterior à do outro, formando uma série de eventos fisiológicos
interdependentes. Pode-se entender isso observando o esquema a seguir:
GENES A B C
ENZIMAS EA EB EC
S PA PB Produto final
Nesse esquema o substrato "S" transforma-se no produto "A", pela ação da enzima "A", que
por sua vez é codificada pelo gene "A", o produto "B", é produzido a partir do produto "A", pela ação
da enzima "B", produzida pelo gene "B", e assim por diante.
Esse tipo de sistema se expressa numa ação complementar entre genes. Um exemplo real
desse sistema é encontrado na determinação da cor de flor em Collinsia, uma espécie com algum
interesse ornamental. Neste caráter estão envolvidos diretamente dois locos, em ambos são conhecidos
dois alelos, com dominância completa:
Enzima W Enzima M
Substrato Pigmento Rosa Pigmento Azul
Sendo assim as combinações destes genes resultam nos seguintes fenótipos:
Genótipos Fenótipo W_ M_ As duas enzimas estão presentes Flores Azuis W_ mm Apenas enzima W está presente Flores Cor-de-rosa ww M_ Apenas enzima M está presente, mas seu substrato (pigmento
rosa), que é produzido a partir da enzima W, está ausente. Flores Brancas
ww mm Nenhuma das enzimas está presente Flores Brancas
37
Muitos outros casos de interação entre genes não alelos poderiam ser explicados desse modo.
O outro tipo de sistema, de genes múltiplos se caracteriza pela ação independente dos genes na
formação de um produto. Podemos imaginar que uma determinada enzima possa ser codificada por
vários locos no genótipo, cada qual sendo capaz de sintetizar uma determinada dose da mesma. Assim,
basta ter um alelo favorável em um loco para que haja a presença da enzima. No entanto, quanto maior
o número de alelos favoráveis nos locos, maior a quantidade de enzima presente, e consequentemente
mais intensa será a produção do produto final.
Esse sistema pode ser esquematizado como a seguir:
Locos (Enzimas) A B
S . Produto . . N
Em 1908 Nilsson-Ehle publicou uma pesquisa em que estudou a coloração da semente de Trigo.
Aquele autor cruzou duas variedades de trigo uma com sementes brancas e outra com sementes
vermelho muito escuro. O F1 apresentou sementes vermelho médio, e no F2 podia-se distinguir 5 cores
de sementes: vermelho muito escuro, que apareceu na proporção 1/16, vermelho escuro, que apareceu
na proporção 4/16, vermelho médio, que apareceu na proporção 6/16, vermelho claro, que apareceu na
proporção 4/16 e branco na proporção 1/16. A explicação para o fato foi dada admitindo-se fatores
imiscíveis, de acordo com a teoria de Mendel, bem como a primeira e segunda lei de Mendel, com dois
locos controlando o mesmo caráter, de modo que cada alelo favorável em qualquer dos locos era
responsável por uma dose de pigmento. Assim, temos os seguintes genótipos e fenótipos:
Genótipo Freqüência Doses Cor da semente
AABB 1/16 4 Vermelho muito escuro
AABb 2/16 3 Vermelho escuro
AaBB 2/16 3 Vermelho escuro
AAbb 1/16 2 Vermelho médio
AaBb 4/16 2 Vermelho médio
aaBB 1/16 2 Vermelho médio
Aabb 2/16 1 Vermelho claro
aaBb 2/16 1 Vermelho claro
aabb 1/16 0 Branca
Esses resultados exemplificam bem os sistemas de múltiplos fatores. Note a simetria das
freqüências no F2, bem diferente dos resultados obtidos por Mendel.
As possíveis explicações para os poligenes têm sido encontradas nos fenômenos da poliploidia,
38
na politenia e nas duplicações de seguimentos cromossômicos durante a evolução. É possível que
tenha sido vantajoso para os diversos organismos ter duplicatas dos genes, pois assim, caso ocorra
uma mutação desfavorável em um loco, esta não afetaria muito a adaptação geral do organismo. A
presença de muitos locos pode ter proporcionado também um meio para um ajuste mais fino com as
necessidades dos organismos nos diferentes ambientes.
4.2. PROPRIEDADES DO CARÁTER QUANTITATIVO.
4.2.1. Controle por muitos pares de genes
Ao contrário das observações de Mendel o caráter quantitativo é controlado por muitos genes,
por isso é chamado também de caráter poligênico.
Os genes formam sistemas de genes múltiplos, como mostrado pela primeira vez por Nilsson-
Elhe, com os genes somando seus efeitos para formação do caráter.
A conseqüência disto é que quando observamos um caráter quantitativo, não observamos a
ocorrência de apenas duas ou três classes de fenótipos, dependendo da ação gênica existente, e sim
um número maior de classes fenotípicas. Observe o exemplo de coloração de sementes de trigo acima
citado, são observadas quatro classes fenotípicas.
0
1
2
3
4
5
6
7
aabb
cc
aaBbc
c
AAbbc
c
aaBB
cc
aaBbC
c
AAB
bcc
AAbbC
c
aaBB
Cc
aaBbC
C
AAB
bCc
AAbbC
C
aaBB
CC
AAB
bCC
AAB
BCC
GENÓTIPOS
Valo
res G
en
otí
pic
os
4.2.2. Efeitos pequenos por gene sobre o fenótipo.
Por serem muitos genes formando um só caráter, cada gene contribui com uma pequena parte
da variação do caráter. Em alguns caracteres os efeitos dos diversos locos envolvidos podem ser
equivalentes, em outros, alguns locos podem possuir um efeito mais importante na determinação do
fenótipo.
4.2.3. Ação gênica.
Qualquer tipo de ação gênica pode ocorrer no controle dos caracteres poligênicos, mas a mais
comum é a ausência de dominância entre alelos. O tipo de ação gênica também tem uma importância
no número de classes fenotípicas observadas.
39
4.2.4. Ação do ambiente
Caracteres quantitativos sofrem em geral forte influência do meio ambiente, fazendo
modificações nos valores fenotípicos dos indivíduos, de modo que não se pode saber pelo fenótipo o
valor do genótipo do indivíduo.
A variação que se observa ‚ então em parte de origem genética e em parte de origem ambiental,
o que dificulta em muito a seleção nestes caracteres, e exige métodos estatísticos refinados para sua
eliminação.
As alterações ambientais não atingem os genes. Portanto não são passadas para a
descendência.
4.2.5. Distribuição de freqüências
Os Caracteres Quantitativos têm distribuição contínua, sendo essa uma das características mais
marcantes na distinção dos caracteres qualitativos.
A distribuição contínua se deve a que os muitos locos envolvidos no controle desses caracteres
ao segregarem formam inúmeras classes, muito próximas uma das outras, já que os genes têm
pequenos efeitos. Com a ação do meio ambiente essas classes desaparecem dando origem a uma
distribuição contínua.
Note-se que a continuidade ‚ apenas fenotípica, as classes genotípicas são distintas entre si.
Há caracteres poligênicos com distribuição descontínua, apesar de dependerem de muitos genes
e do ambiente. Como por exemplo, número de espigas, número de ovos, etc. Neste caso o controle é
quantitativo, mas dado ao tipo de característica ela se apresenta de forma descontínua.
Devido às propriedades dos caracteres quantitativos sua análise segue uma metodologia
diferente dos caracteres Qualitativos. Estes são analisados pela distribuição de freqüências,
descontínua, utilizando principalmente o teste X2. Os caracteres quantitativos são analisados utilizando
suas médias e Variâncias e os métodos estatísticos adequados para seu estudo.
0
5
10
15
20
25
0 1 2 3 4 5 6 7
Valores Fenotípicos
Fre
qü
ên
cia
s
0
5
10
15
20
25
1 2 3 4 5 6 7 Valores Genotípicos
Genotípicos
Fre
qü
ên
cia
s
40
5. COMPONENTES DA VARIÂNCIA FENOTÍPICA
5.1. COMPONENTES DA VARIÂNCIA DO CARÁTER QUANTITATIVO
Considerando-se que um caráter quantitativo sofre influência do genótipo e do ambiente, para o
estudo dos componentes da variância fenotípica pode-se considera o modelo básico:
yij = u + Gi + eij onde: yij = valor fenotípico do genótipo i no ambiente j;
u = média geral;
Gi = efeito do genótipo i (desvio);
eij = desvio aleatório devido ao ambiente. Assim, a variância fenotípica seria,
(Yij)2 __
[ (Yij)]
2
(u+Gi+eij)2
__ [ (u+Gi+eij)]2
S2y =
N =
N
N __
1 N __
1
então
[u2+Gi
2+eij
2 + 2(uGi+ueij+Gieij)] __ (u)
2+(Gi)
2+(eij)
2 + 2[uGi + ueij+ Gieij]
S2y
= N
N __
1
Organizando as operações, teremos:
u
2- (u)
2 Gi
2- (Gi)
2 eij
2- (eij)
2 uGi- uG
i
ueij
-
uei
j
Gieij
-
Gieij
= N
+ N
+ N
+2 N
+2 N
+2 N
N - 1 N - 1 N - 1 N - 1 N - 1 N - 1
Então: Mas:
S2y = S
2u + S
2G + S
2e + 2{ Cov(u;G) + Cov(u; e) + Cov(G;e)} S
2u = 0
Cov(u;G) = 0
Cov(u; e) =0
Isso poderia ser deduzido diretamente se nos lembrássemos que a variância de uma soma é
igual a soma das variâncias mais duas vezes as covariâncias entre os elementos da soma.
Assim: S2y = S
2G + S
2e + 2Cov(G,e)
Admitindo que genótipos e ambientes são independentes,
então Cov(Gi,eij)=0
Assim, pode-se de forma geral afirmar que
S2y = S
2G + S
2e
Os genótipos serão independentes sempre que forem distribuídos ao acaso pelos diversos
ambientes, o que em geral ocorre. Em situações experimentais, essa distribuição aleatória dos
genótipos pelo ambiente deve ser garantida para que haja independência desses efeitos.
41
5.2. COMPONENTES DA VARIÂNCIA EM POPULAÇÕES PANMÍTICAS OU ALÓGAMAS
Ao nível de um loco, considerando uma população panmítica, com um modelo, em que:
p é a freqüência do gene B, Genótipo fi Gi Gi 2
q é a freqüência do gene b, BB p2 u u
2
u é o efeito do loco e Bb 2pq au a2u
2
a é o grau de dominância bb q2 -u u
2
1
Como S2=fixi
2-(fixi)
2
S2G= p
2u
2 + 2pqa
2u
2 + q
2u
2 - [u(p
2-q
2) + 2pq au]
2
S2G= 2pq [u + (1-2p)au]
2 + (2pqau)
2 como = u + (1-2p)au
S2G= 2pq
2 + (2pq au)
2
Usando a noção de valor aditivo vista no capitulo anterior pode-se dividir o valor genotípico em
aditivo e não aditivo, ou dominante. Assim, dividindo o valor genotípico, pode-se também dividir a
variância genotípica. Isso é de fundamental importância, já que o valor aditivo é proporcional ao número
de alelos favoráveis, que efetivamente poderão ser transmitidos aos descendentes. Então a avaliação
de uma população para a seleção deverá ser feita pela variação dos valores aditivos e não dos valores
genotípicos.
A expressão da variação aditiva pode ser obtida como na tabela abaixo.
Genótipo fi Gi Valor Aditivo Desvio (ou Valor de Dominância)
BB p2 u 2q u-m-2q = -2q
2au
Bb 2pq au (q-p) au-m-(q-p) = 2pqau
bb q2 -u -2p -u-m+2p = -2p
2au
Soma 1 m 0 0 0
fi = 1 e xi=0 então (fixi)2=0 logo S
2=fixi
2
onde = u + (q-p)au m=(p-q)u+2pqau
S2A= fixi
2-(fixi)2 já que fixi=zero → efeito aditivo é um desvio da média dos genótipos
S2A= fixi
2
S2A= p
24q
2
2 + 2pq(q-p)
2
2 + q
24p
2
2
S2A= 2pq
2 [ 2pq + q
2 + p
2 -2pq +2pq] → já que p
2 + 2pq + q
2 = 1
S2A = 2pq
2
S2D =p
2 4q
4a
2u
2 +2pq 4p
2q
2 a
2u
2 +q
2 4p
4 a
2u
2
S2D= [2pq au]
2 [ q
2 + 2pq + p
2 ]
S2D = [2pq au]
2
Então, S2G = S
2A + S
2D
42
Neste modelo o efeito aditivo é independente do de dominância, o que é claro, já que o valor do
genótipo é dado pela soma dos efeitos aditivos e de dominância, e a variância genotípica é também a
soma das variâncias aditivas e de dominância, sendo, portanto, a covariância entre os efeitos aditivos e
de dominância igual a zero. Isto só será observado nos caso de populações panmíticas, e é devido a
combinação aleatória dos genes, o que faz com que qualquer efeito aditivo possa ocorrer com qualquer
efeito de dominância, havendo portanto, independência.
Uma outra maneira de entender essa divisão da variância genotípica é imaginar um modelo em
que, para o genótipo BiBj tenhamos o valor genotípico:
Gij = m + i + j + dij, em que:
Gij é o valor genotípico do indivíduo com genes "ï" e "j", composto por:
m - média geral, constante para todos os genótipos;
i - efeito do alelo Bi,
j - efeito do alelo Bj e
dij - efeito da interação entre Bi e Bj (ou efeito da dominância). Fazendo a análise como modelo fatorial teríamos:
Combinações
p B q b
p B p2 BB pq Bb
q b pq Bb q2 bb
Valores
Fator I
p B q b Médias Efeitos
Fator J p B p
2 u pq au pu + qau q
q b pq au q2 (-u) pau - qu -p
Média pu + qau pau - qu u(p-q)+2pqau
Efeitos q -p
Em que = u + (1-2p)au
Neste caso a variância total será:
S2t = p
2 u
2 + 2pq a
2u
2 +q
2 u
2 - [u(p-q)+2pqau]
2 = S
2G = S
2A + S
2D.
A variância devida ao fator I será: S2I= p (q)
2 + q (-p )
2 = pq
2 = (1/2) S
2A
A variância devida ao fator J será: S2J= p (q)
2 + q (-p )
2 = pq
2 = (1/2) S
2A
Então a variância devida à interação é S2D. Assim:
- Variância aditiva - variância dos efeitos dos alelos de um loco;
- Variância de dominância - variância devida à interação entre alelos no mesmo loco.
Se extrapolarmos para um caráter quantitativo, com vários locos, teremos efeitos aditivos e de
dominância em cada loco, além de efeitos epistáticos que podem ocorrer entre os diferentes locos.
43
Assim, considerando o genótipo BiBj ClCk ...o modelo adequado seria:
Gijlk= m + i + j + dij+ l + k + dlk.+ il + ik +jl + jk +dilk.+ dilk.+ dijl + dijk + ddijlk +....
Ou seja, além dos efeitos próprios de cada loco, devem ser incluídos efeitos de interações de
alelos nos diferentes locos. Assim, considerando todos esses efeitos independentes;
S2G = S
2Ab+ S
2Ac+ ...+..S
2An+ S
2Db + S
2Dc +....+ S
2Dn + S
2I
considerando todas as covariâncias iguais a zero e S2A= S
2Ai = S
2A1+S
2A2+...,
S2D= S
2Di = S
2D1+S
2D2 +..., então pode-se estabelecer:
S2G = S
2A + S
2D + S
2I, ao nível do caráter quantitativo.
Sendo S2I a soma de todas as variâncias devidas às interações entre alelos de locos diferentes,
ou epistasias.
As covariâncias citadas serão iguais a zero, quando não existirem ligações fatoriais entre os
genes que controlam o caráter quantitativo.
Epistasias são interações entre os genes, ou seja, o efeito conjunto de dois ou mais genes
quando juntos não pode ser expresso pela simples soma dos seus efeito isolados. Esse fenômeno é
considerado raro nos caracteres quantitativos, mas, já que são muitos genes para um mesmo caráter, é
possível que ocorra.
Ligação fatorial ocorre quando genes estão localizados em um mesmo cromossomo, a uma
distância tal que não se observa 100% de quiasmas entre eles. Quando isso ocorre, as combinações
genéticas nos gametas produzidos por indivíduos heterozigotos não serão independentes, havendo
maior probabilidade de se formarem gametas com combinações paternas, do que recombinantes.
Assim as covariâncias entre os efeitos dos genes não terão valores iguais a zero. Neste caso pode-se
ter duas situações. A fase de associação, onde os genes dominantes estão juntos no gameta de um dos
pais e os genes recessivos então no gameta do outro progenitor. A fase de repulsão, onde o gene
dominante de um loco esta junto com o recessivo do outro em um progenitor e ao contrario no outro. A
fase de repulsão ou associação depende apenas do genótipo dos progenitores dos indivíduos
heterozigotos. As covariâncias observadas, nos dois casos, têm valores idênticos, com sinais contrários.
Assim, se a probabilidade de repulsão ou associação for a mesma, isto é, se ocorrer equilíbrio de
ligação, a covariância final será zero, mesmo havendo ligação. Este fato se observa em populações
panmíticas.
Assim, a expressão S2G = S
2A + S
2D será aproximadamente verdadeira na maioria dos casos, e
pode ser considerada como geral, para fins práticos.
Em melhoramento de populações alógamas, a decomposição da variância fenotípica em
componentes é feita com base na correlação intra-classe em famílias da população.
Em geral três tipos de famílias são importantes em populações alógamas: famílias maternas,
famílias de irmãos perfeitos e famílias de auto-fecundação.
44
Famílias maternas são as obtidas pela simples colheita das sementes de uma planta. Por
exemplo, uma espiga de milho é uma família cujos indivíduos são filhos de uma planta mãe com
diferentes pais, já que a polinização é ao acaso.
Famílias maternas em geral podem ser consideradas como famílias de meio-irmãos,
particularmente se a população for grande.
Famílias de irmãos perfeitos são obtidas pela polinização cruzada entre duas plantas específicas.
Famílias de auto-fecundação são obtidas pela auto-fecundação de plantas da população. Em
geral são designadas pela letra S seguida de um número, que indica o número de auto-fecundações
feitas. Por exemplo, S1, família obtida de uma auto-fecundação, S2, família obtida de duas auto-
fecundações, ou seja, pela auto-fecundação de uma S1.
A variação pode ser dividida em: "entre famílias", que representa as diferenças entre as
mesmas, e "dentro de famílias", que representa as diferenças entre plantas dentro das famílias.
Os valores das variâncias entre e dentro das famílias é função dos coeficientes de parentesco
entre os indivíduos das famílias e das variâncias genéticas e ambientais, e pode ser resumidos como no
quadro abaixo.
Para a determinação dos valores dos componentes pode-se fazer um experimento, onde os
tratamentos são famílias. O delineamento pode ser qualquer um, mais os mais empregados são o
"látice" e o "blocos ao acaso", ambos com Esperanças de Quadrados Médios semelhantes. Qualquer
que seja o delineamento deve-se fazer uma estimativa da variância "dentro" de parcelas para estimar a
variação dentro das famílias e as famílias devem ser tomadas ao acaso dentro da população, embora
nem sempre isso aconteça, já que geralmente há interesse em usar famílias obtidas de plantas
selecionadas.
Vamos supor um bloco ao acaso com informação dentro das parcelas, onde os tratamentos são
J famílias tomadas ao acaso de uma população. O modelo matemático pode ser representado por:
Yijk = m + bi + pj + eij + dijk ,
Onde: m é a média geral,
bi é o efeito de blocos, com i variando de 1 a I,
pj é o efeito de progênie, com j variando de 1 até J,
eij é o efeito do erro entre parcelas e
dijk é a variação residual dentro das parcelas, com k variando de 1 até K.
As somas de quadrados são calculadas pelas seguintes expressões:
Variância S2
A S2D S
2E
Entre meio irmãos 1/4 0 0
Dentro de meio irmãos 3/4 1 1
Entre irmãos perfeitos 1/2 1/4 0
Dentro de irmãos perfeitos 1/2 3/4 1
Entre S1 1 1/4 0
Dentro de S1 1/2 1/2 1
45
Quadro da Análise da Variância
F V GL S Q Q M E(QM)
Repet. I - 1 (1/JK)Yi..2 - C
Progênies J - 1 (1/IK) Y.j.2 - C M1 S
2d + K S
2e + IK S
2p
Erro (I-1)(J-1) SQPAR - SQR - SQP M2 S2d + K S
2e
Parcelas IJ - 1 (1/K) Yij.2 - C
Dentro (K-1)IJ SQT - SQPAR M3 S2d
Total IJK - 1 Yijk2 - C
C= Y...2/IJK
Nesse experimento
M3 estima S2d - variância média dentro das famílias empregadas, conforme o quadro anterior.
M2 estima a soma S2d+KS
2e, então
(M2 - M3)/K estima S2e - variância do erro experimental.
M1 estima a soma S2d + K S
2e + IK S
2p, então
(M1-M2)/IK estima S2p, que é a variância entre progênie.
A variância total (fenotípica) é S2F= S
2d + S
2e + S
2p
5.2. COMPONENTES DA VARIÂNCIA FENOTÍPICA EM UMA POPULAÇÃO AUTÓGAMA
Plantas autógamas são aquelas que tendem naturalmente a auto-fecundação. Embora a taxa de
auto-fecundação natural seja variável, para se estudar mais facilmente o assunto será considerado que
esta seja constante e igual a 100%. Nesta situação hipotética todas as plantas se auto-fecundam,
produzindo a cada geração 50% mais menos heterozigotos. Assim, supondo-se a situação extrema de
uma população onde inicialmente só há heterozigotos, para um loco (loco A, por exemplo), a taxa de
heterozigose cairá de 100% na primeira geração, para 50% na segunda, 25% na terceira, e assim
sucessivamente até tornar-se insignificante. Após muitas gerações de auto-fecundação a população
será constituída de indivíduos homozigotos, na proporção 50% AA e 50% aa. Após atingir esse estado
ela não mais se alterará, estando, portanto em equilíbrio.
Distribuição Genotípica nas gerações de auto-fecundação
Nº de gerações
0 Aa (100%)
1 AA(25%) Aa(50%) aa(25%)
2 AA(37,5%) Aa(25%) aa(37,5%)
3 AA(43,75) Aa(12,5%) aa(43,75)
↓ ↓ ↓ ↓
∞ AA(50%) (0) Aa aa(50%)
Se forem considerados vários locos, em um caráter poli gênico, por exemplo, este decréscimo
ocorrerá individualmente para todos eles, sendo os genótipos formados após o equilíbrio, as
combinações dos homozigotos para os locos que estavam inicialmente em heterozigose. Por exemplo,
se forem dois locos inicialmente com indivíduos AaBb, no equilíbrio ter-se-á 25% AABB, 25% AAbb,
25% aaBB e 25% de aabb. Assim, pode-se ver que o número de genótipos homozigotos formados em
uma população autógama será 2N, sendo N o número de locos inicialmente em heterozigose.
46
A queda da taxa de heterozigose, que para um loco é 50% por geração, será menor quando
forem considerados vários locos, já que indivíduos com alguns locos em homozigose e outros em
heterozigose são considerados heterozigotos. Partindo-se inicialmente de um heterozigoto, a proporção
de locos em homozigose por geração de auto-fecundação, pode ser obtida pela expressão:
P = [(2M - 1) / 2
M]N Onde: N → de pares de genes segregantes e
M → nº.de gerações de auto-fecundação.
Pode-se notar que a queda na heterozigose será mais lenta quando forem considerados muitos
locos. Por exemplo, se forem considerados 5 locos segregantes, em 6 gerações a heterozigose será
92,4%, já com 20 locos segregantes será apenas 73%.
Mesmo assim, após certo número de gerações, pode-se considerar que a proporção de
heterozigotos nas populações autógamas é insignificante. Convém lembrar que a taxa de auto-
fecundação na prática nunca é 100%, portanto sempre haverá um resíduo de heterozigose. Para efeito
didático esse resíduo será considerado nulo.
Se considerar-se uma população natural, dificilmente ela terá se originado de heterozigoto, como
foi mostrado antes. Portanto fica mais real considerar-se uma população onde as freqüências gênicas
sejam p, para o alelo A e q para o alelo a. Na tabela abaixo se pode ver que o processo será
basicamente o mesmo, com a diferença que as freqüências das linhagens produzidas não serão meio,
mas p para o homozigoto AA e q para o homozigoto aa.
Distribuição Genotípica em uma população autógama natural
Número de
Gerações
pA e qa
0 p2 AA 2pq Aa q
2 aa
1 (p2+pq/2)AA pq Aa (p
2+pq/2)aa
↓ ↓ ↓ ↓
n p AA 0 Aa q aa
Como conseqüência dessas auto-fecundações as populações autógamas apresentam as
seguintes características:
1) Praticamente não há heterozigotos.
2) A população é composta por misturas de linhas puras (linhagens homozigotas), que provêm
da auto-fecundação de indivíduos homozigotos.
3) A variação entre linhagens é de origem genética, podendo haver também variação ambiental,
Já a variação dentro de uma linhagem é apenas ambiental.
4) Genes que conferem menor adaptação ao meio são facilmente eliminados pelos processos
evolutivos, principalmente seleção natural e oscilação genética, já que se manifestam sempre em
homozigose.
5) Não há reserva de genes recessivos, o que diminui a variabilidade.
47
6) A população permanece estável se não houver seleção, migração genética, oscilação
genética, mutações ou cruzamentos.
7) Após um cruzamento, a população chegará ao estado estável em muitas gerações.
Como se pôde ver no parágrafo anterior, em uma população autógama em equilíbrio, tem-se
variação entre linhagem, que é genética e ambiental, e variação dentre das linhagens, que é apenas
variação ambiental. A variação genética, nesse caso, será composta apenas de variância Aditiva e parte
da variância epistática, chamada Aditiva (que é devida à interação entre efeitos aditivos de diferentes
locos). A variância de dominância não está presente nesse caso, pois não existem heterozigotos na
população. Assim, mesmo que os genes tenham ação de dominância, ela não se manifestará.
Partindo-se de um cruzamento, a situação torna-se diferente, já que haverá heterozigotos nas
gerações seguintes, porém com proporções decrescentes a cada geração. Sendo assim, os
componentes da variância serão diferentes a cada geração de auto-fecundação, havendo um aumento
da variância aditiva e um decréscimo da variância de dominância, até que esta seja de novo
insignificante. Na tabela seguinte, pode-se ver a variação dessas variâncias ao longo das gerações.
Na tabela foi assumindo como base a geração F2. Assim, o número 1 representa a variância
integral, como aparece no F2, as demais frações referem-se à proporção em relação a essa geração.
Pode-se ver que ao longo das gerações de auto-fecundação, a variância aditiva tende a 2, ou
seja o dobro da esperada para o F2, e a de dominância tende a zero.
Componentes das variâncias fenotípicas das populações autógamas
Geração N aut VA VD VE
P1 0 0 1
P2 0 0 1
F1 0 0 1
F2 1 1 1 1
Entre linhas F3 1 1/4 0
Dentro de linhas F3 1/2 1/2 1
Total de F3 2 3/2 3/4 1
- -
FN+1 N [2-(1/2) N-1
] [2N-1]/4
N-1 1
N - número de auto-fecundações da geração
48
6. CORRESPONDÊNCIA ENTRE FENÓTIPO E GENÓTIPO
Imaginando-se o processo de seleção mais simples, onde o melhorista escolhe os melhores
indivíduos, verifica-se que o valor disponível para o melhorista é o valor fenotípico. Assim, um indivíduo
poderá ser selecionado ou não de acordo com o valor fenotípico por ele expresso. Para que essa
seleção seja efetiva os indivíduos selecionados devem transmitir aos seus descendentes os melhores
genes. Isso, no entanto só ocorrerá se aos melhores fenótipos selecionados pelo melhorista
corresponderem os melhores genótipos bem como os melhores genes. Por isso pode-se dizer que a
seleção só será eficiente se houver correspondência entre o fenótipo e o genótipo, em especial com os
genes nele contido.
As maneiras de se estudar a correspondência entre variáveis, são o coeficiente de regressão
linear, o coeficiente de correlação e o coeficiente de determinação.
Coeficiente de regressão linear indica a inclinação de uma reta que melhor explica o
relacionamento entre duas variáveis.
Assim se X e Y são as variáveis e Y é colocado no eixo vertical de um gráfico e X no eixo
horizontal, colocando-se os pontos que representam os valores pareados (X,Y) no gráfico, nota-se uma
certa distribuição. Se as variáveis são não correlacionadas essa distribuição será aleatória e tenderá a
formar um círculo, não mostrando portanto nenhuma tendência. Se as variáveis são correlacionadas, a
forma da distribuição será de uma elipse, indicando uma tendência dos dados. A reta de regressão é a
reta média que passa o mais próximo possível de todos os pontos de modo que se tem o menor
somatório dos quadrados das distâncias dos pontos à reta.
A equação de uma reta pode ser escrita como:
Y = a + bX Y → variável dependente,
X → variável independente,
a → o coeficiente linear, (valor de Y quando X=0)
b → coeficiente angular da reta, ou coeficiente de inclinação da reta.
Este coeficiente é dado pela tangente do ângulo formado pela reta com o eixo de X, de modo
que, dado dois pontos, pode ser dado também pela divisão do cateto oposto do triângulo formado pela
reta e as perpendiculares ao eixo de X que passam pelos pontos, pelo cateto adjacente. Esse fato é
muito útil, pois assim pode-se escrever:
Y = b X. ou seja uma diferença em Y é igual a diferença correspondente em X vezes b.
Pode-se obter o valor do coeficiente de regressão pela formula:
bXY =
cov(X,Y)
S2X
Por convenção escreve-se sempre a letra b seguida das variáveis usadas como índice, sendo
sempre a primeira a variável independente. Assim lê-se coeficiente de regressão de Y sobre X.
49
Para aplicar esse coeficiente à relação fenótipo x genótipo deve-se considerar o genótipo como
variável dependente, já que este é desconhecido. A covariância entre fenótipo e genótipo pode ser
obtida com o auxilio do modelo usado anteriormente:
Yij = u + Gi + eij
Assim, Cov(F,G) = Cov [(u + Gi + eij), Gi]
Como a covariância é uma soma de produtos dividida pelo grau de liberdade, pode-se usar a
propriedade distributiva dos produtos e fazer:
Cov(F,G) = Cov(u,Gi) + Cov (Gi,Gi) + Cov (eij,Gi)
A primeira covariância é nula, pois envolve uma constante. A segunda é a covariância da variável
Gi com ela própria, sendo portanto sua variância (S2G). A terceira deve tender a zero, já que como foi
discutido antes, genótipo e ambiente são variáveis independentes.
Assim, Cov(F,G) = S2G Portanto
Vê-se portanto que a relação entre os desvios dos valores fenotípicos e os desvios dos valores
genotípicos para um caráter quantitativo, em uma população é igual a relação entre a variância
genotípica e a variância fenotípica. Pode-se dizer que para uma unidade de valor fenotípico aumentada
no fenótipo, haverá um acréscimo médio correspondente de bFG nos valores dos genótipos dos
indivíduos. Assim, quanto maior for bFG, maior a correspondência entre o fenótipo e o genótipo, e mais
fácil será selecionar, já que selecionando os bons fenótipos esta se selecionando os bons genótipos.
Coeficiente de correlação é um valor sempre associado ao coeficiente de regressão.
Enquanto, o coeficiente de regressão mostra a forma como duas variáveis se relacionam, o coeficiente
de correlação indica o grau de associação entre elas.
O coeficiente de regressão (b) indica a tendência média da distribuição conjunta das duas
variáveis, os pontos formados poderão estar mais ou menos dispersos em relação a reta de regressão.
O coeficiente de correlação (R) indica justamente o grau de dispersão dos pontos em torno da
reta. O coeficiente de correlação varia de -1 a +1.
R=0 → pontos distribuídos ao acaso em torno da reta, e não há associação entre as variáveis.
R=1 → os pontos estarão exatamente sobre a reta, sem desvios → A associação é máxima.
R=-1 → os pontos estarão exatamente sobre a reta, mas nesse caso a inclinação da reta é negativa, o que indica associação inversa entre as variáveis.
A expressão do coeficiente de correlação é:
R =
Cov(X,Y)
SX SY Aplicando-se para o caso da correspondência entre o fenótipo e o genótipo tem-se:
R =
Cov(F,G) =
S2G
= SG R
= √ bFG
SF SG SF SG SF
bFG =
Cov(F,G)
= S
2G
S2F S
2F
50
Reforçando a importância da razão entre as variâncias genotípica e fenotípica como parâmetro
para avaliar populações que serão submetidas a seleção.
O coeficiente de determinação (R2) - indica o grau de influência que a variação de uma variável
tem sobre a variação de outra.
Sendo assim, R2 = bFG, que é a razão entre as variâncias genotípicas e fenótipicas.
A razão entre estas variâncias é conhecida como herdabilidade no sentido amplo, e é
representada geralmente como R2.
A herdabilidade no sentido amplo poderia ser usada como indicadora da eficiência da seleção,
onde não houvesse efeitos de dominância, porém na presença destes é de pouco valor, já que os
mesmos mascaram os valores dos genes, fazendo com que indivíduos com genes diferentes
expressem valores genotípicos semelhantes. Em vista disso, o valor mais indicado para orientar a
seleção é o valor aditivo.
O valor aditivo é proporcional ao número de alelos favoráveis em um genótipo, e expressa a
superioridade que pode ser transmitida à descendência. Por isso é importante estudar a
correspondência entre o fenótipo e o valor aditivo.
Este estudo pode ser feito da mesma forma que o relativo aos valores genotípicos, bastando
para isso considerar-se o modelo simplificado:
Yij = u + Ai + Di + eij
Neste modelo o efeito do genótipo Gi foi dividido em efeito aditivo Ai e efeito de dominância Di.
Esses efeitos são independentes entre si, como vimos no capítulo 5, além de serem independentes do
ambiente, já que o genótipo o é.
Assim,
Cov(F,A) = Cov[(u+Ai+Di+eij), Ai]
Cov(F,A)= S2A
Sendo assim temos:
bFA =
S2A
= R
2FA
= h
2 RFA
= SA
= h
S2F SF
A relação entre a variância aditiva e a variância fenotípica é chamada de herdabilidade no
sentido restrito, ou simplesmente de herdabilidade, e é um indicador da eficiência da seleção, e pode
ser interpretado como sendo o acréscimo em valor aditivo correspondente a um acréscimo de uma
unidade de fenótipo. Os valores aditivos são proporcionais ao número de genes favoráveis. Assim, se
h2 for alto, os bons fenótipos corresponderão aos bons valores aditivos e também aos genótipos que
transmitirão à descendência maior número de alelos favoráveis.
Este valor será útil ainda na previsão dos efeitos da seleção, pelo cálculo do ganho genético.
51
7. SEMELHANÇA ENTRE PARENTES
Desde muito tempo o ser humano observa que indivíduos aparentados são semelhantes, como
pais e filhos, por exemplo, e que essa semelhança pode ser maior ou menor de acordo com o grau de
parentesco. Neste capítulo vamos aprender como quantificar o grau de parentesco e a semelhança
entre parentes, e ver como isso pode ser usado no melhoramento genético.
Em primeiro lugar é preciso saber-se que indivíduos aparentados são semelhantes porque têm
genes em comum.
Podemos dizer que dois genes podem ser idênticos por terem a mesma função no organismo,
mesmo que tenham origens diferentes. Dois genes podem ser idênticos também por sua origem, isto é,
um é cópia do outro ou ambos são cópias de um gene anterior em um ancestral comum.
Assim, pode-se usar essa noção de genes idênticos por descendência (IPD) para quantificar o
grau de parentesco, já que genes IPD só ocorreram em parentes. As medidas de parentesco então
serão na verdade probabilidades de indivíduos terem genes IPD.
As medidas apresentadas aqui se referem a dois genes, que podem estar em um ou dois
indivíduos. Medidas de parentescos mais gerais, para quatro genes podem ser encontradas em
COCKERAM E WEIR (1993) e são especialmente úteis para populações endogâmigas.
7.1. Coeficiente de Coancestralidade
Define-se como a probabilidade de tomarem-se genes ao acaso, em um loco, em dois indivíduos
e esses genes serem idênticos por descendência.
Sendo assim, se considerarmos o indivíduo x com os alelos X1 e X2 e o indivíduo y com os alelos
Y1 e Y2, o coeficiente de coancestralidade será:
fxy = {P[X1=Y1] +P[X1=Y2] +P[X2=Y1] +P[X2=Y2]}/4
Note-se que fxy = fyx.
Se considerarmos pai e filho, sabemos que dos dois alelos presentes no pai um passou para o
filho e que o outro alelo do filho é de procedência materna. Assim, se a mãe não tem parentesco com o
pai, a probabilidade de se tomar genes ao acaso, um no pai e outro no filho, e eles serem IPD, é de 1/4.
Esse valor pode ser facilmente calculado usando-se o quadro a seguir.
Filho
A1
(1/4) A2
(1/4) Gene Materno
(1/2)
Pai A1 (1/2) (1/8) --- ---
A2 (1/2) --- (1/8) ---
fPF= (1/8) + (1/8) = (1/4)
Nesse quadro A1 e A2 são os alelos paternos e M o alelo de origem materna.
Esta maneira de calcular é geral e pode ser usada em qualquer caso. Por ela pode-se por
exemplo descobrir que o coeficiente de coancestralidade do indivíduo com ele mesmo é 1/2. Há no
52
entanto um meio mais fácil de chegar ao valor do coeficiente que funciona sempre que se pode traçar
um "pedigree" dos indivíduos considerados.
Observando que em qualquer caso a probabilidade de um gene passar de pai para filho (ou mãe
para filho) é sempre 1/2, para genes autossômicos, estabeleceu-se a expressão:
fxy = (1/2)N+1
Onde é símbolo do somatório, que deve ser feito considerando cada ancestral comum, e N é o
número de passagens de genes de progenitor para descendente.
Lembramos que para efeito desse cálculo o indivíduo é considerado ancestral dele mesmo.
Por exemplo no caso anterior, pai e filho, há uma passagem. Assim, fPF=(1/2)2 = 1/4. Obtém-se
assim o mesmo resultado com menor esforço.
Considerando irmãos perfeito, temos dois ancestrais comuns (pai e mãe), cada qual
apresentando duas passagens de genes. Assim, fIP = (1/2)3 + (1/2)
3 = 1/4
7.2. Coeficiente de Endogamia
É definido como a probabilidade, em um loco, de os dois genes de um indivíduo serem idênticos
por descendência. Em qualquer indivíduo os genes em um loco autossômico são um de origem paterna
e outro de origem materna. Além disso, dada a natureza do processo reprodutivo, esses alelos podem
ser considerados como tomados ao acaso um no pai e o outro na mãe (os gametas se combinam ao
acaso). Assim, a probabilidade dos dois alelos serem idênticos por descendência será igual a
coancestralidade dos pais.
Podemos estabelecer então que
FZ = fXY , se X e Y são os pais de Z
Como fica claro só haverá endogamia se os pais forem aparentados.
7.3. Coeficiente de Parentesco
É a probabilidade média dos genes em um indivíduo serem idênticos por descendência aos
genes de outro indivíduo.
Considerando o indivíduo x, com genes X1 e X2, e o indivíduo y, com genes Y1 e Y2, a
probabilidade média dos genes de x estarem também em y.
xy = Rxy = {P[X1=Y1 ou X1=Y2] + P[X2=Y1 ou X2=Y2]}/2
Rxy = [P(X1=Y1)+ P(X1=Y2)+ P(X2=Y1)+ P(X2=Y2)]/2
Ou seja, Rxy = 2 fxy
Sendo assim podemos usar a fórmula prática para esse cálculo:
Rxy = (1/2)N
53
7.4. Coeficiente de Dominância
É a probabilidade dos dois genes em um indivíduo serem idênticos por descendência aos dois
genes no mesmo loco no outro indivíduo ao mesmo tempo.
Considerando o indivíduo x, com genes X1 e X2, e o indivíduo y, com genes Y1 e Y2, esta
probabilidade é:
Dxy = P(X1=Y1) . P(X2=Y2) + P(X1=Y2) . P(X2=Y1)
Considerando o gene marcado com o número 1 como de origem paterna e o gene marcado com
o número 2 de origem materna, e dada a natureza aleatória da combinação dos gametas, podemos
dizer que X1 é um gene tomado ao acaso no pai de x e Y1 um gene tomado ao acaso no pai de y.
Assim,
Dxy = fpxpy . fmxmy + fpxmy . fmxpy
Outra forma de se obter esse resultado ‚ pela fórmula:
Dxy = 4 (1/2)N
onde N é o número de passagens de genes em um pedigree que forma um circuito fechado.
Essa fórmula porém deve ser usa com cuidado.
7.5. Efeito da Endogamia sobre o parentesco
Todos os cálculos de probabilidade feitos até aqui, partiram da premissa de os ancestrais
originais tinham dois genes diferentes, ou seja que não era endogâmico. Indivíduos endogâmicos têm
uma probabilidade de terem genes idênticos em seus locos. Isso obviamente alterará o parentesco.
Consideremos o exemplo usado para o cálculo da coancestralidade, pai e filho, supondo agora
que o pai tem uma endogamia expressa pelo coeficiente Fp.
Então ele terá constituição A1A1 com probabilidade Fp e A1A2 com probabilidade 1-Fp.
Se ele for A1A1 o filho será A1 . E nesse caso o coeficiente de coancestralidade será 1/2.
Se for A1A2 o coeficiente será 1/4, como foi visto.
Então o valor médio será:
fPF = (1/4) (1-Fp) + (1/2) Fp ou fPF = (1/4) (1+Fp)
Em todos os casos essa forma se repete e, como as probabilidades referentes aos ancestrais
são independentes, o coeficiente deve ser multiplicado por (1+Fac) para cada ancestral comum.
O coeficiente de parentesco deve também ser corrigido, quando os próprios indivíduos
considerados forem endogâmicos sendo:
Rxy = (1/2)N (1+Fac)/ [(1+Fx)(1+Fy)]
0.5
Essa correção, no entanto, altera muito pouco o resultado.
54
7.6. Covariância entre parentes
Pelo fato de terem genes em comum, indivíduos aparentados têm valores semelhantes para
seus fenótipos. Essa semelhança pode ser expressa pela covariância entre eles, e a mesma dependerá
do parentesco.
Para um único loco, podemos considerar o modelo:
Gij = m + i + j + ij onde Gij - valor do genótipo composto pelo alelo Ai Aj,
m - média, (inclui os efeitos de todos os outros genes que afetam o caráter),
i - efeito do alelo “i”,
j - efeito do alelo ”j” e
ij - efeito conjunto dos alelos “i” e “j” (efeito de dominância).
Supondo todos os efeitos independentes, o que de fato ocorre em populações panmíticas, então:
Cov(Gij,Gi‟j‟) = Cov[(m + i + j + ij),( m + i‟ + j‟ + i‟j‟)]=
Cov( m,m) + Cov(m, i‟ ) + Cov(m ,j‟) + Cov(m , i‟j‟) +
Cov( m, i) + Cov(i, i‟ ) + Cov(i ,j‟) + Cov(i, i‟j‟) +
Cov( m, j) + Cov(j, i‟ ) + Cov(j ,j‟) + Cov(j , i‟j‟) +
Cov( m, ij) + Cov(ij, i‟ ) + Cov(ij ,j‟) + Cov(ij , i‟j‟)
Todos os termos que envolvem m são nulos, já que m é uma constante.
Os termos que envolvem efeitos aditivos e de dominância ( e ) também são nulos pois esses
efeitos são não correlacionados em uma população panmítica. Então:
Cov(Gij,Gi’j’) = Cov(i, i’ ) + Cov(i ,j’) + Cov(j, i’ ) + Cov(j ,j’) + Cov(ij , i’j’)
Considerando que o alelo Ai tem freqüência p e valor aditivo q , e o alelo Aj tem freqüência q e
valor aditivo -p, onde ={ u + (q-p)au}, como foi visto anteriormente, então:
Alelo i freq. Alelo j freq. i j
A p A p q q
A p A q q -p
a q A p -p q
a q A q -p -p
0 0
Cov(i, j ) = p2q
2
2 - p
2q
2
2 - p
2q
2
2 + p
2q
2
2 = 0 na população panmítica, para não
parentes, onde os genes se combinam realmente ao acaso.
Se os indivíduos forem parentes os alelos i e j têm uma probabilidade fxy de serem idênticos por
descendência, e, portanto não estarem combinados ao acaso. Assim, 1- fxy dos alelos estão
combinados ao acaso e têm covariância zero e fxy são idênticos e têm covariância
Alelo Freq i i’
A p q q
a q -p -p
0 0
55
Cov(i,i’) = pq2
2 + p
2q
2 = pq
2 = (1/2)
2A
Assim Cov(Gij,Gi’j’) = 4 fxy (½)2A + Cov(ij , i’j’)
Os efeitos de dominância para os genótipos no mesmo modelo adotado acima são:
para AA → ij = -2q2au
Aa → ij =2pq au
aa → ij = -2p2au.
Da mesma forma que a covariância aditiva, nesta teremos valor zero se os efeitos de dominância
forem pareados ao acaso. Mas se os indivíduos tiverem os mesmos efeitos de dominância, o que ocorre
quando são parentes com probabilidade igual a Dxy , teremos:
Gij freq Gi’j’ ij i’j’
AA p2 AA -2q
2au -2q
2au
Aa 2pq Aa 2pq au 2pq au
aa q2 aa -2p
2au -2p
2au
Média 0 0
Cov(ij , i‟j‟) = p2 (-2q
2au) (-2q
2au) + 2pq (2pq au)(2pq au) + q
2(-2p
2au)(-2p
2au)
Cov(ij , i‟j‟) = 4p2q
2 au
2[ q
2 + 2pq + p
2]
Cov(ij , i’j’) = 4p2q
2 au
2 =
2D
Assim, Cov(ij , i‟j‟) = 0, com probabilidade 1- Dxy e
Cov(ij , i‟j‟) = 2D , com probabilidade Dxy .
Então
Cov(Gij,Gi’j’) = 2 fxy 2A + Dxy
2D
A derivação original dessa expressão foi apresentada por COCKERHAM (1954), que incluiu também
epistasias, como segue:
Cov(x,y) = xy S2A + Dxy S
2D + xy
2 S
2AA + Dxy
2 S
2DD + xyDxy S
2AD + .......
Onde:
S2A - variância aditiva,
S2AA - variância devido a epistasia aditivo aditivo (envolvendo dois alelos, um em cada loco),
S2D - variância de dominância,
S2AD - variância de efeito epistático aditivo dominante (dois alelos de um loco e um do outro),
S2DD - variância de efeito epistático dominante dominante (dois alelos de um loco e dois do outro).
A expressão se extende para efeitos epistáticos de três locos, quatro locos, etc. Mas observa-se
que os coeficientes são os mesmos para um loco elevado ao número de locos envolvidos. Como estes
coeficientes são em geral menores que um (coeficientes maiores que um ocorrem em alguns casos de
endogamia), os coeficientes das variâncias epistáticas são sempre menores que das variâncias aditiva e
de dominância. Podemos então em geral desprezar estas últimas.
56
8. PROGRESSO GENÉTICO
Chama-se progresso genético a alteração na média dos descendentes dos indivíduos
selecionados, em relação à descendência de toda a população. Esse valor é de importância prática e
teórica, na avaliação dos programas de seleção e na comparação dos métodos de seleção, a fim de
determinar qual o melhor método para cada situação particular.
Pode-se calcular o progresso genético de duas maneiras:
Progresso genético realizado, que é aquele que se observa após a prática da seleção, pode
ser calculado pela subtração da média da população antes da seleção da média dos descendentes dos
indivíduos selecionados.
Progresso genético esperado é calculado por técnicas de regressão linear, supondo-se para
isso que o relacionamento entre os valores fenotípicos de indivíduos em gerações subsequentes e
linear. É mais usado para comparações teóricas entre métodos ou para avaliar o potencial de
populações para o uso de certos métodos de seleção.
Para esse cálculo podem-se imaginar duas variáveis, a primeira é o valor em que a seleção será
baseada, que será a variável independente. A segunda é o valor que deverá ocorrer na descendência,
que é a variável dependente.Assim, supondo o modelo:
Yi = a + bXY Xi onde Yi é o valor do descendente;
Xi é o valor do ancestral selecionado
bXY é o coeficiente de regressão linear entre esses valores e
a é o coeficiente linear.
Para eliminar o inconveniente do coeficiente linear, trabalha-se usando a média como base. Para
isso, supõe-se que a média das gerações envolvidas seja a mesma, o que de fato seria esperado se
não houvesse seleção. A reta de regressão sempre passa pela média, então se pode afirmar que:
Ym = a + bXY Xm onde m indica a média para as variáveis.
Assim, subtraindo da primeira equação a segunda, tem-se
Yi -Ym = bXY (Xi - Xm) → outra forma de representar a linha reta.
Xi-Xm é a diferença entre o indivíduo selecionado e a média da população - Diferencial de Seleção,
Yi -Ym – Progresso Genético - é o progresso obtido com essa seleção e
bXY é o mesmo coeficiente anterior.
Considera-se Ym = Xm como foi visto antes.
O coeficiente bXY é obtido a partir da covariância entre parentes e da variância de X (S2x).
A covariância entre parentes é função do parentesco genético e, em populações panmíticas,
pode ser expressa de forma aproximada por:
Cov(X,Y) = RXY S2A + DXY S
2D onde X e Y são os parentes considerados,
RXY o coeficiente de parentesco aditivo,
S2A a variância aditiva,
DXY o coeficiente de dominância e
S2D a variância de dominância.
57
8.1. SELEÇÃO FENOTÍPICA
Suponha-se um caso simples, onde se faça seleção em apenas um dos progenitores, pai ou
mãe, e o resultado da seleção seja observado nos filhos na geração seguinte.
Nesse caso → X é o valor fenotípico do progenitor selecionado e
→ Y o valor esperado no seu filho na geração seguinte.
A equação Yi-Ym = bXY (Xi-Xm) pode ser estabelecida para cada indivíduo selecionado, assim
pode-se trabalhar com a média do grupo selecionado e com a média dos descendentes destes, ao invés
de valores individuais.
Assim, Yi passa a ser a média dos descendentes dos indivíduos selecionados,
Ym=Xm é a média da população,
Xi a média dos valores fenotípicos dos indivíduos selecionados e
bXY será função da covariância pai e filho e da variância fenotípica dos pais.
Chamando
Yi -Ym de PG (Progresso Genético) e Xi-Xm de DS (Diferencial de Seleção),
e considerando Variância dos Pais = Variância Fenotípica (S2F)
PG = bPF (DS)
cov(pai, filho) = RPFS2A+dPFS
2D = (1/2) S
2A
bPF =
(1/2) S2A
= (1/2) h
2
S2F
Então se nós selecionarmos os pais pelos seus valores fenotípicos, tomando as mães ao acaso
teremos:
PG = (1/2) h2 DS
Seleção nos dois sexos
Se os pais e as mães forem selecionados, considerando uma população panmítica, então,
teremos dois progressos genéticos sendo obtidos independentemente, um pela seleção de gametas
masculinos e outro pela seleção de gametas femininos. Considerando que a seleção em um sexo não
interfere na seleção no outro sexo (o que é apenas aproximado), então:
PG = PG(♀) + PG(♂) = bMF(DS♀) + bPF(DS♂) = (1/2)h2(DS♀) + (1/2)h
2(DS♂).
Essa forma de expressar o PG é mais própria para animais, onde a seleção é separada para os sexos.
Se: DS♀ = DS♂ = DS então PG = h2(DS)
que é mais válido para plantas, onde muitas vezes os dois sexos estão em um só indivíduos.
Intensidade de Seleção
O cálculo do diferencial de seleção é muitas vezes trabalhoso e exige a medição de todos os
indivíduos. Quando se pretende apenas avaliar a população ou em estudos teóricos, é mais prático usar
58
o diferencial de seleção dado em desvios padrões fenotípicos, ou como também é chamada, a
intensidade de seleção.
Para populações que tenham distribuição normal e com seleção truncada, isto é, quando se faz
a seleção a partir de certo valor, cortando a distribuição de modo que qualquer valor acima deste será
selecionado e qualquer valor abaixo será descartado, pode-se obter o diferencial de seleção de forma
indireta, usando-se a Tabela de Z. Para isso deve-se calcular i = Z/P, onde Z é a ordenada da curva
normal standartizada no ponto de truncamento e P a probabilidade de valores acima deste ponto (ou
seja a serem selecionados).
f(z)= {EXP[-zi2/2]}/(2)
(.5)
A tabela abaixo apresenta valores de i para alguns valores de percentagem de seleção:
Tabela 8.1. Valores de intensidade de seleção (i) associados a diferentes percentagens de indivíduos
selecionados para caráter quantitativo com distribuição normal (Cruz, 2005)
Percentagem de
Selecionados
P (%)
Intensidade
de Seleção
i
Percentagem de
Selecionados
P (%)
Intensidade
de Seleção
i
Percentagem de
Selecionados
P (%)
Intensidade
de Seleção
i
1 2,665 18 1,458 35 1,058
2 2,431 19 1,428 36 1,039
3 2,268 20 1,400 37 1,020
4 2,154 21 1,372 38 1,002
5 2,063 22 1,346 39 0,984
6 1,985 23 1,320 40 0,966
7 1,918 24 1,295 41 0,948
8 1,858 25 1,271 42 0,931
9 1,804 26 1,248 43 0,913
10 1,755 27 1,225 44 0,896
11 1,709 28 1,202 45 0,880
12 1,667 29 1,180 46 0,863
13 1,627 30 1,159 47 0,846
14 1,590 31 1,138 48 0,830
15 1,554 32 1,118 49 0,814
16 1,521 33 1,097 50 0,800
17 1,489 34 1,078
Indivíduos selecionados
59
O diferencial de seleção poderá ser obtido fazendo:
DS = i SF onde SF é o desvio padrão fenotípico.
Assim, o progresso genético para um só sexo pode ser escrito como:
PG = (1/2) h2 i SF
Como h2 = S
2A/S
2F então PG = (1/2) (S
2A/SF) i
ou ainda PG = (1/2) h SA i
Expressões que podem também ser usadas para estudos teóricos, já que basta saber a
percentagem que se pretende selecionar para se ter o progresso, mesmo sem medir diretamente os
indivíduos.
Expressões para o progresso genético esperado em processos de seleção com outros
parentescos podem ser deduzidas da mesma forma, baseando-se na covariância entre parentes.
8.2. SELEÇÃO PELO TESTE DE PROGÊNIE.
Suponha-se agora um caso onde se faça seleção com base na progênie de um dos
progenitores, pai ou mãe, e o resultado da seleção seja observado em outros filhos na geração
seguinte.
Nesse caso X é o valor fenotípico médio dos filhos na progênie sob teste e
Y o valor esperado no outro filho na geração seguinte.
Da mesma forma a equação Yi-Ym= bXY (Xi-Xm) pode ser estabelecida para cada indivíduo
selecionado, assim pode-se trabalhar com a média do grupo selecionado e com a média dos
descendentes destes, ao invés de valores individuais.
Assim, Yi passa a ser a média dos descendentes dos indivíduos selecionados,
Ym = Xm é a média da população,
Xi a média das progênies sob teste e
bXY será função da covariância entre os irmãos na progênie sob teste com seus irmãos futuros e da variância fenotípica das médias das progênies.
Chamando Yi - Ym de PG e
Xi - Xm de DS, e supondo que a progênie seja de meios irmãos,
PG = bMI (DS)
cov(Meios Irmãos) = RMI S2A + dMI S
2D = (1/4) S
2A
S2m = S
2MI + S
2DMI/n
bMI =
(1/4) S2A
S2m
Então se nós selecionarmos as mães pelos valores fenotípicos médios das progênies de meios
irmãos, tomando os pais ao acaso teremos:
PG = (1/4) S2A.DS/S
2M
60
Seleção nos dois sexos
Se os pais e as mães forem selecionados da mesma forma, considerando uma população
panmítica, então, teremos dois progressos genéticos sendo obtidos independentemente, um pela
seleção de gametas masculinos e outro pela seleção de gametas femininos. Considerando que a
seleção em um sexo não interfere na seleção no outro sexo (o que é apenas aproximado), então:
PG = PG(♀) + PG(♀) = bMI(DS1) + bMI(DS2) = (1/4)S2A(DS1)/S
2m + (1/4)S
2A(DS2)/S
2m)
Essa forma de expressar o PG é mais própria para animais, onde a seleção e separada para os
sexos.
Se: DS1 = DS2 = DS então PG = (1/2)S2A(DS)/S
2m
que é mais válido para plantas, onde muitas vezes os dois sexos estão em um só indivíduos.
8.3. SELEÇÃO ENTRE E DENTRO DE FAMÍLIAS
A seleção com base em famílias em plantas anuais traz uma dificuldade extra, pois uma vez
obtidas as sementes para o teste de progênie, as plantas mães morreriam, não podendo ser usadas de
novo para produzir as sementes melhoradas. O melhorista pode então guardar parte das sementes
obtidas para usar como geração melhorada. Como quase sempre o interesse é fazer seleção
recorrente, as famílias selecionadas devem ser intercruzadas em plantios especiais, chamados blocos
de recombinação, para obter novas famílias para o novo ciclo de seleção. O objetivo no bloco de
recombinação é promover uma reprodução o mais próxima da panmítica possível. O plantio dos blocos
de recombinação permite uma nova seleção fenotípica dentro das famílias no bloco de recombinação.
Neste caso a seleção entre famílias poderá ser feita em um ou dois sexos. Já a seleção dentro sempre
será em um só sexo, pois não há como controlar a polinização dentro do bloco.
Considerando famílias de Meios irmãos, a variância aditiva restante dentro das famílias é (3/4)
S2A. Portanto a seleção fenotípica dentro das famílias oferece um ganho genético igual a
PG= (1/2) (3/4)S2A DS/ S
2d
sendo S2d a variância dentro de famílias.
A seleção entre se refere agora às médias das famílias dos meios tios dos indivíduos da geração
melhorada, e o ganho será:
PG= (1/8) S2A DS/ S
2m
O ganho total então considerando seleção entre em um só sexo será:
PG= (1/8)S2A DS/ S
2m.+ (3/8)S
2A DS/ S
2F.
O ganho total então considerando seleção entre nos dois sexos será:
PG= (1/4)S2A DS/ S
2m.+ (3/8)S
2A DS/ S
2F.
Expressões para outros tipos de seleção podem ser obtidas de forma semelhante.
61
8.4. CORRELAÇÃO INTRACLASSE
Vamos supor uma situação onde é possível subdividir uma população em classes, segundo um
certo critério. O critério usado poderá ser qualquer um, por exemplo sexo, procedência, família, etc..
Se este critério for importante para a variação da característica que se está estudando, espera-
se que os indivíduos dentro das classes sejam mais parecidos entre si do que indivíduos tomados ao
acaso na população.
A correlação intraclasse mede a semelhança relativa entre os indivíduos dentro das classes em
relação à variação da população.
Para isso podemos estabelecer o seguinte modelo:
Yij = m + Ei + Dij onde: Yij - o valor do indivíduo de ordem j na classe j;
m - a média da população;
Ei é efeito próprio da classe "i" e
Dij é o efeito próprio do indivíduo "j" dentro da classe "i".
Neste modelo Ei representa tudo que contribui para as diferenças entre as classes, e Dij tudo
que não contribui para diferença entre as classes, mas contribui para as diferenças individuais dentro
das classes. Sendo assim, o efeito Dij ‚ obrigatoriamente independente dos outros Dij's e do efeito Ei,
mesmo que seja da mesma classe.
Vamos admitir também que Dij tenha distribuição normal.
Assim,
S2Y = S
2E + S
2D , já que Cov(E,D) tende para zero;
além disso,
Cov[(Yij);(Yij')] = Cov[(m + Ei + Dij);(m + Ei + Dij')]= S2E
Imagine-se que, uma vez determinadas as classes na população todos os indivíduos fossem
tomados ao acaso e colocados em duas colunas, de modo que formassem pares sempre com outro
indivíduo da mesma classe. Assim ter-se-iam duas colunas representadas por Yij e Yij', onde cada Yij
estaria pareado com Yij' da mesma classe. Assim, ter-se-iam duas amostras tomadas ao acaso que
juntas formam a população.
A média e a variância dessas amostras são estimativas da média e variância da população. A
covariância entre os dados pareados pode ser representada por :
Cov[(Yij);(Yij')] = S2E
Assim a correlação entre esses dados será:
rYijYij' = Cov[(Yij);(Yij')]/ (SYij SYij')
Mas SYij SYij' é igual a S2Y, pelo exposto acima. Assim:
rYijYij' = S2E / [S
2E + S
2D]
62
Esta correlação é representada usualmente pela letra t e é obtida na prática com o auxilio da
analise da variância.
Organizando-se os dados de I classes com J elementos cada, como se fosse um experimento
inteiramente casualizado, pode-se gerar o quadro a seguir:
Classe Valores soma (Yi.)
1 Y11 Y12 Y13 ........... Y1J Y1.
2 Y21 Y22 Y23 ........... Y2J Y2.
3 Y31 Y32 Y33 ........... Y3J Y3.
I YI1 YI2 YI3 ........... YIJ YI.
Soma Y..
A Análise da variância pode ser resumida no quadro:
Fontes de Variação GL SQ QM E(QM)
Entre classes I-1 (1/J) Yi.2- Y..2/IJ M1
2D + J
2E
Dentro de classes I(J-1) Yij2 -(1/J) Yi.2 M2
2D
Total IJ-1
A esperança dos quadrados médios, E(QM), representa o valor algébrico do mesmo, segundo o
modelo matemático adotado. Assim, pode-se obter a estimativa da variância entre por
S2E = (M1-M2)/J
A estimativa da variância dentro será: S2D = M2 e
t = S2E /( S
2E + S
2D) ou
t = [(M1-M2)/J]/{[(M1-M2)/J]+M2}
t= (M1-M2)/ {M1-M2 + JM2} = (M1-M2)/ {M1+M2(J-1)}
O conceito de correlação intraclasse é geral e pode ser aplicado a qualquer conjunto de dados
que possa ser subdividido em classes. O valor obtido representa a semelhança relativa média dos
elementos dentro das classes e serve para avaliar o grau de importância da origem comum dos
indivíduos sobre a variação dentro de uma população.
No melhoramento será utilizado para medir a Repetibilidade e a herdabilidade, como será visto
adiante.
8.4. REPETIBILIDADE
É um tipo de correlação intraclasse, onde cada classe é formada pelos valores obtidos a partir de
um indivíduo de uma determinada população. Esses valores são repetidos no tempo ou espaço, tais
como: produção de leite, de ovos, frutos, etc. Refere-se portanto a diferentes manifestações do mesmo
caráter.
63
Pode ser interpretado como a capacidade dos indivíduos de uma população repetir a
performance de um determinado caráter em diferentes manifestações do mesmo.
R = S2E /( S
2E + S
2D) R é a repetibilidade;
S2E é a variância "entre" indivíduos e
S2D é a variância média "dentro" das performances dos indivíduos.
Para interpretar o valor da repetibilidade lembre-se que S2E é a variação entre indivíduos, e
portanto, inclui toda a variação genética e mais as variações ambientas entre indivíduos, que sejam
comuns a todas as medidas feitas. Essa variação ambiental é chamada de ambiente geral ou
permanente. S2E é composta por diferenças ambientais que se manifestam nas diferentes medidas do
mesmo indivíduo, portanto pode ser chamado de variação ambiente especial ou temporária.
O valor da repetibilidade pode ser considerado por isso o valor máximo da herdabilidade. Seria o
valor da herdabilidade no sentido amplo, se não houvessem variações devidas a ambiente permanente.
O valor calculado para uma determinada população só serve para essa população. Não se pode
extrapolar esses valores, já que os valores das variâncias genéticas, incluídas na repetibilidade são
próprios de cada população, pois dependem das freqüências gênicas. A variação ambiente também irá
variar de uma condição para outra. Assim, espera-se para cada medida desse parâmetro valores
diferentes, embora para um mesmo caráter eles possam tender a ser parecidos.
Com o valor da Repetibilidade (R) poderemos ter uma idéia do número de repetições (de
produções) necessário para avaliar um determinado indivíduo de uma população.
Por exemplo:
Porca número de parições número de crias A 1 8 B 2 7,6 C 6 7,4
Qual das porcas seria usada para a seleção?
Não se conhecendo o valor da repetibilidade ou se o valor for baixo, a porcas escolhida seria a
C, pois não seria muito provável a repetição de produção da porcas A.
Uma vez que o valor da repetibilidade seja elevado, a preferência de escolha será da porcas A,
pois haverá uma grande probabilidade dela repetir essa performance.
O valor máximo de R é 1, o que aconteceria se não houvesse variação dentro, ou seja, as
manifestações do caráter fossem sempre iguais.
Quando se conhece o valor da repetibilidade de um determinado caráter, podemos saber
quantas repetições são necessárias para avaliar os indivíduos com um grau de precisão determinado.
Quanto menor o valor da repetibilidade maior será o número de repetições necessárias para poder
avaliar um determinado caráter. Na medida em que se aumenta o número de repetições ocorre um
aumento na precisão de avaliação desses indivíduos. Porém, a taxa de aumento de precisão diminui
com o número de repetições.
64
Matematicamente, para se calcular esse aumento de precisão, usa-se o conceito de
Repetibilidade da Média.
Já que S2m = S
2E + S
2D /J, no modelo adotado, então
Rm = S2E / S
2m = S
2E / [S
2E + S
2D /J] = S
2E J /[ S
2E J + S
2D]
Rm = R S2F J / [R S
2F J + (1-R) S
2F]
Rm = R J/[ R J + 1 -R] = R J / [1 + R(J-1)]
Com o valor da R conhecida, pode-se saber quantas repetições serão necessárias para alcançar
um valor de Rm desejada, ou, de outra forma, saber o número de repetições necessárias para avaliar
um indivíduo, com um grau de precisão estabelecido.
Se um caráter for submetido à seleção pela média, a herdabilidade correspondente será:
h2m = S
2A / S
2m = S
2A J / S
2F[1+R(J-1)] = h
2 J /[1+R(J-1)]
Por outro lado pode-se estabelecer a capacidade provável de produção dos indivíduos como:
CP = MR + Rm (MA - MR). sendo MR média do rebanho, e
MA média do indivíduo A
Por exemplo no caso das porcas apresentado acima, se a repetibilidade do caráter no rebanho
for 0,6 e a média do rebanho for 5,5, temos:
Porca número de parições número de crias Rm CP A 1 8 0,6 7 B 2 7,6 0,75 7,07 C 6 7,4 0,9 7,21
Assim, conclui-se que seria melhor selecionar a porca C.
Valores da repetibilidade da média com número de repetição variável
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
0 5 10 15 20 25
número de repetições
R=0,9
R=0,2
65
9. ESTIMAÇÃO DA HERDABILIDADE NO SENTIDO RESTRITO
Abordaremos aqui somente os métodos baseados no grau de parentesco entre indivíduos, que
são de maior aplicação no melhoramento. Esses métodos são baseados na equação da covariância
entre indivíduos aparentados de COCKERHAM, vista na seção anterior, Cov(X;Y) = RXY S2A + DXY S
2D,
onde RXY e o coeficiente de parentesco e DXY o coeficiente de dominância entre os indivíduos usados
para estimar a herdabilidade, S2A é a variância Aditiva e S
2D a variância de dominância da população.
9.1. MÉTODOS BASEADOS NA CORRELAÇÃO INTRACLASSE
Como vimos no capítulo 8 a correlação intra-classe, mede o grau de importância da origem
comum dos indivíduos na variação da população, de modo que, se a origem comum se referir a sua
origem genética, este coeficiente dará uma indicação da importância dos genes na determinação das
diferenças entre os indivíduos e será relacionado com a herdabilidade. A rigor a correlação intra-classe
para qualquer tipo de família pode ser usada para a determinação da herdabilidade. Na prática são mais
usadas as que envolvem famílias de meios irmãos e de irmãos perfeitos.
9.1.1. Estimação da h2 pelo uso de correlação intra-classe em famílias de meio irmãos.
A correlação intraclasse entre meio irmãos pode ser expressa como
tMI = CovMI/S2F = (1/4) (S
2A / S
2F) = (1/4) h
2
Assim, fazendo-se um experimento onde as famílias de meio irmãos, tomadas ao acaso em uma
população, sejam os tratamentos, pode-se calcular os valores da variância "entre famílias", S2EF e da
variância "dentro de famílias", S2DF, obtendo tMI = S
2EF / (S
2EF + S
2DF) = (1/4) h
2.
Para a realização do experimento, deve-se tomar um grupo de machos ao acaso na população,
tomando em seguida um grupo de fêmeas, também ao acaso, para cada macho. As fêmeas devem ser
usadas uma única vez gerando um único descendente. A anáise da variância deve ser feita conforme
mostrado no capitulo 8.
9.1.2.Estimação da h2 pelo uso de correlação intraclasse em famílias de irmãos perfeitos.
Várias espécies produzem naturalmente ao se reproduzir múltiplos descendentes, formando
famílias de irmãos perfeitos, como os suínos, coelhos, etc... A correlação intra-classe entre irmãos
perfeitos pode também ser usada para estimar a herdabilidade, mas com certas restrições. Essa
correlação pode ser expressa como:
tIP = CovIP/VP = [(1/2) S2A + (1/4) S
2D]/ S
2F = (1/2) h
2 + (1/4) S
2D / S
2F.
Vê-se que além dos efeitos aditivos, os efeitos de dominância também contribuem para a
semelhança entre os irmãos perfeitos, sendo assim a correlação intra-classe para essas famílias não
66
poderá estimar diretamente a herdabilidade. Somente no caso de caracteres com ausência de
dominância em todos os locos gênicos é que a equação h2= 2 tIP seria correta. Se aceitarmos que a S
2D
seja pequena ou desprezível poderíamos usar essa expressão de forma geral, mas como a dominância
é importante para muitos caracteres o uso dessa expressão levará freqüentemente a erros na
estimação da herdabilidade, que estará então superestimada.
Além da dominância outras fontes de variação podem interferir na semelhança entre irmãos
perfeitos. Quando os indivíduos ao nascer necessitam de cuidados maternos por um certo período,
todos os indivíduos estarão sujeitos a um ambiente comum, já que deverão estar obrigatoriamente
juntos a sua mãe. Dessa forma estarão sujeitos aos mesmos fatores ambientais, o que tenderá a torna-
los mais semelhantes, aumentando o valor da correlação intra-classe. Além disso, cada mãe tem
capacidade diferente de amamentar o cuidar de seus filhos, alem de darem contribuições semelhantes
aos mesmos na vida intra uterina. Assim, os indivíduos são também mais parecidos pelo fato de serem
filhos da mesma mãe. Portanto, considerando todas estas contribuições para a semelhança de irmãos
perfeitos, a expressão completa para a correlação intra-classe é
tIP = (1/2) h2 + (1/4) S
2D / S
2F + S
2AC/ S
2F + S
2EM/ S
2F , sendo S
2AC a contribuição do ambiente
comum para a variância "entre" e S2EM a contribuição do efeito materno.
Vê-se que o valor da correlação intra-classe entre irmãos perfeitos não estima corretamente a
herdabilidade, podendo ser usado apenas como uma indicação do seu valor máximo, já que não se
pode dizer que os efeitos não aditivos sejam nulos.
Para obter uma estimativa não tendenciosa de h2 em espécies que produzam vários
descendentes por parição é então necessário obter dados de meios irmãos, cruzando cada macho com
diversas fêmeas, obtendo famílias de meio irmãos contendo irmãos perfeitos.
9.1.3. Precisão da estimativa da herdabilidade pela correlação.
Segundo Falconer (1960), em um experimento com N famílias e n indivíduos por família, a
variância amostral da correlação intra-classe será:
2t= 2[1+(n-1)t]
2 (1-t)
2/n(n-1)(N-1).
Obviamente quanto maior o denominador, n(n-1)(N-1), menor será o erro associado à estimativa
de t. Quando tamanho do experimento não representar problema serão obtidas estimativas melhores
em experimentos maiores, especialmente o número de famílias N.
Quando o tamanho o experimento (nN) for fixo, pode ser demonstrado que a variância terá o
mínimo em n=1/t, aproximadamente. O valor do tamanho ideal da família depende então do valor de t (e
consequentemente da herdabilidade). No caso de famílias de irmãos completos h2=2t
(aproximadamente) e n= 2/h2. Já para meios irmãos h
2= 4t e n= 4/h
2.
67
A variância amostral para a herdabilidade pode ser obtida da variância amostral da correlação
intraclasse. Já que h2=2t, no caso de irmãos completos, então:
2h2= 4
2t = 8[1+(n-1)t]
2 (1-t)
2/n(n-1)(N-1)
No caso de meios irmãos h2=4t, então:
2h2= 16
2t = 32[1+(n-1)t]
2 (1-t)
2/n(n-1)(N-1)
9.1.4. A significância de h2
Quando de estima um parâmetro qualquer existe a expectativa de determinar se o mesmo é ou
não significativo. No caso de h2, o valor ser significativo implica em testar a hipótese de que o valor
verdadeiro seja zero, com uma probabilidade qualquer, por exemplo 5%. Como a correlação intraclasse
é baseada nos componentes da variância, assim como o valor de F, pode-se traçar um paralelo entre os
dois. Temos:
QMf = 2d + n
2f QMd =
2d
t = 2f /[
2d +
2f]
F= QMf/QMd = [2d + n
2f ]/
2d = 1 + n
2f /
2d
Assim, um F significativo implica que o valor de 2f não é nulo. Portanto o teste F para famílias
também testa a herdabilidade, e esta deverá ser considerada significativa (isto é, diferente de zero)
sempre que o F de famílias for significativo.
9.1.5 Estimação da h2 pelo uso de correlação intra-classe em famílias de meio irmãos
contendo irmãos perfeitos.
Para obter a estimativa de h2 em espécies que produzam vários descendentes por parição
obtém-se dados de meios irmãos, cruzando cada macho com diversas fêmeas, obtendo famílias de
meio irmãos contendo irmãos perfeitos. Poder-se-ia utilizar apenas um descendente por fêmea,
analisando os dados como mostrado no tópico 9.1.1., mas isso representaria uma enorme perda de
informações, alem de diminuir desnecessariamente a precisão experimental. Usa-se portanto a análise
que se segue, aproveitando todos os dados.
Para executar esse experimento um grupo de machos será tomado ao acaso e cada um será
acasalado com um grupo de fêmeas, também tomadas ao acaso na população, e cada fêmea devera
produzir um grupo de descendentes. Cada fêmea será usada uma única vez.
Para tornar essa explicação geral, vamos supor que o numero de fêmeas e o numero de
descendentes por fêmea sejam ambos variáveis, o que reflete melhor a situação real. Supondo que Yijk
seja o valor fenotípico do descendente de ordem k, da fêmea de ordem j acasalada com o macho de
ordem i, que Ni seja o numero de fêmeas acasaladas com o macho de ordem i e que nij seja o numero
68
de descendentes da fêmea de ordem j, acasalada com o macho de ordem i, os dados obtidos poderiam
ser tabulados como se segue:
Machos Fêmeas Descendentes Totais
1
1 Y111 Y112 Y113. Y11n11
2 Y121 Y122 Y123 Y12n12
3 Y131 Y132 Y133 Y13n13
. . . . . .
N1 Y1N11 Y1N12 Y1N13 Y1N1n1N1
2
1 Y211 Y212 Y213. Y21n11
2 Y221 Y222 Y223 Y22n12
3 Y231 Y232 Y233 Y23n13
N2 Y2N11 Y2N12 Y2N13 Y2N2n2N2
.............. .............. .............. .............. .............. .............. .............. I
1 Y111 YI12 YI13. YI1nI1
2 Y121 YI22 YI23 YI2nI2
3 Y131 YI32 YI33 YI3nI3
NI YINI1 YINI2 YINI3 YINInINI
Tem-se a seguinte analise da variância:
Fontes de variação GL S Q Q M E (QM)
Entre machos I-1 SQM M1 Vd + k2 Vf/m + k3 Vm
Entre Fêmeas dentro de machos N.-I SQF M2 Vd + k1 Vf/m
Entre descendentes dentro de fêmeas dentro de machos n..- N. SQD M3 Vd
Total n..-1
Sendo, N. total de fêmeas usadas; n.. total de descendentes no experimento;
SQM = (Yi..2/ni.) - Y...
2/n..
SQF = (Yij.2/nij) - (Yi..
2/ni.)
SQD = Yijk2 - (Yij.
2/nij)
K1 = [1/(N.-I)] { n.. - i [ ( nij2)/ni.]}
K2 = [1/(I-1)] { nij2[(1/ni.) - (1/n..)]
k3 = [1/(I-1)] { n.. - ( ni.2) /n..}
Se o numero de fêmeas por macho e o numero de descendentes por fêmeas forem constantes,
estas expressões se tornam mais simples. Se chamarmos Ni = J e nij = K, então
Gl f/m = I (J-1) e Gl d/f = IJ(K-1)
SQM = (1/JK) (Yi..2) - Y...
2/IJK
SQF = (1/k) (Yij.2) -(1/JK) (Yi..
2)
SQD = Yijk2 - (1/k) (Yij.
2)
69
K1 = K, K2 = K e k3 = JK
Assim, pode-se obter os valores de S2m, S
2f/m e S
2d.
S2m = Cov (MI) = (1/4) S
2A
S2f/m = Cov (IP) - Cov(MI) = (1/4) S
2A + (1/4) S
2D
e h2 = 4 S
2m /[ S
2m + S
2f/m + S
2d]
9.2. ESTIMAÇÃO DE h2 PELO USO DA REGRESSÃO DOS VALORES FENOTÍPICOS DOS FILHOS SOBRE OS
VALORES FENOTÍPICOS DOS PAIS.
Outra forma de estimar a h2 é usar a regressão dos valores dos filhos sobre os valores paternos.
De acordo com a expressão da covariância entre parentes:
Cov(Pai,Filho) = Cov (Mãe,filho) = (1/2) S2A
Assim: bPF = bMF = (1/2) S2A / S
2F = (1/2) h
2
Se for usada a media dos valores paternos, (P+M)/2, como variável independente, o valor da
covariância continuará o mesmo, mas a variância dessa variável será S2F/2, assim,
bPmF = (1/2) S2A / [S
2F/2] = h
2
Quando se processa esse tipo de estimativa, é comum termos vários descendentes por
progenitor, o que permite calcular essa estimativa de três maneira diferentes. Na primeira se usa o valor
dos progenitores repetidos com cada descendente formando as duas variáveis para a qual será
calculada a regressão.
X (valor do Prog repetido) Y (valor dos filhos)
X1 P1 Y1 F11
X2 P1 Y2 F12
X3 P1 Y3 F13
. .
. .
XQ P2 YQ F21
XQ+1 P2 YQ+1 F22
. .
. .
XN-2 PI YN-2 FI1
XN-1 PI YN-1 FI2
XN PI YN FI3
bXY = [XiYi - ( Xi . Yi)/N]/ Xi2 - (Xi)
2/N]
O valor obtido será igual a h2/2 ou h
2, conforme se use a média dos pais ou o valor de um só pai.
Ao fazer este cálculo, dá-se muita importância as famílias numerosas, que terão seus valores
repetidos muitas vezes, podendo distorcer o resultado de h2.
70
Uma outra maneira de proceder o cálculo é usar a media dos filhos junto com o valor dos
progenitores para o cálculo de b.
X →Valor do progenitor e Y→ Valores dos filhos
X1 = P1 F11 F12 ...F1n1 Y1 = F1./n1
X2 = P2 F21 F22 ...F2n2 Y2 = F2./n2
. . . . . .
. . . . . .
XN = PN FN1 FN2 ...FNnN YN = FN./nN
O cálculo é feito da mesma forma que no caso anterior. Com esse cálculo será dada a mesma
importância às famílias grandes e pequenas. Se a correlação intra-classe do caráter for alta, haverá a
tendência dos valores dentro das famílias serem parecidos, e assim não haverá prejuízos se usarmos a
média para representar os descendentes de cada família. Neste caso o cálculo com a media poderá ser
o mais acertado. Se a correlação intra-classe for baixa haverá muita variação dentro das famílias e o
mais certo é repetir os descendentes. Assim o uso de um ou outro método dependerá da correlação
intra-classe, que por sua vez esta ligada a própria herdabilidade que se quer calcular, como vimos no
item anterior.
Para obter um cálculo mais preciso, e sem essas duvidas quanto à correlação intra-classe, pode-
se usar uma terceira maneira de calcular "b", que é o uso da média dos filhos ponderada pelo número
de descendentes das famílias e pela correlação intra-classe. Para isso procede-se como no caso 2, mas
cada valor de média de filhos será ponderado por um valor W i, calculado com base no número de
descendentes e da correlação intra-classe.
Para isso calcula-se
W i = ni / (1 + ni T) onde ni é o número de descendentes por família
T = (tMI - b2)/ (1- tMI) para cálculo com uso de apenas um progenitor
T = (tIP - b2/2)/ (1- tIP) para cálculo com uso da media dos progenitores
k = W i
bxy = [ W iXiYi-( W iXi)( W iYi)/k]/[ W iXi2 - (W iXi)
2/k]
Esse valor é mais trabalhoso para se obter e exige uma estimativa prévia de b, que pode ser
obtida pelo método 2, além da correlação intra-classe, mas é mais preciso que os anteriores.
71
10. GRAU MÉDIO DE DOMINÂNCIA
A preocupação em conhecer o controle genético dos caracteres a serem melhorados é
justificável, pois quanto mais se conhecer sobre a herança desses melhor se decidirá a respeito dos
métodos a serem empregados no seu melhoramento. A herdabilidade (h2) nos dá uma idéia da
importância dos efeitos aditivos para a herança do caráter. Para estudar a importância da dominância
usa-se, entre outra medidas, o grau médio de dominância, que pode ser obtido com se segue.
Retornando ao modelo já utilizado, quando estudamos a média em uma população, temos
genótipo Valor
BB u Onde "u” é o valor que indica a importância Bb au do loco para a determinação do caráter e bb -u "a" é o grau de dominância.
Lembramos que: a = 1 indica dominância completa, a = 0, indica ausência de dominância, 0<a<1 indica dominância parcial e a>1 indica sobredominância
Bases para a determinação:
supondo um só loco, com apenas dois alelos temos
S2A = 2pq [u + (q-p) au]
2 S
2D = (2pq au)
2
Se adicionalmente supormos que p = q = 0,5, temos:
S2A = (1/2) u
2 e S
2D = (1/4) a
2u
2
logo [2 S2
D / S2A] = a
2
assim, a = [2 S2D / S
2A]
Se considerarmos um caráter com N locos teremos,
VA = (1/2) [ u12 + u2
2 + u3
2 + ..... + uN
2] = (1/2) ui
2
VD = (1/4) ai2ui
2
Para que isso seja correto é necessário que os efeitos dos locos seja totalmente independentes,
ou seja que não haja ligação fatorial (ou que haja equilíbrio de ligação) e que não haja epistasia
(interação entre genes de locos diferentes), reprodução panmítica ou equivalente.
Nessa situação deveríamos calcular o valor médio dos graus de dominância de todos os locos
envolvidos, mas isso não é possível. Assim, usa-se um valor aproximado, chamado de grau médio de
dominância e simbolizado por "a", ou gmd, e que é a média quadrática dos graus de dominância
ponderada pelos efeitos dos locos (u). Esse valor é obtido simplesmente estendendo a fórmula
deduzida para um loco para o caso do N locos. Assim
"a" = [2 VD/VA] = [ ( ai2ui
2)/ ( ui
2) ]
Note que a média quadrática só é igual a média simples se os valores forem constantes, o que
poderia acontecer se todos os locos fossem homodinâmicos.
Condições de validade ou restrições à fórmula.
72
Essa fórmula só dará resultados exatos se as seguintes condições estiverem presentes na
população:
1. comportamento diplóide normal
2. apenas dois alelos por loco
3. freqüências gênicas iguais a 0,5 em todos os locos
4. não haver epistasias
5. população panmítica ou F2 de linhagens puras
6. equilíbrio ou ausência de ligação fatorial
7. genes homodinâmicos
A primeira condição geralmente é satisfeita nos animais. A segunda dificilmente será satisfeita já
que inúmeros alelos podem existir para cada loco em populações naturais. Uma tentativa de obter essa
condição seria usar populações obtidas a partir do cruzamento de linhas consangüíneas. A terceira
também dificilmente se verifica. Pode haver uma aproximação se as linhas consangüíneas cruzadas
forem contrastantes para o caráter. A quarta não se verifica, embora de modo geral considere-se que as
epistasias sejam de pouca importância para os caracteres quantitativos. A quinta pode ser conseguida
pelo intercruzamento aleatório dos animais por algumas gerações. A sexta se verifica em populações
panmíticas. Nos F2 só se verifica se o número de genes favoráveis e desfavoráveis nas duas linhagens
cruzadas for o mesmo. A sétima não se verifica.
Pelas considerações acima pode-se ver que o valor calculado com grau médio de dominância é
apenas uma aproximação e deve ser encarado apenas com indicativo das ações gênicas que ocorrem
nos genes que controlam o caráter e não como indicação exata da ação gênica média.
O cálculo do grau médio de dominância é feito pelo cálculo de VA e VD, por qualquer método,
desde que se procure satisfazer, pelo menos em parte as condições discutidas anteriormente.
Amaneira mais usada é pelos experimentos com progênies de meio irmãos contendo irmãos
perfeito onde
Vm = Cov(MI) = (1/4) VA em que Vm é variância entre machos
Vf(m) = Cov(IP)-cov(MI) = (1/4) VA + (1/4) VD em que Vf(m) é a variância de fêmeas dentro de
machos.