A existência de grupos de ligação teria constituído um sério problema para a aceitação da 2ª lei de Mendel, não tivesse sido a precoce observação, por Sutton e Boveri (1902), da correspondência entre o comportamento dos cromossomas não-homólogos na meiose e os postulados dessa lei. Daí ter-se formulado a histórica Teoria Cromossómica da Hereditariedade, atribuindo a cada cromossoma a possibilidade conter vários, mesmo muitos genes, e que a segregação entre eles estando condicionada pela ligação, já não teria de obedecer à 2ª lei.
Só pelo mapeamento se pode prever o comportamento entre genes ligados, e sem ele o conhecimento genético sobre qualquer organismo fica bastante condicionado. Por exemplo a partir de um indivíduo di-híbrido em repulsão, Ab / aB os diferentes tipos de gâmetas têm probabilidades (cf. fórmulas na legenda da figura 7):
gâmetas recombinantes: |
P(AB) = ½rAB | P(ab) = ½rAB |
gâmetas não-recombinantes: |
P(Ab) = ½(1 rAB) | P(aB) = ½(1 rAB) |
A partir de um progenitor em acoplamento, as probabilidades trocam-se: P(AB) = ½(1 rAB), etc.. A partir destas fórmulas podem deduzir-se os resultados a esperar em diversas situações, nomeadamente qual a probabilidade de obter certos genótipos ou certos fenótipos.
Exemplo
Considerando o selfing de uma F1 Ab / aB, com dominância completa nos dois loci, a classe mais frequente na F2 (genericamente identificada como AB) é composta pelos seguintes genótipos, nas seguintes probabilidades dentro da geração F2:
Genótipo | Gâmetas | Probabilidade |
|
---|---|---|---|
AABB | AB×AB | (½rAB)2 | = ¼rAB2 |
AaBB | AB×aB | 2(½rAB)(½(1-rAB)) | = ½rAB(1-rAB) |
AABb | AB×Ab | 2(½rAB)(½(1-rAB)) | = ½rAB(1-rAB) |
AaBb | Ab×aB | 2(½(1-rAB))2 | = ½(1-rAB)2 |
AaBb | AB×ab | 2(½rAB)2 | = ½rAB2 |
Sendo o total desta classe ¼(rAB2 + 2), a probabilidade de isolar uma linha AABB entre as de fenótipo igual seria, portanto, rAB2/(rAB2 + 2).
Sabendo-se as distâncias entre diversos loci e os coeficientes de coincidência respectivos, podem responder-se a diversas questões de ordem prática. Num segmento D—E—F (com os loci nesta ordem), em que as distâncias rDE e rEF são conhecidas, assim como o c.c., os diversos tipos de gâmetas a partir do tri-híbrido são, em termos gerais:
Um par de gâmetas recombinantes duplos, cada um com probabilidade ½rDE×rEF×c.c.;
Um par de recombinantes no segmento D—E, cada um com probabilidade ½rDE×(1 rEF×c.c.);
Um par de recombinantes no segmento E—F, cada um com probabilidade ½(1 rDE×c.c.) ×rEF;
Um par de gâmetas não recombinantes, cada um com metade da restante probabilidade, isto é, ½(1 (rDE+rEF) + rDErEF×c.c.).
Exemplo
Com o mapa obtido para o segmento G—F—H estudado acima, e dispondo-se do fenótipo duplo recombinante FGh (haplótipos, devidamente ordenados, GFh / gfh), qual a melhor estratégia para obter uma linha pura GGFFhh?
a) Caso seja possível fazer selfing: a probabilidade de obter gâmetas GFh a partir do único F2 deste fenótipo depende apenas de não haver crossover no segmento G—F, dado que no locus H ele é homozigótico. O resultado a esperar é (½×(1 0,0168))2 = 0,24, isto é, pouco menos de 1 para 4.
b) Ainda recorrendo ao selfing, um raciocínio análogo partindo dos 101 indivíduos com fenótipo FGH (haplótipos FGH / fgh) indica que se obtêm gâmetas GFh se não houver crossover no segmento G—F, e se o houver no F—H, pelo que se espera (½(1 0,0168×0,1835)×0,1349)2 = 0,0045, aproximadamente 1 em 221.
c) Sendo impossível realizar selfing: a solução é cruzar o único indivíduo FGh com indivíduos FGH (se possível os 101 disponíveis), obtendo-se gâmetas GFh com as probabilidades já calculadas, e uma expectativa de homozigóticos FGh de
½(1 0,0168) × ½(1 0,0168×0,1835)×0,1349 = 0,033
ou aproximadamente 1 em 30. As circunstâncias decidiriam qual a estratégia mais vantajosa.
Quando se detecta um gene até então desconhecido, o que pode acontecer pelo isolamento de uma variedade espontânea ou após a indução exeprimental de mutações (cf. "mutação"), é primordial não só determinar com exactidão o tipo de hereditariedade que envolve esse gene e os seus alelos, como determinar o seu grupo de ligação. Para isso, realizam-se cruzamentos com linhas puras contendo alelos de loci marcadores já devidamente mapeados, cada um representativo, se possível, de um cromossoma diferente. Na ausência de interacções entre os loci no desenvolvimento do fenótipo, testa-se a significância dos desvios entre os valores observados do selfing à F1 e os esperados (9 : 3 : 3 : 1 ou outros compatíveis com a 2ª lei), e onde forem significativos pode fazer-se uma estimativa preliminar da distância ao locus marcador através da variável
z = (produto entre as classes recombinantes) / (produto entre as classes parentais)
Esta variável depende, como é evidente, da taxa de recombinação entre o locus marcador e o novo locus, variando entre 0 e 1.
As classes resultantes do selfing de uma F1 di-híbrida para dois loci ligados, em que para cada locus há um gene com dominância completa, são na mesma A-B-, A-bb, aaB-, e aabb, mas nas proporções dependentes da taxa de recombinação entre esses dois loci, rAB:
estes cálculos resultam das diferentes combinações possíveis entre os gâmetas recombinantes (de frequência ½ rAB cada tipo) e parentais (de frequência ½ (1 rAB) cada tipo). Note-se que os valores resultam em 9 : 3 : 3 : 1 se rAB = ½, o valor teórico máximo de r. |
Se houver mais marcadores para o mesmo grupo de ligação, segue-se para um mapeamento mais preciso do novo locus, por cruzamentos-teste.
Exemplo
Um novo gene q pertence ao mesmo grupo de ligação que os loci R, S, T, X, Z, posicionados por esta ordem. Em todos os loci há dominância completa, e o testcross realizou-se a uma F1 com os haplótipos qRSTXZ / Qrstxz, isolando-se na geração seguinte as classes recombinantes (fenótipos):
Rstxz Q 6 | RSTxz Q 1 | RSTxz q 3 | ||
rSTXZ q 6 | rstXZ q 1 | rstXZ Q 3 | ||
RStxz Q 8 | RSTXz q 6 | |||
rsTXZ q 8 | rstxZ Q 6 |
Os loci marcadores definem entre si 4 segmentos, da recombinação num dado segmento resultando duas classes de fenótipos complementares (por exemplo Rstxz e rSTXZ resultam da recombinação no segmento R—S). Para 3 dos 4 segmentos, os genes Q e q aparecem ou associados a uma ou a outra das duas classes respectivas; mas no caso da recombinação no segmento T—X, o gene Q aparece tanto em conjunto com o haplótipo xz como com o haplótipo rst, e o q tanto acompanha XZ como RST. Estes resultados indicam que é no segmento T—X que se encontra o locus Q/q:
Basta contar o número de recombinantes de pelo menos um dos lados locus Q para se ter a sua posição no grupo de ligação. Com os dados apresentados, sabendo que as posições de T e X são respectivamente 18 e 20 (distância 2 cM), procede-se da seguinte forma: somam-se os recombinantes entre T e Q [f(tq) + f(TQ) = 2 (linhas contínuas na figura)], divide-se pelo total de recombinantes no segmento entre T e X (que são 8). O resultado, 25%, é a proporção de recombinantes nesse segmento que ocorreram entre T e Q, o que em cM dá 0,25×2 = 0,5 cM. A posição do locus Q é portanto 18,5.
A utilização imaginativa de genes marcadores permite ainda a demonstração inequívoca de genes letais nos haplótipos homólogos desses genes.
Com a produção de bancos genómicos (cf. a secção sobre "cloning") tornou-se possível utilizar como marcadores loci cujo fenótipo é definido por métodos moleculares. Estes marcadores oferecem a vantagem de serem, quando se usam certos métodos, codominantes, e dispensarem o recurso a mutantes fenotípicos; mas o seu principal interesse reside no grande número de loci caracterizáveis desta maneira, aumentando o detalhe dos mapas genéticos de praticamente qualquer espécie (incluindo os de plantas cultivadas) às sub-unidades de centimorgan. O "adensamento" dos mapas genéticos continua em franco progresso actualmente e abre perspectivas novas, nomeadamente de servirem de ponto de partida para o rastreio de sequências de interesse na sua imediata vizinhança e subsequente isolamento dos genes; além disso, mesmo os genes de efeito mais subtil podem ser evidenciados pelas diferenças fenotípicas entre determinados haplótipos moleculares, assim estendendo aos QTL, impossíveis de analisar pela metodologia mendeliana, a possibilidade de serem mapeados e até caracterizados molecularmente.
Conhecendo-se o mapa de um determinado cromossoma de uma dada espécie, prevê-se que os loci correspondentes duma espécie próxima filogeneticamente (dentro do mesmo género, dentro da mesma família, etc.) tenham o mesmo alinhamento em algum dos grupos de ligação dessa espécie. Quando isso se verifica, diz-se que os segmentos cromossómicos em questão são sinténicos entre essas espécies, no sentido em que mantiveram a ligação entre si (sinténia ou sintenia) através da divergência evolutiva. É natural que duas espécies próximas tenham tido um antepassado comum — e por isso cromossomas comuns — num passado não muito longínquo. Daí que a descoberta de um locus com interesse agronómico numa espécie permita prever a presença de um locus de função análoga nas espécies com ela aparentadas: por exemplo os diversos grupos homeólogos dos trigos são sinténicos entre si e com o cariótipo do centeio, enquanto em relação ao arroz já só muito localmente, em segmentos estreitos dos respectivos cromossomas, essa sintenia é preservada; os trabalhos em sorgo têm beneficiado muito da sua sintenia com o muito mais estudado milho.
Sempre nos cereais, recentemente foi desenvolvido um modelo de correpondência entre os diversos grupos de ligação, pela reconstituição de segmentos sinténicos em todas as espécies estudadas. Apesar das variações entre os diversos cariótipos, chegou-se à conclusão que cada cromossoma representa uma quimera desses segmentos. Por exemplo verifica-se que praticamente todos estes segmentos se encontram duplicados no milho, n = 10 (o que na prática pode querer dizer que há fortes possibilidades de redundância entre loci). |
Especialmente nas plantas que toleram a auto-polinização, é relativamente fácil dispor-se de uma colecção de linhas isogénicas (cf. "consanguinidade"). Do cruzamento entre duas linhas isogénicas diferentes obtém-se uma F1 que, por backcrosses sucessivos com uma dessas linhas acompanhada de selecção para um fenótipo de interesse, pode dar origem a indivíduos congénicos em relação ao progenitor com quem foram realizados os backcrosses: virtualmente idênticos em todo o seu genoma a esse progenitor, excepto na região cromossómica contendo o gene que determina a característica de interesse, na qual se encontra o alelo vindo do outro progenitor.
Para este processo de selecção ser eficaz, especialmente nas primeiras gerações, é de grande relevo a observação da segregação dos marcadores cromossómicos em heterozigose na F1. O processo de que resultam linhas congénicas denomina-se introgressão, e tem sido utilizado na introdução, em cultivares susceptíveis, de certos genes de resistência a parasitas existentes em populações naturais (cf. "recursos genéticos"): a linha congénica obtida tem as mesmas características agronómicas que a cultivar com que foram feitos os backcrosses, a que se acrescenta o gene introgredido a partir do parceiro inicial de cruzamento com essa cultivar.
O recente desenvolvimento da transformação de plantas (inserção de um novo locus ou a substituição de um alelo, sempre a partir de DNA isolado in vitro) abre uma alternativa (plantas transgénicas) às linhas congénicas, e neste processo as técnicas de mapeamento são também essenciais.
O sistema sanguíneo Rh na espécie humana tem uma tipologia bastante complexa e ilustra bem a questão dos pseudo-alelos. Tal como o sistema AB0, os fenótipos são definidos serologicamente; contudo, a multiplicidade de anti-soros diferentes desembocou no desenvolvimento de dois sistemas diferentes de interpretação da genética deste determinante sanguíneo: num, considera-se existir apenas um locus com múltiplos alelos; no outro, considera-se que há três loci muito próximos entre si, C/c, D/d e E/e, com a resolução de três componentes antigénicas para cada haplótipo (só o locus D/d apresenta dominância completa; de resto, não se conseguiu obter nenhum soro anti-d). Os dois sistemas têm na prática a correspondência expressa na tabela seguinte:
Sistemas genéticos | |||||||
Anti-soros | anti-C | anti-c | anti-D | anti-E | anti-e | Fisher-Race (haplótipos) | Wiener (alelos) |
---|---|---|---|---|---|---|---|
Fenótipos | | + | | | + | cde | r |
| + | + | | + | cDe | R0 | |
+ | | + | | + | CDe | R1 | |
| + | + | + | | cDE | R2 | |
+ | | + | + | | CDE | RZ | |
+ | | | | + | Cde | r' | |
| + | | + | | cdE | r" | |
+ | | | + | | CdE | rY |
Se se tratar realmente de 3 loci, o sistema de Wiener estaria a indicar, na realidade, "pseudo-alelos", no entanto sem qualquer prejuízo prático: a taxa de recombinação entre loci muito próximos entre si pode chegar a ser da mesma ordem de grandeza que a taxa de mutação e por isso cada haplótipo pode ser tratado como um alelo (por exemplo, a passagem, por crossover, de um haplótipo cDe para um CDe poderia ser considerada como a mutação de R0 para R1).
Alternativamente, cada alelo codifica um produto com três determinantes antigénicos variáveis, resolúveis nos 5 tipos principais de soros descritos na tabela. Então os "loci" do sistema de Fisher-Race corresponderiam aos 3 determinantes antigénicos C/c, D e E/e. Este tipo de ambiguidade pode encontrar-se em qualquer organismo — por exemplo, as enormes séries alélicas de alguns sistemas de auto-incompatibilidade das plantas poderiam resultar de pseudo-alelismo, por exemplo por duplicação genética (cf. "mutação"). Há pelo menos uma possível consequência desta ambiguidade: a interpretação dos pleiotropismos. Um efeito pleiotrópico pode ser causado por um pseudo-alelo e não por um alelo, e só o isolamento dos genes em causa por métodos moleculares, ou a definição da base molecular do fenótipo antigénico, auxiliadas pela interpretação ontogénica e fisiológica dos fenótipos, pode resolver a ambiguidade. A não ser que se demonstre uma taxa de recombinação (e consequente dissociação entre os fenótipos correlacionados) demasiado alta para ser de mutação.