O PROJECTO DO GENOMA HUMANO

O assunto deste artigo, embora não seja objecto de grandes parangonas jornalísticas, é motivo de grande atenção por parte de muitos cientistas que se interessam por biomedicina e genética, assim como de inúmeras empresas de biotecnologia, da indústria farmacêutica, e até quem sabe se de comissões de ética científica. Há quem acredite que o projecto do genoma humano traz consigo a chave para todas as doenças e todas as curas -- tudo seria uma questão de tempo para lá chegar. Do que não há dúvida é que se trata de uma fascinante aventura no desconhecido em que a Humanidade -- pelo menos as sociedades "mais desenvolvidas", e isso não inclui Portugal -- se meteu. Como os tais mares nunca dantes navegados, ou a recente viagem à Lua, envolve meios financeiros e humanos de grande vulto, e uma coisa é certa: o relacionamento que temos com a nossa própria biologia, donde o nosso modo de viver, nunca mais vai ser o mesmo.

Lembram-se daquela frase de Kevin Costner no filme "Danças com Lobos", onde ele dizia querer ir para a fronteira enquanto ainda havia fronteira para onde ir? A aventura científica tem no projecto do genoma humano, e depois das fronteiras geográficas e cosmográficas, a oportunidade de atacar sistematicamente uma fronteira que em vez de estar longe está até bem perto, dentro de cada um de nós -- a dos nossos genes.

Alguns ii para lhes colocarmos os pontos

Todos os organismos vivos têm células por elemento básico de estrutura e de funcionamento. Cada um de nós é composto por estas unidades em números astronómicos, organizadas em tecidos e estes, por sua vez, em órgãos. Órgãos que como o coração promovem a circulação do sangue, o estômago que se encarrega de uma das fases de digestão dos alimentos ingeridos, os olhos que captam imagens luminosas, o útero que alberga o embrião, os pulmões que asseguram a renovação do oxigénio do ar inspirado, etc.. As células encontram-se especializadas para actuarem no contexto dos órgãos respectivos -- por exemplo no estômago há células que se dedicam à produção do ácido clorídrico envolvido na digestão dos alimentos neste órgão, na retina do olho há células que formam um écran para as imagens luminosas e traduzem essa informação em impulsos nervosos que serão interpretados no cérebro, etc.. Certos tipos celulares, mesmo sendo comuns a diferentes órgãos, organizam-se diferentemente de uns para os outros: há células musculares no estômago que entram em acção para "remexerem" os alimentos (um pouco como uma betoneira faz com o cimento), sem o que a digestão pode não ser completa ou tornar-se muito demorada, mas na íris células semelhantes formam um anel muscular que regula a abertura da pupila do olho para que este se adapte às condições de iluminação existentes.

Daí falar-se em diferenciação celular: cada célula tem um papel próprio (diferenciado) a desempenhar no organismo, na medida em que está especializada e integrada no funcionamento global. Mas, se no geral os tipos de células que um ratinho tem são muito semelhantes aos que se encontram em nós, também é certo que um ratinho é um ratinho e um humano é um humano. Por isso se entende que é em função do material hereditário que tudo o que somos se define -- em função das instruções codificadas nos cromossomas. O que faz uma célula ter esta ou aquela função, em grande medida, é o conjunto peculiar de instruções que nela actuam, ou seja, o conjunto peculiar de genes que dentro dela se encontram em actividade. E se as instruções das células do ratinho podem ser parecidas com as que de modo análogo especificam as nossas células, sempre há diferenças ao nível dos genes mas não sabemos bem dizer quais.

Definir como isto se organiza e é mantido tem por isso implicações profundas nos mais diversos aspectos, tanto teóricos como aplicados, da Biologia. Ora, até aos anos 80 pensava-se que a catalogação dos genes envolvidos nas funções (e disfunções) dos organismos resultaria necessariamente da estratégia primeiro utilizada pelo fundador da Genética, Gregor Mendel: a partir de uma diferença observável, por exemplo uma doença, deduzia-se uma causa genética. Durante muitos anos assim se fez para compreender algumas doenças e outras deficiências, hereditárias ou adquiridas, e os avanços principais consistiam (ainda hoje é assim) em definir cada vez mais detalhadamente essa compreensão.

Exemplos clássicos são a anemia falciforme, o albinismo, a hemofilia, etc.. Diferenças consideradas normais, como nos grupos sanguíneos ou no sistema que controla a rejeição de transplantes também seguiram esta via de análise. Mas com o tempo tornou-se aparente que este processo só permitia, e com demasiada lentidão, a descoberta de uma ínfima parte do que se passa dentro dos diversos tipos celulares -- e diga-se de passagem, tendia a explicar mais o disfuncional do que o funcional.

Nos anos 80, e porque já se tornara possível ir directamente ao conteúdo dos genes por métodos bioquímicos, passou a fazer-se uso de uma estratégia inversa, que foi alcunhada de "genética reversa": conhecer os genes primeiro, e descobrir as suas funções a partir daí. Aqui, o "conhecer os genes" resume-se a fazer a leitura bioquímica das instruções que eles contêm; isso não será suficiente para definir as suas funções, e ainda menos para dizer em que é que somos diferentes dos ratinhos, mas fornece informações complementares às da abordagem tradicional.

A base tecnológica deste trabalho de leitura envolve a chamada sequenciação dos nucleótidos do DNA (ou seja, a leitura letra a letra das instruções dos genes), e a sua aplicação à escala total do genoma é aquilo em que consiste o projecto de genoma humano lançado no início dos anos 90. Em vez de amostragens parciais e mais ou menos ao sabor da curiosidade de inúmeros e desgarrados grupos científicos, que comportam muita redundância de esforços e deixam passar em claro grande parte da informação contida no DNA, a intenção do projecto de genoma humano é fazer um censo completo de todos os genes e enquadrá-los na arquitectura dos cromossomas, de modo que haja uma razoável garantia de que podemos dispor, à medida do que forem as necessidades futuras, da informação contida em qualquer segmento em cada um dos nossos cromossomas.

O principal problema na sua implementação é logístico: previu-se que o necessário trabalho de sequenciação levaria vários anos, envolvendo meios humanos e materiais, dedicados a uma única tarefa, sem precedentes em Biologia. Daí as analogias que estabeleci no início: não demorou a enorme contestação da parte de "Velhos do Restelo" que receavam diminuirem-se os fundos disponíveis para outros ramos de investigação, por causa da absorção de recursos para estes projectos (humano e de outros organismos). Fossem todos os receios como esses... até porque não se confirmaram.

O Projecto de Genoma Humano (americano) foi aprovado em 1990, ainda no meio de grandes contestações mas em círculos retritos -- os académicos e os lobbies. Creio que o facto de tais discussões não terem chamado a atenção do "grande" público se deveu ao cepticismo que então reinava quanto à capacidade desses projectos cumprirem os seus objectivos, mesmo havendo nomes tão ilustres como o inglês Sydney Brenner e o americano James Watson a envolverem-se neles. Também será essa a condição dos projectos visionários: ninguém fora dos círculos especializados entende do que se está a tratar, por isso nem os discursos pró nem os contra merecem atenção. Também um certo pacto de silêncio jornalístico tem sido a norma, pois nem com o crescimento do projecto e a evidência dos seus primeiros resultados e os de projectos afins despertou a atenção pública: em 1992 estava publicada a sequência completa, repleta de surpresas, de um pequeno cromossoma da levedura da cerveja; Watson tinha-se demitido da presidência do projecto americano; a Comunidade Europeia contratava laboratórios para fazerem sequenciação a um preço xis por nucleótido; e as metodologias aperfeiçoavam-se para além do que era imaginável. A idade da inocência também terminara neste campo com a entrada progressiva de interesses privados no seu financiamento.

Fases e crises do projecto

Não pode haver dúvidas que foi o caminho tecnológico desbravado em diversos domínios da Biologia Molecular que fez por alturas de 1987 diversos cientistas estarem cientes da oportunidade que se colocava de realizarem a sequenciação completa do genoma humano. Tais progressos começaram em 1972-4 com a metodologia de isolamento e manipulação de genes em laboratório (cloning), seguindo-se a detecção de sequências específicas por hibridação molecular em 1975 e a sequenciação propriamente dita em 1975 e 1977, e progrediram nos anos 80 com o mapeamento físico de cromossomas (1981), a publicação da "bíblia" laboratorial nesta área em 1982 [1], a sequenciação automática (1983), a reacção em cadeia através de polimerase (a actualmente ubíqua PCR, 1985) e a invenção de cromossomas artificiais de levedura (YACs).

Mas se a sequenciação se tornou numa técnica de rotina não muito exgiente para projectos dedicados a problemas específicos, a sequenciação sistemática de genomas era uma tarefa de outras dimensões, e requeria uma organização a nível mundial. Por volta de 1988, ao mesmo tempo que se constituía a HUGO (Human Genome Organization) para coordenar os esforços e a manutenção dos financiamentos necessários, deu-se início a todo o labor de captação das fontes financeiras, seja estatais, comunitárias (no caso da Europa) ou privadas. Os argumentos não eram orientados só para o indiscutível valor científico de dispor de toda a informação primária acerca dos nossos genes: tinha de juntar-se um argumento de aplicação, onde figuravam promessas (discutíveis) de um mundo melhor através dos progressos em Biologia Humana que se previam desbloqueados com a sequência completa. Este zelo de propaganda não só era mediado pelos prestigiosos cientistas promotores da realização deste projecto, mas também por entidades por vezes bastante suspeitas, designadamente as que se perfilavam como adeptas de projectos eugénicos e provocaram uma acesa polémica. Mesmo assim, o governo dos Estados Unidos aprovou em 1990 o que é conhecido como Projecto do Genoma Humano (HGP), sob a tutela do Departamento de Energia e dos NIH (National Institutes of Health, poderosa instituição reguladora da política de investigação biomédica nesse país), sendo nomeado para director, nem que seja pelo valor simbólico inerente, um americano que participou na decifração do modelo molecular do DNA em 1953: James Dewey Watson.

Esta ênfase nos Estados Unidos justifica-se não só pelo calor dos debates como pela dimensão que o investimento público atingiria nesse país: estima-se que entre 1993 e 1995 qualquer coisa como 40 milhões de contos, 2/3 do total mundial em dinheiros públicos, vieram do governo americano. Ora, como somos todos Flhos de Deus e por isso sujeitos a tentações, os cientistas não se mostraram menos sensíveis à miragem de lucro que a situação inusitada criada pelo HGP fez surgir. As perspectivas de consumo em equipamentos, reagentes, software, etc., a uma escala que não se imaginava anteriormente, trouxe consigo fenómenos comerciais e financeiros que pelo menos fazem sorrir: novos fornecedores de produtos "especialmente para genomas", novos departamentos (também especializados) dentro dos fornecedores já existentes, a multiplicação de centros privados de sequenciação de genomas, uma rede cada vez mais densa de negócios com a indústria farmacêutica... e muitos cientistas entre os investidores!

De um inquérito sobre eventuais ligações com uma empresa de biotecnologia implicando Watson resultou a sua demissão logo em 1992; mas como aponta Richard Lewontin, um reputado crítico deste projecto [2], havia uma ligação estreita deste inquérito com uma divergência sobre o patenteamento das sequências a descobrir. Mesmo tratando-se dos seus próprios genes e dos de quase seis mil milhões de seres humanos à face da Terra, muitos foram os que reclamaram o direito de "proteger" a propriedade intelectual do trabalho realizado sobre cada gene. Trata-se de um debate tão complexo que ainda hoje -- e com patentes à espera de decisão -- o assunto não foi resolvido, nem nos Estados Unidos nem em qualquer outro lado.

O problema do patenteamento surgiu de uma importante extensão do projecto, que consiste no isolamento de colecções de sequências expressas em cada tipo celular, tecido ou órgão: esta tecnologia EST (expressed sequence tags, traduzível como "marcadores de sequências expressas"), proposta em 1991, viabilizava o estabelecer-se uma ponte para o desvendamento da função de um gene desconhecido, assim como para a sua localização no respectivo cromossoma. Graças a ela a análise genética passava a ter praticamente a mesma eficácia no Homem que nos organismos-modelo como o ratinho, perspectivando-se desde logo a sua aplicação no desenvolvimento de drogas para a terapêutica, por exemplo. Daí a presunção de direito a patentear sequências, e também o interesse da indústria farmacêutica (expresso em negócios com as instituições de sequenciação que em 1996 eram da ordem dos 210 milhões de contos): tudo pelo privilégio de utilização de colecções de ESTs em função de um propósito terapêutico definido.

Em 1992-3, construído que estava o centro Human Genome Sciences -- infrastrutura criada pelo HGP para realizar o trabalho de sequenciação -- não só se fundavam centros privados paralelos como, no âmbito da HUGO, três cientistas da Généthon (em França) apareciam com o primeiro mapa físico do genoma humano [3].

Em reacção ao secretismo dos negócios envolvendo a produção de colecções de ESTs, a Merck e a Universidade de Washington tiveram em 1994 a iniciativa de construir uma base de dados informática de ESTs para acesso público através da Internet, a dbEST. A dbEST propõe-se estabelecer um Index completo da centena de milhar (mais coisa menos coisa) de genes que, desde a concepção até à morte, nos constróem, mantêm e destróem. O estabelecimento desta base de dados acelerou tremendamente a acumulação de ESTs de acesso público logo desde o início de 1995, e ainda hoje novas sequências dão entrada nela praticamente todos os dias. Sem ser preciso esperar pela sequência completa (mas sem a dispensar), esta ramificação permitirá ir respondendo a muitas perguntas importantes tanto no domínio teórico como na aplicação clínica. A comunidade científica deve à dbEST e afins a possibilidade de fazer estas investigações, como poderemos verificar adiante.

Outra extensão importante foi a comparação com outros genomas. O ano de 1992 marca a publicação da primeira sequência completa de um cromossoma de levedura da cerveja, e em 1996 este projecto paralelo de genoma total (200 vezes mais pequeno que o humano e quase desprovido de certas complicações) estava concluído. Ainda se estavam a analisar os dados sobre os perto de 6000 genes deste organismo, e já os mesmos cientistas partiam para um novo projecto (EUROFAN) que visa desvendar a por enquanto desconhecida função de 1000 deles. Mesmo salvaguardando as devidas proporções, o progresso com o genoma deste organismo dá-nos uma antecipação das virtualidades do próprio genoma humano, assim como o de outros organismos usados experimentalmente na investigação em Genética e Biologia do Desenvolvimento. Mais ainda, trata-se de organismos com um longo historial de relevância para os mais diversos aspectos da Biologia Humana, pelo que a obtenção das respectivas sequências (prevista para 1998 a conclusão em mais dois) oferecem importantes possibilidades de manipulação e referenciação com as da espécie humana.

As ferramentas

Sem ir muito a fundo nos detalhes (penosos) da metodologia, tentarei descrever em traços gerais como se tem trabalhado nos projectos de genomas. Os genes são segmentos relativamente curtos dos cromossomas, e em termos químicos são DNA. Para isolar um gene qualquer em laboratório é necessário fragmentar ao acaso o genoma, tal que resultam segmentos que podem ser mantidos separadamente, seja em leveduras, bactérias ou vírus, organismos que oferecem diferentes formatos consoante os tamanhos dos segmentos e as utilizações a dar-lhes. Quando por exemplo uma célula de levedura, onde se mantém um cromossoma artificial com DNA extraído de células humanas (um YAC, na terminologia especializada) se divide, esse material humano duplica-se simultaneamente com os cromossomas da levedura e assim o crescimento de uma colónia dessa levedura é também a multiplicação, em réplicas fiéis, do seu YAC. Da fragmentação de um genoma produzem-se de uma só vez muitos milhares de colónias (ou clones) contendo diferentes segmentos, vindo a constituir no seu conjunto um banco genómico (correspondente ao inglês genome library) representativo de toda a extensão desse genoma.

Necessidade de mapas físicos Poderia pensar-se que, havendo bancos genómicos, bastaria isolar sucessivos segmentos dos YACs e começar a sequenciá-los. Na prática não pode ser assim: sequenciar o genoma humano corresponde a alinhar algo como 3 000 000 000 (3 × 109) nucleótidos, as letras desse texto biológico. Como termo de comparação, uma lista telefónica com 600 páginas, numa estimativa por alto, terá cerca de dezoito milhões de caracteres, portanto trata-se de fazer a leitura sistemática e completa do correspondente a umas 160 listas! Agora imagine-se diferentes laboratórios a lerem a mesma "secção" da mesma "lista" sem o saberem: o desperdício de trabalho e recursos seria intolerável. Por isso um dos passos mais importantes consiste em construir mapas de YACs contíguos entre si num mesmo cromossoma -- como se cada cromossoma humano, digamos que o X, fosse um puzzle dos segmentos dispersos por diversos clones, puzzle esse que depois se monta com base apenas nos clones essenciais para cobrir toda a extensão desse cromossoma. Na espécie humana há 22 pares de cromossomas, homólogos dois a dois, e há ainda os cromossomas sexuais X e Y, por isso a construção do mapa físico consiste em montar 24 puzzles. Em 1993 foi publicado um mapa de primeira "geração" contendo clones YAC de 900 000 nucleótidos em média e cobrindo quase 90% do genoma, embora a baixa resolução [3]; baseado no progresso deste mapa foi possível já em 1996 compor um mapa de 16 mil genes humanos [4], e prevê-se que a continuação deste trabalho produza já em 1997 a terceira geração (definitiva) do mapa de YACs humano, cobrindo o genoma a 100% e em alta resolução.

No mapa, cada segmento do genoma tem de conter uma ou mais sequências de nucleótidos que, por serem únicas no genoma todo, permitam identificá-lo sem ambiguidades com a porção de cromossoma a que pertence (os STSs de sequence tagged sites, traduzível como "locais assinalados por sequências"). Um laboratório que pretenda subdividir um segmento de DNA para o sequenciar leva já a indicação precisa de onde se irão encaixar as sequências uma vez determinadas, e tudo isso vem "anotado" quando via Internet se forem a consultar essas sequências.

A topografia detalhada dos nossos cromossomas resolve não só uma das prioridades da sequenciação do genoma humano, mas, e não é menos importante, é uma ferramenta de análise da hereditariedade na espécie humana que nos coloca ao nível dos organismos experimentais mais sofisticados (como a mosca da fruta) em questões tão variadas como o despiste de genes causadores de doenças ou as origens evolutivas da nossa espécie.

O mapa anatómico do genoma Para além do mapa físico de cada cromossoma, o trabalho já vai bem adiantado na análise da expressão dos genes no corpo: a partir de um órgão do corpo humano vão-se obtendo colecções de moléculas de DNA (aquilo a que se atribui a sigla cDNA) representativas dessa expressão, constituindo (idealmente, pelo menos) o repertório da actividade genética específica desse órgão. Cada gene expresso fica assinalado no(s) cDNA respectivo(s) por pelo menos um par de sequências únicas no genoma, os já referidos ESTs, que permitem por diversos métodos localizar o gene respectivo nos cromossomas e assim integrá-lo com o mapa físico, e eventualmente relacioná-los com os STSs.

Em suma, não só se pode saber que tipo de genes estão activos num determinado tipo de células, mas também sabe-se em que porções cromossómicas se localizam esse genes e quais os YACs que os contêm. Relacionando por esta via a localização cromossómica de um gene expresso com a especificidade anatómica da sua expressão, abre-se a perspectiva, praticamente impossível até aos anos 90, de focar o estudo sistemático dos genes que actuam num tecido (por exemplo o sangue), numa função orgânica (a produção de hormonas na tiróide), numa patologia (a diabetes obesa), etc.. Esta tarefa da "genómica" funcional ainda está na sua infância, e ao contrário da sequenciação que tem já um prazo (o ano 2005) discernível, ninguém arrisca o tempo que levará a tirar dela proveitos científicos, tecnológicos e sei lá que mais... Tanto podem ser muitas décadas como talvez pela invenção de estratégias revolucionárias esteja já ao virar da esquina.

Engenharia da sequenciação e bioinformática Sequenciar um segmento de DNA é em si uma tarefa simples; mas talvez ninguém previsse que os métodos originais de sequenciação de Sanger e de Maxam e Gilbert, os tais que foram automatizados em 1983, estivessem em vias de ficar obsoletos! Para encarar a colossal tarefa de sequenciar o genoma humano, o aperfeiçoamento de novas ferramentas ou abordagens, designadamente na própria automatização da leitura de sequências e respectiva transmissão para uma base de dados informática, e muito recentemente na introdução de métodos de sequenciação revolucionários -- genuínas manifestações da criatividade do espírito humano -- estão a tornar possível suplantar as melhores expectativas de conclusão deste empreendimento de ler o genoma.

Uma nova área da engenharia informática está a definir-se em função das necessidades de análise das sequências obtidas: a Bioinformática. A acumulação na Internet [5] de sequências novas e também dos dados experimentais que lhes deram origem processa-se diariamente a um ritmo que tem obrigado a revisões significativas ao modo como se lhes dá acesso, à referenciação cruzada entre diferentes marcadores do mapa, etc.. O software para a descodificação funcional das sequências, ferramenta que complementa poderosamente a vertente experimental, ainda não atingiu a maturidade apesar de já ter uma grande sofisticação. A comparação de sequências dentro e entre genomas, a demarcação estatística de porções dos genes que "se sabe deverem lá estar", a robustez face a erros de sequenciação, e tantos outros desafios, porque envolvem de extrapolação para o que é desconhecido a partir dos ainda poucos dados devidamente conhecidos, poderão até dar origem a novas ramificações fora da Bioinformática.

Digerindo as perplexidades e inventando

Com o passar dos anos vão-se acumulando sequências, e cabe perguntar-se o que é que está a ser feito para tirar partido de toda a informação disponível para resolver as mais diversas questões científicas.

Não é tarefa nada fácil... A primeira reacção à sequência do cromossoma III da levedura da cerveja, publicada em 1992, foi de embaraço: havia nesse cromossoma para cima do dobro do número de genes que se previam, grande parte desses genes eram desconhecidos e muitos tinham sequências inclassificáveis (isto é, não tinham qualquer semelhança com sequências já conhecidas); e certos genes, quando classificados, revelavam parentescos que não faziam (aparentemente) sentido. Com a conclusão do genoma da levedura em 1996, e com o progresso dos de outros organismos (e, claro, do humano), esta constatação tem-se repetido sistematicamente. Também em 1996 completou-se a sequenciação do genoma de uma metanobactéria, e esta revelou cerca de 2/3 de genes ainda totalmente imprevistos, mesmo com os dados acumulados (sempre com uma componente inclassificável) noutros organismos, mas nessa altura já poucos se deviam admirar disto.

Uma grande lição de humildade começou a impor-se a todos. A Biologia pôde pela "genética reversa" apreciar melhor a extensão imensa do véu da sua ignorância, e mesmo sem destapá-lo operou uma revolução de tal ordem no pensamento científico que só por isso justificava a aventura. Conhecer as sequências pode não permitir a priori esclarecer a função que lhes está associada num gene sobre o qual não se sabe mais nada, mas foi preciso conhecê-las para ter uma melhor noção da nossa ingenuidade.

Como é que se julga poder decifrar o papel que um determinado gene tem no organismo? Pode tentar ver-se em que circunstâncias e em que tecidos ele entra em acção (o mapa anatómico); podem a partir disso procurar-se outros genes cuja actividade depende da sua; pode artificialmente introduzir-se o gene em animais experimentais (ou então removê-lo) e, das mais diversas maneiras, tentar observar os efeitos da sua presença ou ausência, por exemplo se corresponde a algum quadro clínico conhecido. É de La Palisse prever que muitas outras estratégias, ainda por idealizar sequer, hão-de ser bem-sucedidas neste trabalho. Mas o facto de tudo isto ser possível assenta inteiramente em ter-se feito o isolamento e sequenciação o segmento de DNA desse gene, e isso estará feito em relativamente poucos anos para todos.

Neste sem-fim de tentativas de expor a função do gene, todas elas possíveis na teoria, poucas resultam na prática: primeiro, porque a sequência muitas vezes aparenta coisas que não são a realidade -- e levar ao delineamento de experiências de análise orientadas segundo hipóteses sem sentido, dando resultados inconclusivos (diversos exemplos do passado recente atestam-no); segundo, porque os passos experimentais utilizados custam caro e são morosos, não sendo fácil levá-los a cabo em larga escala, isto é, em muitos genes (a indústria farmacêutica, porém, parece não ter medo disso); terceiro, porque ainda não se conhecem modelos experimentais que reproduzam fielmente o que se passa no nosso corpo. Os ratinhos de laboratório, como é habitual desde há várias décadas, ainda são o melhor compromisso. Pode introduzir-se um gene em certas células embrionárias e delas obter gerações de ratinhos com esse gene (animais transgénicos), ou pelo mesmo método pode remover-se com precisão um gene no local que ocupa no respectivo cromossoma (o que se denomina transgénicos com um gene "K.O."). Apesar de caros, os ratinhos transgénicos permitem confirmar investigações semelhantes realizadas preliminarmente em organismos mais convenientes economicamente, como as leveduras ou a mosca da fruta.

Assim, um dos frutos mais apetecidos pela Biologia Humana e a Medicina, que é a decifração funcional do genoma humano por via da genética reversa, é forçosamente de amadurecimento lento. Muita criatividade será necessária para inventar estratégias de análise que acelerem o processo e lhe reduzam as margens de erro e os custos. Dois exemplos representativos, todos recentes, talvez dêem uma ideia deste esforço:

Um grupo de cientistas italianos foi à Internet consultar a Flybase, onde se encontram os genes da mosca da fruta já sequenciados, e resolveram compará-los com ESTs humanos expressos no olho. No final do processo saíram-lhes 62 ESTs de genes humanos desconhecidos, candidatos pelas suas semelhanças com genes da mosca, dos quais 58 correspondiam a genes nesta para os quais se conheciam mutantes. Dir-se-á: o olho da mosca não é nada como o humano! Mais correctamente, não parece... mas desde que um grupo da Suíça demonstrou em 1995 que um gene humano podia ser usado para substituir o seu homólogo na mosca, sem que a mosca fosse visivelmente diferente das outras, tornou-se óbvio que para efeitos de comparação as homologias podem ter significado. Por outras palavras, a diferenciação das estruturas oculares em moscas e no Homem têm algumas bases genéticas em comum, e por isso não é estranho que os italianos dessem com um gene que pela sua localização num dos mapas de cromossomas humanos deverá ser o que está envolvido em certas doenças da retina do olho com a mesma localização... mas não admira também que houvesse certas correspondências espúrias (um dos genes da mosca é conhecido por inverter o sexo do animal, por mecanismos que não têm equivalência na nossa espécie). O que importa é que, de uma assentada, retiraram uma bonita colecção de ESTs humanos que lhes interessavam, todos já mapeados e com paralelos funcionais na mosca da fruta, para a partir daí investigarem a relevância de cada um para a sua especialidade científica.

A PCR tem aplicação em campos diversíssimos da investigação em Genética, mas no caso do genoma humano apenas uns 4% do DNA contêm genes que expressam proteínas nas células, e há necessidade de "contornar" o DNA restante para que essa técnica dê os seus melhores frutos na "pesca" de novos genes. Foi assim que dois cientistas nos Estados Unidos escolheram ao acaso 1000 sequências expressas, e simulando a PCR em computador verificaram que era possível seleccionar os reagentes (chamados primers porque iniciam a reacção em cadeia) com o fim de amplificar pela PCR apenas sequências expressas, ou até as de uma determinada "família" de genes. Particularmente interessante é o facto de muitos desses genes ainda não estarem representados na dbEST (aqui há uns meses considerava-se que perto de metade dos genes expressos ainda não se encontravam nesta base de dados), pelo que a complementaridade com os ESTs é evidente; a possibilidade de focar a busca de novos genes em assuntos bem definidos pode permitir que se acelere ainda mais a realização de estudos funcionais exaustivos.

Nestes exemplos é evidente a importância dos computadores, como meio rápido e barato de testar hipóteses sobre enormes bases de dados, na busca de pistas para a exploração do genoma. Por isso o estímulo que as bases de sequências têm representado para os que as utilizam se reflecte no contínuo aperfeiçoamento da sua organização e manipulação. Para os cientistas pelo menos, o que fica depositado nessas bases de dados é um tesouro de valor incalculável.

É claro que, nas sequências de DNA que saem dos sequenciadores, há tesouros que são facilmente traduzíveis em cifrões. Nos últimos anos a indústria farmacêutica mostrou ter decidido apostar na utilização do produto do projecto de genoma humano. Pode eventualmente corrigir-se uma doença, resultante dum defeito da expressão de um gene, por uma de diversas maneiras dependendo da natureza do defeito e da localização da expressão normal. A caça a drogas correctoras de cada patologia é muito facilitada ao dispor-se do conhecimento das sequências dos genes implicados, daí o empenho desta muito lucrativa indústria em assegurar o uso privilegiado das ESTs dos órgãos que tenham relevância para as situações clínicas que eles considerem estratégicas. Quem chegar primeiro a uma dada solução terapêutica ganha a corrida para um mercado promissor, como é o caso das doenças dos idosos com influências genéticas ainda mal conhecidas, seja insuficiências cardíacas, osteoporose, senilidade, etc..

Mas como a interpretação de funções a partir de sequências está carregada de rasteiras, a indústria desenvolve importante trabalho, sempre em confidencialidade, no desenvolvimento de sistemas experimentais para o teste de drogas dirigidas a potenciais alvos químicos (proteínas codificadas pelos genes de interesse de origem humana) no corpo de ratinhos transgénicos. Deve aqui ressalvar-se que nem só os ESTs servem de base para este trabalho: uma estratégia de "tiros no escuro", que pode ser aplicada em organismos-modelo como o ratinho, é a de inactivar genes ao acaso -- mas deixando uma "cicatriz" no cromossoma que facilita o isolamento dos genes inactivados -- para avaliar o (d)efeito funcional de cada evento de inactivação, e dentro dos casos de interesse tentar a correcção terapêutica com drogas-teste. Complementarmente, a indústria farmacêutica tem dado grande impulso aos métodos, colectivamente conhecidos por "química combinatória", de produção de novos compostos químicos obtidos mais ou menos ao acaso. Estas pistas menos "racionais" que o conhecimento do genoma valem sempre pela importância que podem ter para se ganhar a tal corrida...

O genoma humano não é de ninguém

Há duas maneiras de se fazer uma tentativa de apropriação do genoma humano: uma, pelo patenteamento; outra, pela via socio-económica e política.

Para conseguir uma patente é necessário satisfazer 3 critérios: inovação, descoberta e utilidade. No caso do genoma humano, têm-se presenciado extremos de especulação, conduzidos por advogados do lado dos que pretendem o patenteamento, que chegam a parecer ridículos. Esta via de apropriação poderia consumar-se a três níveis:

Patenteamento do mapa físico: está praticamente fora de questão, entre outras razões porque a construção do mesmo está repartida por muitos centros de investigação de genomas: o mapa físico de 2ª geração, datado de 1995, envolvia pelo menos 9 instituições de 4 países. Outro argumento contra reside no facto de não se poder patentear um produto natural sem intervenção humana na sua construção: senão, era como nos tempos em que o facto de se marcar um novo traçado de costa num mapa implicava a crença de posse dessa terra.

Patenteamento de colecções de ESTs: mesmo recusada uma tentativa inicial pelos primeiros implementadores desta tecnologia, e isto após anos de litígio, continuam a candidatar-se novas colecções com o argumento de que há umas melhores que outras para servirem de base a actividades potencialmente lucrativas. Se bem que uma técnica (ou procedimento) que leve à obtenção de colecções de ESTs valiosas pudesse ser patenteada desde que incluisse inovação, as próprias colecções são apenas os produtos do processamento de material natural e é duvidoso que por isso sejam patenteáveis. Mesmo assim, é um debate de desfecho pouco previsível; e entretanto, muitas colecções de ESTs continuam a ser utilizadas apenas no contexto de joint ventures entre os centros de investigação de genomas e a indústria farmacêutica, sem divulgação pública.

Patenteamento do uso dos ESTs: é no campo da utilidade de uma sequência, a qual tem de ser demonstrada pelos estudos funcionais, que reside a ênfase actual nas pretensões de patenteamento -- utilidade para o desenvolvimento de produtos comerciais terapêuticos ou de diagnóstico, e até mesmo no uso académico.

Quanto à apropriação social e política: Lewontin dissecou no seu livro [2] a matéria do potencial para diagnóstico, que reside no DNA, vir a dar azo a usos e abusos preocupantes. A sua argumentação traduz-se nisto: o facto de se conhecerem os genes de um indivíduo não permite deduzir as suas capacidades físicas e mentais, ou os seus padrões de comportamento. E se na comunidade científica mais esclarecida se concorda que não há uma relação «computacional» entre as sequências no DNA e a respectiva expressão ao nível do organismo, são muitos os sectores (nos quais a presença de certos cientistas de grande renome não deixa de ser chocante) que têm uma visão -- simplista -- oposta.

Aqueles que vêem no DNA um dado inapelável sobre a identidade ou capacidades dos indivíduos deveriam meditar sobre as lições da utilização forense das "impressões digitais" do DNA: a falibilidade da identificação pelo DNA só por pouco não conduziu a erros judiciais e deu em retirar a esta fonte de informação, apesar da retórica científica que a rodeava, o poder de prova [6].

E imagine-se como as informações do genoma humano podem servir para aumentar o domínio das instituições sobre os indivíduos: num exemplo dado por Lewontin, empresas obsecadas com a redução dos prémios dos seguros de saúde dos seus empregados gostariam de poder admitir apenas aqueles com uma predisposição física para o tipo de trabalho que lhes vai ser atribuído; nessas empresas, a colheita de sangue dos candidatos seria condição obrigatória, pela necessidade de seleccioná-los com base em sequências de DNA (supostamente) diagnosticantes de aptidões ou incapacidades. Quem por um critério mais ou menos arbitrário fosse considerado incapaz ou inconveniente teria pura e simplesmente de procurar outra profissão: naquela onde procurava não teria nunca aceitação -- isto é, numa sociedade de livre iniciativa e livre concorrência, é-se prisioneiro do seu prórpio DNA!

E isso é defensável aos olhos de muitos, convencidos que estão do determinismo genético da indigência, da homossexualidade, do alcoolismo, da criminalidade e por aí fora -- e que, com a devida correcção genética, os indivíduos nessas condições podem ser "normalizados". Alternativamente, e sempre com base nessas convicções e em função de resultados supostamente científicos que concordam com elas, configurava-se a possibilidade de decretar a esterilização selectiva dos portadores de genes "prejudiciais à sociedade". A questão racial não fica longe disto, como é evidente; segundo as circunstâncias, tempos ou lugares, o DNA de cada indivíduo pode tornar-se a sua própria maldição.

Contrapondo a esta visão pessimista, e também porque me custa a crer que só possam dominar tais correntes de pensamento, refira-se haver quem creia virem as sequências de DNA demonstrar a impossibilidade prática de estabelecer critérios de discriminação, tal é a diversidade genética humana, acentuada por uma miscigenação de já várias gerações, que permeia a maior parte das sociedades industrializadas. O conhecimento do DNA teria assim um papel desmistificador, quando não fosse até "envergonhar" os que sonham com grandes projectos de "limpeza eugénica".

Pessoalmente, duvido que se possa ter um optimismo destes; mas também não gostaria de ver o genoma humano ficar historicamente associado à introdução de práticas discriminatórias. E aqui poria em destaque o papel dos professores de Biologia do ensino secundário: pelo que eu tenho verificado pessoalmente, e acho mereceria ser aprofundado, trata-se de uma classe profissional que, por via de uma formação genética deficiente, da influência dos livros adoptados e leituras mal esclarecidas ou mesmo perniciosas (quantos serão adeptos da sociobiologia?), falta de actualização científica crítica, e (claro!) por inércia, tendem a ser muito permeáveis à noção do determinismo genético dos "males sociais" como verdade indiscutível da Biologia, vitória do conhecimento, etc. -- através deles, e isso acontece já hoje, pode resultar uma sensibilidade dominante na sociedade que seja permissiva a discursos perigosos.

Não é mesmo de ninguém!

Alguém já profetizou que chegaremos ao ponto em que os estudantes de Genética irão admirar-se do tempo em que se investigava nesta área sem dispor de um genoma completo. Mas uma inflexão semântica no título da secção anterior leva à pergunta: quem estará representado na sequência total obtida daqui por uns anos, a que vai servir de protótipo para as investigações e aplicações que se projectam no futuro? Mesmo que mais de 99,7% do meu código nucleotídico seja idêntico ao da sequência-protótipo, restam perto de 9 milhões de nucleótidos (ou, porque eu sou de tipo europeu, aí uns 3 milhões) que serão diferentes. O Projecto de Genoma Humano não diz onde estão as diferenças, não diz sequer se as sequências do cromossoma 1 vêm todas de um mesmo indivíduo! Julga-se que a sequência-protótipo será na realidade um mosaico de sequências, uma manta de retalhos que não é padrão de ninguém, e talvez nem na HUGO saibam dizer qual a origem exacta de todas as sequências que vão estar disponíveis na Internet.

Há outro aspecto que deverá preocupar a comunidade científica a seu devido tempo: cada indivíduo é portador de uma proporção desconhecida de genes menos favoráveis -- que lhe pode, se bem que de maneira muito complexa e essencialmente desconhecida da Ciência actual, condicionar características como a longevidade ou a fertilidade, por exemplo -- constituindo uma "carga genética" que a Natureza distribui (mais ou menos sabiamente) por todos nós. Não se sabe nem o teor nem a localização dessa carga genética em cada indivíduo, nem tão-pouco isso vai ser aparente pelo estudo da sequência-protótipo. Mais ainda, se nessa sequência vai fatalmente haver genes "menos bons", e não se vai saber quais... ficará sempre a noção, muito desconfortável, de que não poderemos saber na maior parte dos genes qual é a variante funcional. Se dum ponto de vista digamos que simbólico até será bom que a sequência-protótipo reflicta a imperfeição que em todos nós reside, é garantido que não é por aí que iriam obliterar-se as possibilidades de apropriação do genoma mencionadas anteriormente.

Numa entrevista recente, Sydney Brenner atreveu a previsão que o "vício" de sequenciar há-de levar aqueles que agora estão envolvidos no Projecto de Genoma Humano e afins a quererem continuar nesta actividade uma vez ele terminado. Para satisfazerem essa pretensão, e dando de barato a necessidade de confirmar sequências para remover erros residuais de sequenciação (que se estimam em 0,03% no caso do genoma da levedura publicado há 1 ano), já se imagina um projecto de construção dum "museu da diversidade genética" humana -- a palavra museu pode causar alguns arrepios -- que catalogue todas as possibilidades de variação (os tais 9 milhões). Até pode dar-se o caso de se chegar à conclusão sobre qual a carga genética existente em cada indivíduo, mas seria melhor nem ir por aí, não fosse dar a tentação a alguém de produzir indivíduos (clones?) geneticamente "purgados". Logo se verá se eles encontrarão como satisfazer o viciozinho.

A Torre de Babel

Se bem que o entusiasmo criado à volta do Projecto de Genoma Humano esteja a vencer as dúvidas e clamores dos Velhos do Restelo, claro está que ninguém deve ignorar a possibilidade de ser um projecto cujos verdadeiros frutos poderão estar para além das nossas forças. Qual Torre de Babel, pode punir os cientistas virando contra eles uma sociedade cada vez mais pressionada pelas duras realidades sócio-económicas. James Neel, um dos principais pioneiros da Genética Humana, chamou recentemente a atenção para a previsão de que dentro de 20 anos a relação população/recursos a nível mundial terá aumentado para o dobro, donde deverá resultar uma radicalização das tensões sociais que hoje testemunhamos. A actividade científica e tecnológica parecerá, pois, cada vez mais contrastante com o que a rodeia -- e é o que a sustenta: se nessa data, doze anos depois de concluído o projecto inicial de sequenciação do genoma humano, ainda não se virem os resultados da "colheita" prometida nos finais dos anos 80, a crise de confiança na Genética e em tudo o que deriva dela promete ser profunda.

Boa parte da despesa em saúde é feita no adiamento da chamada "morte por velhice"; Neel, que não é propriamente um jovem, contrapõe à tendência para alimentar a indústria farmacêutica nessa componente que lhe é extremamente lucrativa, o orientar-se o aproveitamento do genoma humano para áreas de prevenção que contribuam para reduzir o peso da saúde nos orçamentos de todos. Três delas parecem perfeitamente realizáveis e louváveis: o diagnóstico pré-natal de doenças, ou da predisposição para elas, de modo a aumentar a eficiência (e consciência) do aborto eugénico; a terapia genética de doenças adquiridas (por exemplo o cancro), seja pela substituição de genes que lhes conduzem, seja pela introdução de genes correctores dessas doenças; e a prevenção de "doenças da civilização" (hipertensão, obesidade e diabetes obeso, doenças cardiovasculares, asma brônquica intrínseca) pela detecção de predisposições genéticas e aconselhamento sobre o comportamento que evite o seu desenvolvimento.

A quarta, algo quimérica embora, não deixa de ser interessante: determinação de outras interacções, entre os genes do indivíduo e o ambiente em que ele se desenvolve, que levem a uma optimização das suas capacidades físicas e mentais -- por outras palavras, dar a cada indivíduo o ambiente que lhe é ideal... não é isso o que todos nós chamaríamos do melhor dos mundos?

Paulo de Oliveira

Notas:

1. Molecular Cloning. A Laboratory Manual, mais conhecido como "o Maniatis".

2. The Doctrine of DNA (Penguin).

3. Revista Nature de 16 de Dezembro de 1993, pág. 698 (http://www.genethon.fr/).

4. Revista Science de 25 de Outubro de 1996, pág. 540 (http://www.ncbi.nlm.nih.gov/science96/).

5. A base de dados está centralizada no URL http://gdbwww.gdb.org/, com mirror mais perto de nós em França (http://gdb.infobiogen.fr/). Há que destacar ainda a dbEST (http://genome.wustl.edu/est/) e o sistema GeneQuiz (http://www.embl-heidelberg.de/~genequiz/) de análise de sequências. Estas e outras páginas da World Wide Web estão profusamente interligadas e procuram não ser demasiado herméticas, se bem que estejam concebidas para uso profissional. Expressamente para efeitos de introdução é de recomendar o URL http://www.sciencemag.org/science/feature/data/genomebase.shl.

6. Hoje procura-se reabilitar cientificamente este método, escudando-o das armadilhas iniciais de uma aplicação cega da teoria existente.