Uma inteligência artificial resolveu o enigma do código de ativação de DNA

Os pesquisadores da Universidade da Califórnia em San Diego utilizaram a inteligência artificial para identificar um código de ativação de DNA, que antes era conhecido como “um enigma”, mas que mais tarde pode ser utilizado em  biotecnologia e aplicações biomédicas.

Uma inteligência artificial resolveu o enigma do código de ativação de DNA
Foto: (reprodução/internet)

Os cientistas sabem há muito tempo que os genes humanos são identificados por instruções entregues pela ordem precisa do DNA e vinculados a quatro “bases”, que são codificadas como A, C, G e T. O artigo foi publicado na revista Nature em 9 de setembro.

Quase 25% dos genes são identificados pela sequência TATAAA também chamada de caixa TATA, enquanto os 75% restantes permaneceram pouco claros devido ao enorme número de possibilidades da sequência de base de DNA.

Entretanto, os pesquisadores agora encontraram um código de ativação para ajudar a identificar estes genes. O Centro de Notícias da UC San Diego informou que é chamado de região promotora do Núcleo Downstream (DPR).

A Divisão de Ciências Biológicas da UC San Diego, Professor James T. Kadonaga, que também é o autor sênior do artigo, disse que a identificação DPR é um passo fundamental na ativação de até um terço dos genes humanos.

“O DPE tem sido um enigma – tem sido controverso se ele existe ou não em humanos”, disse Kadonaga acrescentando que eles usaram inteligência artificial e aprendizagem de máquinas para “resolver este enigma”.

Em 1996, o Prof. Kadonaga e seus colegas trabalhando com moscas da fruta encontraram uma nova sequência de ativação de genes, que eles chamaram de DPE. Ela é derivada de uma parte do DPE, que permitiu que os genes fossem ativados mesmo sem a caixa TATA.

Em 1997, eles também encontraram uma única sequência semelhante ao DPE em humanos. Entretanto, eles não tiveram sucesso em decifrar os detalhes e a frequência do PED humano.

Após cerca de 23 anos, Kadonaga trabalhou com o autor principal e pós-doutorando Long Vo Ngoc, Cassidy Yunjing Huang, Claudia Medrano, e Jack Cassidy, um cientista da computação aposentado que ajudou a alavancar as ferramentas de inteligência artificial.

Este estudo foi apoiado pelo Instituto Nacional de Ciências Médicas Gerais.

Atingindo resultados “absurdamente bons”

Neste estudo, os pesquisadores fizeram um pool de 500.000 versões de sequências aleatórias de DNA, que Kadonaga descreve como “computação bastante séria”. 

Eles analisaram cada atividade de DPR e usaram 200.000 versões para criar um modelo de aprendizagem de máquina que pudesse prever a atividade de DPR no DNA humano com tal precisão.

Kadonaga descreveu os resultados como “absurdamente bons”, pois criaram um modelo similar de aprendizagem de máquina para identificar sequências de caixa TATA de uma nova maneira. Depois de avaliar os novos modelos em milhares de casos de teste, os resultados da caixa TATA e do DPR mostraram uma capacidade de previsão “incrível”.

Os resultados também revelaram que os genes humanos têm um fator de DPR. Embora a identificação de seis bases na caixa TATA fosse bastante simples, quebrar o código de 19 bases para o DPR foi muito mais difícil.

Kadonaga explicou que isto se devia ao fato de não haver um padrão de sequência clara, de modo que o DDP não podia ser encontrado. O professor disse que era como ter informações criptografadas na sequência de DNA que os humanos não podem decifrar, mas o modelo de aprendizagem da máquina pode.

“Muitas coisas que não são explicadas agora poderiam ser explicadas”, disse ele acrescentando que a inteligência artificial pode ser mais utilizada para analisar os padrões de sequência de DNA para aumentar a capacidade dos pesquisadores de entender e controlar a ativação do gene da célula humana.

Traduzido e adaptado por equipe Revolucao.etc.br

Fontes: Tech Times, Phys, Daily Star, Nature