Mais de 160 mil novos vírus descobertos pela IA: o que isso significa para a ciência?
A inteligência artificial consegue a maior descoberta de novas espécies de vírus, lançando luz sobre a virosfera oculta que vive em todos os cantos do planeta.
Eles descobrem 161.979 novas espécies de vírus RNA (vírus que usam ácido ribonucleico (RNA) como material genético, ou que requerem RNA em seu processo de replicação) graças a uma ferramenta de aprendizado de máquina.
O estudo, publicado na Cell e realizado por uma equipe internacional de pesquisadores, é o maior trabalho de descoberta de espécies de vírus já publicado. Segundo os autores, isso melhorará muito a caracterização da vida na Terra e poderá ajudar a identificar muitos milhões de vírus a mais não identificados.
O autor principal, Professor Edwards Holmes, da Faculdade de Medicina e Saúde da Universidade de Sydney, disse: “Foi-nos oferecida uma janela para uma parte da vida na Terra que de outra forma estaria oculta, revelando uma biodiversidade extraordinária”.
“Este é o maior número de novas espécies de vírus descobertas em um único estudo, expandindo enormemente o nosso conhecimento sobre os vírus que vivem entre nós”, disse Holmes. “Descobrir tantos vírus novos de uma só vez é alucinante e apenas arranha a superfície, abrindo um mundo de descobertas. Há outros milhões para descobrir, e podemos aplicar esta mesma abordagem à identificação de bactérias e parasitas”.
Vírus em ambientes múltiplos e variáveis no planeta Terra
Embora os vírus RNA estejam frequentemente associados a doenças humanas, também são encontrados em ambientes extremos em todo o mundo e podem até desempenhar papéis importantes nos ecossistemas globais. Neste estudo foram encontrados vivendo na atmosfera, em fontes termais e em fontes hidrotermais.
“O fato de ambientes extremos albergarem tantos tipos de vírus é apenas mais um exemplo da sua extraordinária diversidade e tenacidade em viver nos ambientes mais hostis, o que poderá dar-nos pistas sobre como surgiram os vírus e outras formas de vida elementares.”
Como funcionou a ferramenta de IA para identificar novos vírus
Os pesquisadores criaram um algoritmo de aprendizagem profunda, chamado LucaProt, para computar grandes quantidades de dados de sequência genética, incluindo longos genomas de vírus de até 47.250 nucleotídeos e informações genômicas complexas para descobrir mais de 160.000 vírus.
“A grande maioria destes vírus já tinha sido sequenciada e aparecia em bases de dados públicas, mas eram tão divergentes que ninguém sabia o que eram”, explicou Holmes. “Eles constituíram o que muitas vezes é chamado de ‘matéria escura’ das sequências. “Nosso método de IA foi capaz de organizar e classificar todas essas informações díspares, lançando luz sobre o significado dessa matéria escura pela primeira vez.”
A ferramenta de IA foi treinada para calcular a matéria escura e identificar vírus com base nas sequências e estruturas secundárias da proteína que todos os vírus RNA usam para se replicar. Desta forma, a descoberta de vírus poderia ser consideravelmente acelerada, algo que demoraria muito se fossem utilizados métodos tradicionais.
O professor Mang Shi, coautor do estudo, disse: “Anteriormente, dependíamos de procedimentos tediosos de bioinformática para descobrir vírus, o que limitava a diversidade que poderíamos explorar. Agora temos um modelo baseado em IA muito mais eficaz, que oferece sensibilidade e especificidade excepcionais, ao mesmo tempo que nos permite aprofundar a diversidade viral. “Planejamos aplicar este modelo a diversas aplicações.”
O professor Holmes acrescentou: “O próximo passo natural é treinar o nosso método para encontrar ainda mais desta incrível diversidade, e quem sabe que surpresas adicionais nos aguardam.”
Referência de notícias:
Hou, Xin et al. Using artificial intelligence to document the hidden RNA virosphere. Cell. DOI: 10.1016/j.cell.2024.09.027