A OpenAI anunciou o desenvolvimento de um grande modelo de linguagem chamado GPT-Rosalind, treinado especificamente em fluxos de trabalho comuns de biologia. O modelo, batizado em homenagem à bióloga Rosalind Franklin, representa uma abordagem especializada para análise de dados biológicos, distinguindo-o de modelos mais genéricos normalmente empregados por grandes empresas de tecnologia.
Yunyun Wang, líder de produto de ciências biológicas da OpenAI, afirmou que o GPT-Rosalind aborda obstáculos significativos na pesquisa em biologia. O primeiro desafio surge dos vastos conjuntos de dados produzidos por décadas de sequenciamento do genoma e bioquímica de proteínas. O segundo desafio envolve a especialização dos vários subcampos da biologia, cada um caracterizado por técnicas únicas e jargões específicos.
Por exemplo, os geneticistas podem encontrar dificuldades em navegar na extensa literatura neurobiológica relacionada com genes específicos activos nas células cerebrais. Wang observou que a OpenAI treinou GPT-Rosalind em 50 dos fluxos de trabalho biológicos mais comuns e no acesso aos principais bancos de dados públicos de informações biológicas.
O modelo está equipado para sugerir possíveis caminhos biológicos e priorizar alvos de medicamentos. “Estamos conectando genótipo ao fenótipo através de vias conhecidas e mecanismos reguladores, inferindo prováveis propriedades estruturais ou funcionais das proteínas e realmente aproveitando esse entendimento mecanicista”, disse Wang.








