Mostrar registro simples

dc.contributor.advisorGrisci, Bruno Iochinspt_BR
dc.contributor.authorFerreira, Wagner Gomespt_BR
dc.date.accessioned2026-01-30T08:03:03Zpt_BR
dc.date.issued2025pt_BR
dc.identifier.urihttp://hdl.handle.net/10183/300944pt_BR
dc.description.abstractA interpretação biológica de genes associados ao câncer é desafiadora devido à complexidade molecular e à necessidade de integrar dados genômicos, literatura científica e conhecimento biomédico estruturado. Neste trabalho, foi investigado o uso de Grandes Modelos de Linguagem (LLMs) combinados com recuperação automática de evidências biomédicas para inferir a classe tumoral mais associada a cada gene. A metodologia envolveu a seleção de genes a partir de dados de microarranjo, a busca de subtipos tumorais por meio da ontologia MONDO e a recuperação de artigos relevantes no PubMed. Os resumos dos artigos foram utilizados como contexto para os LLMs realizarem as classificações. Os resultados indicam que, embora os modelos apresentem potencial como ferramenta auxiliar, LLMs genéricos tendem a superestimar associações gene–câncer, evidenciando limitações relacionadas à falta de especialização biomédica e apontando a necessidade de abordagens mais específicas para esse domínio.pt_BR
dc.description.abstractThe biological interpretation of cancer-associated genes is challenging due to molecular complexity and the need to integrate genomic data, scientific literature, and structured biomedical knowledge. This work investigated the use of Large Language Models (LLMs) combined with automatic retrieval of biomedical evidence to infer the tumor class most associated with each gene. The methodology involved selecting genes from microarray data, searching for tumor subtypes using the MONDO ontology, and retrieving relevant articles from PubMed. Article abstracts were used as context for the LLMs to perform the classifications. The results indicate that, although the models show potential as an auxiliary tool, generic LLMs tend to overestimate gene-cancer associations, highlighting limitations related to a lack of biomedical specialization and pointing to the need for more specific approaches in this domain.en
dc.format.mimetypeapplication/pdfpt_BR
dc.language.isoporpt_BR
dc.rightsOpen Accessen
dc.subjectBioinformáticapt_BR
dc.subjectMicroarrayen
dc.subjectFeature selectionen
dc.subjectModelos de linguagem de grande escalapt_BR
dc.subjectAprendizado de máquinapt_BR
dc.subjectGene selectionen
dc.subjectOntologiaspt_BR
dc.subjectGeração aumentada por recuperaçãopt_BR
dc.titleInferência da relevância de genes em classes de câncer usando LLMs aumentados por recuperação de evidência biomédicapt_BR
dc.title.alternativeInferring the relevance of genes in cancer classes using LLMs enhanced by biomedical evidence retrieval en
dc.typeTrabalho de conclusão de graduaçãopt_BR
dc.contributor.advisor-coFeltes, Bruno Césarpt_BR
dc.identifier.nrb001300529pt_BR
dc.degree.grantorUniversidade Federal do Rio Grande do Sulpt_BR
dc.degree.departmentInstituto de Informáticapt_BR
dc.degree.localPorto Alegre, BR-RSpt_BR
dc.degree.date2025pt_BR
dc.degree.graduationCiência da Computação: Ênfase em Ciência da Computação: Bachareladopt_BR
dc.degree.levelgraduaçãopt_BR


Thumbnail
   

Este item está licenciado na Creative Commons License

Mostrar registro simples