Use este identificador para citar ou linkar para este item: https://repository.ufrpe.br/handle/123456789/5711
Título: Avaliação de métodos de imputação de valores ausentes para a predição de interações fármaco-proteína
Autor: Santos, Victor Vidal dos
Endereco Lattes do autor: http://lattes.cnpq.br/7999257997046465
Orientador: Nascimento, André Câmara Alves do
Endereco Lattes do orientador : http://lattes.cnpq.br/0622594061462533
Palavras-chave: Aprendizado do computador;Interações fármaco-nutrientes;Proteínas;Dados biológicos;Multiple Kernel Learning
Data do documento: 8-Mar-2024
Citação: SANTOS, Victor Vidal dos. Avaliação de métodos de imputação de valores ausentes para a predição de interações fármaco-proteína. 2024. 26 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Departamento de Computação, Universidade Federal Rural de Pernambuco, Recife, 2024.
Abstract: In the last decade, the study of pharmacological networks has received a lot of attention given its relevance drug discovery process. Many different approaches for predicting biological interactions have been proposed, especially in the area of multiple kernel learning (MKL). Such methods comprise integrative approaches that can handle heterogeneous data sources, but suffer from the missing data problem. Techniques to handle missing values in the base kernel matrices can be used, usually based on simple techniques, such as imputing zeroes, mean and median of the matrix. In this work, techniques for handling missing values were evaluated in the context of bipartite networks. Our analyzes showed that the, depending on the amount of missing data, k-NN and SVD technique performed much better than the other techniques, bringing encouraging results, while zero-fill showed the worst performance in relation to all other evaluated methods.
Resumo: Na última década, o estudo de redes farmacológicas tem recebido muita atenção devido à sua relevância no processo de descoberta de medicamentos. Muitas abordagens diferentes para prever interações biológicas têm sido propostas, especialmente na área de aprendizado de múltiplos kernels (MKL). Tais métodos compreendem abordagens integrativas que podem lidar com fontes de dados heterogêneas, mas sofrem com o problema de dados incompletos. Técnicas para lidar com valores faltosos nas matrizes kernel base podem ser utilizadas, geralmente baseadas em técnicas simples, como imputação de zeros, média e mediana da matriz. Neste trabalho, foram avaliadas técnicas de tratamento de valores faltosos no contexto de redes bipartidas. Nossas análises mostraram que, dependendo da quantidade de dados faltantes, a técnica k-NN e SVD teve um desempenho muito melhor do que as outras técnicas, trazendo resultados animadores, enquanto o preenchimento zero apresentou o pior desempenho em relação a todos os outros métodos avaliados
URI: https://repository.ufrpe.br/handle/123456789/5711
Aparece nas coleções:TCC - Bacharelado em Ciência da Computação (Sede)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
tcc_victorvidaldossantos.pdf580,73 kBAdobe PDFVisualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons