Use este identificador para citar ou linkar para este item: https://repository.ufrpe.br/handle/123456789/3959
Título: Tratamento de Kernels incompletos em redes bipartidas na predição de interações em redes biológicas
Autor: Bastos, Tássia Laís Barros
Endereco Lattes do autor: http://lattes.cnpq.br/2065961687962702
Orientador: Nascimento, André Câmara Alves do
Endereco Lattes do orientador : http://lattes.cnpq.br/0622594061462533
Palavras-chave: Multiple Kernel Learning;Farmacovigilância;Aprendizado do computador;Dados biológicos
Data do documento: 30-Out-2020
Citação: BASTOS, Tássia Laís Barros. Tratamento de Kernels incompletos em redes bipartidas na predição de interações em redes biológicas. 2020. 75 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Departamento de Computação, Universidade Federal Rural de Pernambuco, Recife, 2020.
Abstract: In the last decade, the study of pharmacological networks has received a lot of attention given its relevance to the production of new drugs. The studies were made possible by the large volume of biological data generated, making it possible to understand and extract knowledge from them. However, although interesting, this is a process that brings with it some barriers in terms of viability, particularly when the data appear heterogeneously and contain missing information. Many different approaches for predicting biological interactions have been proposed, especially in the area of multiple kernel learning (Multiple Kernel Learning (MKL). The use of MKL methods in biological data is also compromised by the heterogeneity of data sources, but associated with the methods, techniques for complementing missing values in the base kernel matrices can be used, this filling process is usually done with simple techniques, such as imputing zeroes, mean and median of the matrix. In this work, techniques for handling false values were evaluated in the context of bipartite networks to solve the limitations related to the heterogeneity of the data. We used three single value imputation techniques (mean, median and zero) and a more complex predictive imputation technique (SVD). All the aforementioned techniques have already been used for matrix completeness in the context of unipartite networks. Our analyzes showed that the SVD technique performed much better than the other techniques in evaluative metrics, bringing encouraging results for the use of the technique in models that use bipartite networks. The average and median techniques showed similar performances, but lower than the SVD. And filling with zero showed the worst performance in relation to all other applied techniques.
Resumo: Na última década, o estudo de redes farmacológicas recebeu bastante atenção dada sua relevância para a produção de novos medicamentos. Os estudos foram propiciados mediante ao grande volume de dados biológicos gerados, possibilitando entender e extrair conhecimento em cima deles. Contudo, apesar de interessante, este é um processo que traz consigo algumas barreiras no quesito viabilidade, particularmente quando os dados aparecem de forma heterogênea e contêm informações ausentes. Muitas abordagens distintas para predição de interações biológicas vêm sendo propostas, com destaque para a área de aprendizagem de múltiplos kernels Multiple Kernel Learning (MKL). O uso de métodos MKL em dados de natureza biológica também são comprometidos pela heterogeneidade das fontes de dados, mas associados aos métodos podem ser utilizadas técnicas de complementação de valores ausentes nas matrizes de kernel base. Esse processo de preenchimento geralmente é feito com técnicas simples, como imputação de zeros, média e mediana da matriz. Neste trabalho, técnicas de tratamento de valores faltosos foram avaliadas no contexto de redes bipartidas para solucionar as limitações relativas a heterogeneidade dos dados. Utilizamos três técnicas de imputação de valor único (média, mediana e zero) e uma técnica mais complexa de imputação preditiva (SVD). Todas as técnicas citadas já foram utilizadas para completude de matrizes no contexto de redes unipartidas. Nossas análises demonstraram que a técnica SVD apresentou um desempenho muito superior comparada às demais técnicas nas métricas avaliativas, trazendo resultados expressivos neste domínio para a utilização da técnica em modelos que utilizam redes bipartidas. As técnicas média e mediana apresentaram desempenhos similares, porém inferiores à SVD. E o preenchimento com zero apresentou o pior desempenho em relação a todas as outras técnicas aplicadas.
URI: https://repository.ufrpe.br/handle/123456789/3959
Aparece nas coleções:TCC - Bacharelado em Ciência da Computação (Sede)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
tcc_tassialaisbarrosbastos.pdf1,95 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.