Use este identificador para citar ou linkar para este item:
https://repository.ufrpe.br/handle/123456789/5409
Título: | Métodos computacionais para a análise de dados de expressão gênica provenientes de uma análise de microarray utilizada para teste farmacológico |
Autor: | Costa, Allan Mesquita da |
Endereco Lattes do autor: | http://lattes.cnpq.br/2703136397519338 |
Orientador: | Melo, Jeane Cecília Bezerra de |
Endereco Lattes do orientador : | http://lattes.cnpq.br/8499459630583005 |
Co-orientador : | Costa, Luciana Amaral de Mascena |
Endereço Lattes do Co-orientador : | http://lattes.cnpq.br/2352032088330896 |
Palavras-chave: | Análise em microsséries;Bioinformática;Análise de dados |
Data do documento: | 28-Abr-2023 |
Citação: | COSTA, Allan Mesquita da. Métodos computacionais para a análise de dados de expressão gênica provenientes de uma análise de microarray utilizada para teste farmacológico. 2023. 48 f. Trabalho de Conclusão de Curso (Bacharelado em Ciências da Computação) – Departamento de Computação, Universidade Federal Rural de Pernambuco, Recife, 2023. |
Abstract: | The advent of the Human Genome Project (HGP), completed in October 2003, propelled the development of techniques for obtaining and analyzing biological data. The need to manage the vast amount of digital genome data was a decisive factor in the growth of a multidisciplinary area of knowledge, Computational Biology. In the two decades following the completion of the HGP, genomes of different organisms were obtained. Regarding mammals, projects such as the 1000 Genomes Project and the Cancer Genome Atlas (TCGA) illustrated the advancement of knowledge in the analysis of complex data. Among the newest techniques, we highlight Microarrays. They provide a significant amount of data in a single experiment, allowing the comparison of complete genomes. The analysis of Microarray data is relatively complex and requires protocols that make this analysis simpler, producing more understandable information. The present study involves the use of computational methods to analyze gene expression data obtained from a Microarray experiment used for pharmacological testing related to breast cancer. To process the raw data, obtained from a spreadsheet containing more than 3216 genes resulting from a Microarray analysis, a script was developed to facilitate the extraction of information from this data and subsequent selection of genes of interest. The program allowed the search for genes involved in the processes of cell death (apoptosis, necrosis, and autophagy), which are determining factors in the success analysis of the tested drug. To categorize the genes involved in the apoptotic, necrotic, and autophagic death cascade, heatmaps were constructed from fold-change values (difference in gene expression for values before and after treatment of cancerous cells with the mesoionic compound), using k-means clustering and hierarchical clustering techniques provided in the Heatmapper program. Results of the study include the development of a script in the R program that resulted in the separation of 20 genes involved in the apoptotic death cascade, six involved in the autophagic death, and seven involved in the necrotic death cascade, as well as the development of three heatmaps, contributing to the biological analysis of data, in addition to making Microarray data processing more accessible. |
Resumo: | O advento do Projeto Genoma Humano (PGH), finalizado em outubro de 2003, impulsionou o desenvolvimento de técnicas para obtenção e análise de dados biológicos. A necessidade de gerenciar o grande volume de dados do genoma digital foi um fator determinante no crescimento de uma área de conhecimento multidisciplinar, a Biologia Computacional. Nas duas décadas subsequentes à finalização do PGH, genomas de diferentes organismos foram obtidos. Em relação aos mamíferos, projetos tais como o 1000 Genomes Project e o Cancer Genome Atlas (TCGA) ilustraram o avanço de conhecimento na análise de dados complexos. Dentre as técnicas mais recentes, destacamos os Microarrays. Estes fornecem uma quantidade significativa de dados em um único experimento, permitindo a comparação de genomas completos. A análise de dados de Microarray é relativamente complexa e demanda por protocolos que tornem esta análise mais simples, produzindo informações mais compreensíveis. O presente estudo compreende a utilização de métodos computacionais para analisar dados de expressão de gênica obtidos de um experimento de Microarray utilizado para teste farmacológico relativos ao câncer de mama. Para o processamento dos dados brutos, obtidos de uma planilha contendo mais de 3216 genes resultantes de uma análise de Microarray, foi desenvolvido um script visando facilitar a extração de informação a partir destes dados e posterior seleção dos genes de interesse. O programa possibilitou a busca dos genes envolvidos nos processos de morte celular (apoptose, necrose e autofagia), os quais são fatores determinantes na análise de sucesso do fármaco testado. Para a categorização dos genes envolvidos na cascata de morte apoptótica, necrótica e autofágica, foram construídos heatmaps a partir dos valores dos níveis de expressão chamados de fold-change diferença da expressão gênica para os valores antes e depois do tratamento das células cancerígenas com o composto mesoiônico), utilizando técnicas de clusterização k-means e clusterização hierárquica disponibilizadas no programa Heatmapper. Como resultados do foi desenvolvido um script no programa R que resultou na separação de 20 genes envolvidos na cascata de morte de morte apoptótica, seis envolvidos na morte autofágica e 7 envolvidos na morte necrótica, além do desenvolvimento de 3 Heatmaps, contribuindo para a análise biológica dos dados, além de tornar mais acessível o processamento dos dados de Microarray. |
URI: | https://repository.ufrpe.br/handle/123456789/5409 |
Aparece nas coleções: | TCC - Bacharelado em Ciência da Computação (Sede) |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
tcc_allanmesquitadacosta.pdf | 1,3 MB | Adobe PDF | Visualizar/Abrir |
Este item está licenciada sob uma Licença Creative Commons