Use este identificador para citar ou linkar para este item:
https://repositorio.pucgoias.edu.br/jspui/handle/123456789/8788
Tipo: | Trabalho de Conclusão de Curso |
Título: | Desenvolvimento de um pipeline de bioinformática para análise de redes de co-expressão gênica com dados públicos de sequenciamento: estudo de caso com Spodoptera frugiperda (J. E. Smith, 1797) |
Autor(es): | Santos, David Daniel Ferreira dos |
Primeiro Orientador: | Telles, Mariana Pires de Campos |
metadata.dc.contributor.advisor-co1: | Dias, Renata de Oliveira |
metadata.dc.contributor.referee1: | Carvalho, Larissa Resende |
Resumo: | Com a crescente redução nos custos de sequenciamento de nucleotídeos, a disponibilidade de dados oriundos de trabalhos de RNA-seq em bancos de dados públicos vem crescendo exponencialmente. No entanto, ainda são poucos os trabalhos que exploram esses recursos, principalmente, pensando em abordagens integrativas, tais como a predição de redes de co-expressão gênica. Diante disso, este trabalho propôs a elaboração de um pipeline de Bioinformática para a obtenção, filtragem e análise de dados de RNA-seq publicamente disponíveis no banco de dados SRA do NCBI para a predição de redes de co-expressão gênica, utilizando a espécie Spodoptera frugiperda como modelo, dada sua relevância como praga agrícola de grande impacto para a agricultura brasileira. Por meio desse pipeline, 839 conjuntos de dados foram obtidos do banco de dados do SRA e submetidos a uma série de filtros, para a remoção de sequências e conjuntos de dados de baixa qualidade ou apresentando riscos de contaminação, após os quais foram selecionados 641 conjuntos de dados. Além desses filtros, precisaram ser removidos das análises 339 conjuntos de dados sem metadados informando o tecido ou a fase de vida do inseto amostrado. Por fim, 10 condições foram selecionadas por conterem mais do que 12 amostras cada, resultando em um total de 276 amostras sendo de fato incorporadas nas análises de co-expressão. Nas análises de WGCNA, sete módulos de co-expressão foram preditos, incluindo um módulo composto por genes mais expressos em média no intestino e corpo inteiro de larvas de S. frugiperda. Nossos resultados demonstram que é possível utilizar dados públicos de sequenciamento de RNA para predizer redes de co-expressão e propõe um pipeline para a filtragem das sequências, seleção das amostras e análise desses dados. Por fim, ressalta-se a importância da disponibilização e a completa descrição desses conjuntos de dados em bancos de dados públicos, tais como SRA, para o seu uso em abordagens integrativas tais como a utilizada neste trabalho. |
Abstract: | As the costs associated with nucleotide sequencing have decreased, the quantity of data available from RNA-seq work in public databases has increased exponentially. However, there are still few studies that exploit these resources, especially when considering integrative approaches such as predicting gene co-expression networks. In light of the aforementioned considerations, this work proposed the development of a Bioinformatics pipeline for obtaining, filtering and analyzing RNA-seq data publicly available in the NCBI SRA database for the prediction of gene co-expression networks, using the Spodoptera frugiperda species as a model, given its relevance as an agricultural pest with a major impact on Brazilian agriculture. Through this pipeline, 839 datasets were obtained from the SRA database and subjected to a series of filters to remove sequences and datasets of low quality or presenting risks of contamination, after which 641 datasets were selected. In addition to these filters, 339 datasets without metadata informing the tissue or life stage of the insect sampled had to be removed from the analysis. Finally, 10 conditions were selected because they contained more than 12 samples each, resulting in a total of 276 samples actually being incorporated into the co-expression analyses. In the WGCNA analyses, seven co-expression modules were predicted, including a module composed of genes most expressed on average in the gut and whole body of S. frugiperda larvae. Our results demonstrate that it is possible to use public RNA sequencing data to predict co-expression networks and propose a pipeline for filtering sequences, selecting samples and analyzing these data. Finally, we emphasize the importance of making these datasets available and fully describing them in public databases, such as SRA, for their use in integrative approaches such as the one used in this work. |
Palavras-chave: | Pragas agrícolas Inseto Biologia de sistemas Genômica funcional RNA-seq |
CNPq: | CNPQ::CIENCIAS BIOLOGICAS::GENETICA |
Idioma: | por |
País: | Brasil |
Editor: | Pontifícia Universidade Católica de Goiás |
Sigla da Instituição: | PUC Goiás |
metadata.dc.publisher.department: | Escola de Ciências Médicas e da Vida |
Tipo de Acesso: | Acesso Aberto |
URI: | https://repositorio.pucgoias.edu.br/jspui/handle/123456789/8788 |
Data do documento: | 3-Dez-2024 |
Aparece nas coleções: | TCC Ciências Biológicas - Bacharelado |
Arquivos associados a este item:
Arquivo | Tamanho | Formato | |
---|---|---|---|
David Daniel - TCC - 17-12-2024.pdf | 2,63 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.
Ferramentas do administrador