Please use this identifier to cite or link to this item: http://hdl.handle.net/1843/35060
Type: Dissertação
Title: Plant co-expression annotation resource 2.0: uma ferramenta web para a associação de proteínas de função desconhecida a estresses abióticos em plantas
Other Titles: Plant co-expression annotation resource 2.0: a web tool for associating proteins of unknown function to abiotic stresses in plants
Authors: Marcos José Andrade Viana
First Advisor: Maurício de Alvarenga Mudadu
First Co-advisor: Francisco Pereira Lobo
metadata.dc.contributor.advisor-co2: Adhemar Zerlotini Neto
First Referee: José Miguel Ortega
Second Referee: Roberto Willians Noda
Abstract: O desenvolvimento de culturas geneticamente modificadas (GM) inclui a descoberta de genes candidatos através de análises de bioinformática, usando dados genômicos, expressão gênica, entre outros. As proteínas de função desconhecida (PFD) são alvos interessantes para pipelines de culturas GM devido a novidade associada a esses alvos e também para evitar proteções de direitos autorais. Um método para inferir a possível função das PFD é relacioná-las a fatores de interesse, como estresses abióticos, usando redes de ortologia e coexpressão, aplicando a abordagem de culpa por associação. O objetivo desse trabalho é desenvolver e disponibilizar a versão 2 da ferramenta PlantAnnot (PlantAnnot2) e o objetivo do PlantAnnot2 é a descoberta de PFD envolvidas em respostas a estresses abióticos em plantas. Para isso, foram processados dados genômicos de 67 plantas, com algumas importantes espécies tolerantes a stresses abióticos. Os softwares Diamond e InterproScan foram usados para descobrir PFDs em todas as plantas. Dados de expressão gênica (RNA-seq) relacionados a estresses abióticos foram baixados do NCBI / GEO e usados no software LSTrAP para construir clusters de coexpressão cujos membros estão mais provavelmente relacionados aos mecanismos moleculares associados ao estresse abiótico em plantas. Grupos de ortólogos foram criados com OrthoFinder, depois foram buscadas PFDs associadas a esses grupos de ortólogos e também a clusters de coexpressão simultâneamente. Como resultado, foram armazenados no Machado 2.136.336 genes e 2.714.161 mRNA, juntamente com suas proteínas traduzidas. Recuperados 78.416 PFDs com as análises de Diamond e Interproscan, criados 91.172 grupos de ortólogos e 1.975 clusters de coexpressão. Foi desenvolvido um protocolo para busca de anotações de PFDs, que recupera PFDs que pertençam a algum grupo de ortólogos que contenha também proteínas cujo mRNA faz parte de clusteres de coexpressão relacionados à estresses abióticos. Dessa forma, foram recuperadas s 4.673 PFDs, na versão 1 do sistema tinha sido 1.364 PFDs. Foi realizado uma pesquisa bibliográfica sobre as proteínas que pertencem aos grupos ortólogos, para todos os PFDs pertencentes às espécies Pearl millet(Cenchrus americanus), Populus simonii, Oropethium thomaeum e Boea hygrometrica, todos conhecidos por serem tolerantes a estresses abiótico (517 PFDs). Encontrados estudos relacionados a estresses abióticos, em média, para 67,5% das PFDs, na versão 1 do sistema o percentual era de 35%. Um servidor web https://www.machado.cnptia.embrapa.br/plantannot2 está disponível gratuitamente e fornece consultas indexadas de PFDs possivelmente associadas a estresses abióticos. Espera-se que o PlantAnnot2 seja útil para pesquisadores que buscam obter genes relacionados a respostas a estresses abióticos para a produção de novos cultivos GM tolerantes aos riscos das mudanças climáticas.
Abstract: The development of genetically modified (GM) crops includes the discovery of candidate genes through bioinformatics analysis, using genomic data, gene expression, among others. Proteins of unknown function (PUF) are interesting targets for GM crop pipelines due to the novelty associated with these targets and also to avoid copyright protections. One method to infer the possible function of PUF is to relate them to factors of interest, such as abiotic stresses, using orthology and coexpression networks, applying the guilt by association approach. The objective of this work is to develop and make available version 2 of the PlantAnnot tool (PlantAnnot2) and the objective of PlantAnnot2 is the discovery of PFD involved in responses to abiotic stresses in plants. For that, genomic data from 67 plants were processed, with some important species tolerant to abiotic stresses. Diamond and InterproScan software were used to discover PUF in all plants. Gene expression data (RNA-seq) related to abiotic stresses were downloaded from NCBI / GEO and used in the LSTrAP software to build coexpression clusters whose members are most likely related to the molecular mechanisms associated with abiotic stress in plants. Groups of orthologous were created with OrthoFinder, then PUF associated with these groups of orthologous and also with coexpression clusters were searched simultaneously. As a result, 2,136,336 genes and 2,714,161 mRNA were stored in Machado, along with their translated proteins. 78,416 PUF were recovered with Diamond and Interproscan analyzes, 91,172 groups of orthologous and 1,975 coexpression clusters were created. A protocol for searching PUF annotations was developed, which retrieves PUF that belong to a group of orthologous that also contain proteins whose mRNA is part of coexpression clusters related to abiotic stresses. Thus, 4,673 PUF were recovered, in version 1 of the system it had been 1,364 PUF. A bibliographic search was carried out on proteins belonging to orthologous groups, for all PUF belonging to the species Pearl millet (Cenchrus americanus), Populus simonii, Oropethium thomaeum and Boea hygrometrica, all known to be tolerant to abiotic stresses (517 PUF). Studies related to abiotic stresses were found, on average, for 67.5% of PUF, in version 1 of the system the percentage was 35%. A web server https://www.machado.cnptia.embrapa.br/plantannot2 is available for free and provides indexed queries for PUF possibly associated with abiotic stresses. PlantAnnot2 is expected to be useful for researchers looking to obtain genes related to responses to abiotic stresses for the production of new GM crops tolerant to the risks of climate change.
Subject: Biologia computacional
Sistemas computacionais
Organismos geneticamente modificados
Estresse fisiológico
Plantas
language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal de Minas Gerais
Publisher Initials: UFMG
metadata.dc.publisher.department: ICB - INSTITUTO DE CIÊNCIAS BIOLOGICAS
metadata.dc.publisher.program: Programa de Pós-Graduação em Bioinformatica
Rights: Acesso Aberto
URI: http://hdl.handle.net/1843/35060
Issue Date: 25-Jan-2021
Appears in Collections:Dissertações de Mestrado

Files in This Item:
File Description SizeFormat 
Dissertação_MarcosViana_VerFinal.pdfDissertação2.66 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.