Functional impact of polymorphic inversions in the human genome

Author

Oliva Pavia, Meritxell

Director

Cáceres Aguilar, Mario

Date of defense

2014-11-21

ISBN

9788449050671

Legal Deposit

B-8059-2015

Pages

263 p.



Department/Institute

Universitat Autònoma de Barcelona. Departament de Genètica i de Microbiologia

Abstract

Una inversió és una reordenació genòmica que altera l'orientació d'una seqüència genòmica específica. Les inversions són reordenaments balancejats i no impliquen necessàriament un guany o pèrdua d'ADN, però tot i així poden alterar el contingut genètic original i causar-hi mutacions. A més, les inversions poden modificar els patrons de recombinació d’ADN tan de la seqüència genòmica continguda en la inversió com també en regions flanquejants. Conseqüentment, les inversions poden estar associades a certs fenotips o malalties, influir en l’evolució dels individus portadors a través de processos adaptatius o jugar un paper clau en l’origen de noves espècies. Per tot això, expandir el nostre coneixement de les inversions és clau per a la comprensió en profunditat de la variació del genoma i les seves conseqüències. Tanmateix, la nostra comprensió tan de l’abundància com de l’impacte funcional de les inversions en el genoma humà és escàs, i se sap ben poc sobre la seva associació a canvis d'expressió gènica en aquesta espècie. Durant els últims 10 anys, l’aparició de noves tecnologies de seqüenciació genòmica ha fet permès l'estudi de les variacions estructurals a gran escala, incloent les inversions. Aprofitant aquesta oportunitat,, el projecte INVFEST ha dedicat esforços en la construcció del catàleg d' inversions polimòrfiques en humans més precís i exhaustiu fins a la data. Per aconseguir-ho,, hem demostrat que GRIAL, l’únic mètode disponible dissenyat específicament per identificar inversions a partir de l’alineament de fragments aparellats (“PEM”), prediu inversions amb més precisió i eficiència que altres mètodes de detecció basats en “PEM”, i sobretot refina molt millor els punts de trencament. A més, les prediccions d’inversió de GRIAL s’han filtrat utilitzant diversos filtres pre i post mapeig, juntament amb la inspecció manual de casos complexos, aconseguint així una reducció de la taxa de falsos positius. A continuació, per obtenir una major comprensió sobre l'impacte funcional de les inversions polimòrfiques en el genoma humà, hem examinat el solapament de 44 inversions amb gens. En general, els nostres resultats mostren que les inversions tendeixen a estar ubicades en regions intergèniques encara que hem identificat un 13,6% dels casos on les inversions afecten exons de gens. Per tal d’analitzar com les inversions afecten l’expressió gènica, s’han realitzat dos estratègies complementaries. La primera consisteix en un anàlisi d’expressió diferencial en línies cel·lulars limfoblàstiques (“LCLs”) de 527 mostres de poblacions HapMap europees, asiàtiques i africanes. La segona està basada en l’anàlisi de marcadors d’inversió (“tag-SNPs”) associats a canvis en l’expressió de gens en diferent teixits. Conjuntament, hem identificat 19 inversions que modulen l'expressió gènica de 43 gens en múltiples teixits. Aquests resultats semblen coherents, ja que un subconjunt (N = 11) de les associacions trobades en “LCLs” ha estat identificat per ambdós mètodes. En concret, hem identificat una inversió que afecta l'expressió de gens paràlegs codificants de les proteïnes IFITM2 i IFITM3 en limfoblasts. Hem validat també la metodologia emprada per a l'anàlisi d'expressió diferencial reproduint associacions conegudes amb gens de dues inversions àmpliament estudiades (17q21.31, 8p23.1), identificant així noves associacions no descrites entre 17q21.31, 8p23.1 i l'expressió de 6 gens en total. A més, en el cas de 17q21.31, observem que almenys 2 d'aquests gens estan associats a reordenaments estructurals en la regió estudiada. Finalment, hem buscat possibles associacions d’inversions amb malalties, i hem identificat un cas on la inversió sembla estar associada amb esclerosi lateral amiotròfica en dos estudis d’associació genòmica (“GWAS”) diferents. El coneixement adquirit en aquest estudi contribueix així a una millor comprensió del paper de les inversions polimòrfiques en la regulació de l'expressió gènica i en les conseqüències d'aquest tipus de variant estructural tan poc estudiada en humans.


An inversion is a balanced genomic rearrangement that alters the orientation of a specific genomic sequence. Despite not usually causing gain or loss of DNA, inversions can alter the original genetic background and produce mutational and positional effects on genes. In addition, inversions can alter recombination patterns both on the DNA sequences encompassed by them and in their vicinity. Therefore, inversions may associate with certain phenotypes or diseases, shape the evolutionary fate of the carriers by adaptive processes or even play a role in the origin of new species. For all that, increasing our knowledge of inversions constitutes a key issue for in-depth understanding of genome variation and its consequences. However, little is known about the prevalence and functional impact of inversions in the human genome, and in particular of their association with gene expression changes in humans. For the last 10 years, the advent of novel genomic technologies has enabled the study of SVs, including inversions, in a high-throughput fashion within and across species. State of the art genomic research provides the means and tools to explore the human genome in detail and expand our knowledge of inversions. Against this backdrop, the INVFEST project has devoted efforts to build the most accurate and exhaustive catalogue of human polymorphic inversions to date. For that, we have benchmarked GRIAL, currently the only paired-end mapping (PEM) based algorithm specifically designed to predict inversions, and demonstrated that performs with more accuracy and efficiency compared to other PEM based SV-detection methods, particularly in refining inversion BPs. In addition, we have curated GRIAL inversion predictions by using several pre and post PEM mapping filters coupled with manual inspection of complex cases and minimized the rate of false positive predictions. Next, to gain further insight on the functional impact of polymorphic inversions in the human genome, we examined the overlap of 44 different inversions with genes. Overall, our results show that inversions tend to be located in intergenic regions but in 13.6% of the cases gene exons are affected. We performed two complementary approaches to identify inversion associations with gene expression. First, we performed a linear regression analysis in three different expression datasets derived from 527 lymphoblastoid cell lines (LCLs) of European, Asian and African HapMap individuals. Second, we interrogated blood and non-blood tissues by contrasting expression quantitative trait loci (eQTL) data with inversion tag-SNPs. We report 19 inversion rearrangements that modulate gene expression of 43 genes in several tissues. These results seem consistent as a subset (N = 11) of the associations found in LCLs has been identified by both approaches. Interestingly, we have identified an inversion that affects the expression of paralogous protein-coding genes (IFITM2/IFITM3) in lymphocyte-derived cells. We have also validated the methodology used for differential expression analysis by reproducing known effects of two well-studied inversions (17q21.31, 8p23.1) and identified novel associations of both inversion haplotypes with the expression of 6 genes. Moreover, we observe that at least 2 of these genes are associated to 17q21.31 structural rearrangements. Finally, we have looked for possible associations of inversions with disease and found one inversion that seems to be associated with amyotrophic lateral sclerosis in two different GWAS studies. Insight gained in this study could therefore contribute to a better understanding of the role of polymorphic inversions in the regulation of gene expression and the consequences of this understudied type of genetic variants in humans.

Keywords

Inversions; Inversions polimòrfiques; Inversions polymorphic; Genòmica funcional; Funtional genomics; Expressió deferencial; Differential expression

Subjects

575 - General genetics. General cytogenetics

Knowledge Area

Ciències Experimentals

Documents

mop1de1.pdf

4.340Mb

 

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/3.0/es/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/3.0/es/

This item appears in the following Collection(s)