Bibliographic Metadata

Title
Identification and characterization of long non-protein-coding RNAs in the human genome
Additional Titles
Identifizierung und Charakterisierung von langen nicht-Protein-kodierenden RNAs im Menschlichen Genom
AuthorKornienko, Aleksandra
CensorBarlow, Denise
PublishedWien, 2016
Description298 Blatt
Institutional NoteMedizinische Universität Wien, Univ., Dissertation, 2016
Annotation
Arbeit an der Bibliothek noch nicht eingelangt - Daten nicht geprüft
Abweichender Titel laut Übersetzung der Verfasserin/des Verfassers
LanguageEnglish
Document typeDissertation (PhD)
Keywords (DE)granulocyte lncRNAs / molecular biology / gene trap / lncRNA function / genome biology / expression variation / personalized medicine
Keywords (EN)granulocyte lncRNAs / molecular biology / gene trap / lncRNA function / genome biology / expression variation / personalized medicine
URNurn:nbn:at:at-ubmuw:1-7772 Persistent Identifier (URN)
Restriction-Information
 The work is publicly available
Files
Identification and characterization of long non-protein-coding RNAs in the human genome [11.4 mb]
Links
Reference
Classification
Abstract (German)

Lange nicht-kodierende RNAs (lncRNAs) sind eine relativ neue Klasse an Genen die zunehmend als Genregulatoren und als krankheitsrelevant betrachtet werden. Genomuntersuchungen haben gezeigt, dass lncRNAs in fast allen Organismen vorkommen und in manchen wahrscheinlich sogar zahlenmäßig häufiger als klassische Protein-kodierende Gene. Auf den ersten Blick ähneln lncRNAs Protein-kodierenden Genen aber es hat sich gezeigt, dass lncRNAs sehr unterschiedlich sein können und viele lncRNAs Eigenschaften haben die sie deutlich von mRNAs unterscheiden. Zwei der Haupteigenschaften von lncRNAs sind ihre geringes Vorkommen und ihre extreme Gewebsspezifität. Diese Eigenschaften machen die Identifizierung und Annotation von lncRNAs sehr schwierig und erfordern eine sehr tiefe Sequenzierung von sehr reinen Geweben und Zelltypen. Natürliche Expressionsunterschiede von lncRNAs im direkten Vergleich zu Protein-kodierenden Genen sind bisher nur unzureichend untersucht. Wir haben daher primäre humane Granulozyten von gesunden Freiwilligen isoliert um diese Wissenslücke zu schließen. Da ein Granulozyten-spezifisches lncRNA Transkriptom nicht verfügbar war, verwendeten wir PolyA+ Granulozyten RNA-Seq Daten von 10 Personen um eine de novo Annotation von lncRNAs und mRNAs zu generieren und identifizierten dabei zahlreiche bisher unbekannte lncRNAs. Dann verwendeten wir ribosomenlose RNA-seq Daten von Granulozyten, die wir von 7 Personen in >=1-Monats-Intervallen isoliert haben und analysierten damit die Expressionsunterschiede der annotierten lncRNAs und mRNAs. Wir fanden heraus, dass in den einzelnen Personen die Expression der lncRNAs deutlich variabler ist als die der mRNAs, sogar wenn für die geringeren Expressionslevels der lncRNAs kontrolliert wurde. Wir bestätigten auch, dass dieses Phänomen nicht nur bei unserem Datensatz auftritt, sondern auch bei veröffentlichten RNA-Seq Daten von 9 humanen Geweben (20 Personen pro Gewebe) des GTEx Projekts und bei lymphoblastoiden Zelllinien von 462 Personen. Weitere Analysen des letzten Datensatzes zeigten uns auch, dass die variable Expression der lncRNAs einen deutlichen Einfluss auf die Identifizierung der lncRNAs hat und dass die Anzahl der neu annotierten lncRNAs steigt, je mehr Personen untersucht werden. Diese Resultate bieten wertvolle neue Einblicke in die Biologie der lncRNAs und besonders interessant sind einige neu identifizierte Eigenschaften die besonders unterschiedlich sind zwischen lncRNAs und mRNAs. Die hier präsentierten Daten werden als Orientierungshilfe bei der weiteren Identifizierung von lncRNAs dienen und in weiterer Folge auch entscheidend beeinflussen, wie lncRNAs als Biomarker in der personalisierten Medizin funktionieren können.

Die stetig steigende Zahl an annotierten lncRNAs im humanen Genom hat Bedenken ausgelöst, ob all diese Transkripte auch wirklich eine biologische Funktion haben. Daher ist eine Methode zur großangelegten Untersuchung der Funktionen von lncRNAs von größter Wichtigkeit. Wir haben die bisher uncharakterisierte lncRNA SLC38A4-AS als Modell verwendet um eine schnelle Serie an Experimenten aufzusetzen mit dem Ziel die spezifischen Eigenschaften dieser lncRNA zu untersuchen. Zusätzlich verwendeten wir eine fertige Kollektion von humanen haploiden Gene-Traps um eine genetische Verkürzung und damit einen Knock-out dieser lncRNAs zu erreichen. Wir konnten zeigen, dass die lncRNA SLC38A4-AS eine ungewöhnliche RNA Biologie hat da sie unter anderem ineffizient gespleißt ist, was sie sehr von mRNAs und auch vielen anderen lncRNAs unterscheidet. Weiters zeigen wir, dass die Kollektion von humanen haploiden Gene-Traps ein effizientes Werkzeug für genetische Manipulationen ist und ausgezeichnet für die Charakterisierung von lncRNAs funktioniert. Die Ergebnisse zeigen, dass die lncRNA SLC38A4-AS ein funktioneller Regulator ist und 6 potentielle Zielgene (inkl. die Protein-kodierende Gene CD9 und RORB) hat.

Abstract (English)

Long non-coding RNAs (lncRNAs) are a relatively recently emerged new class of genes, that are becoming increasingly appreciated as gene regulators and disease players. It has recently become clear that lncRNA genes are inherent to the genomes of most organisms, and that they are unexpectedly numerous - likely even more numerous, in some organisms, than classical protein-coding genes. LncRNA genes resemble protein-coding genes at the first glance, but it has become increasingly clear that lncRNAs are a more diverse gene and transcript class with a set of non-mRNA-like features. Two major features of lncRNAs is their low abundance and extreme tissue-specificity. These features make lncRNA identification challenging and deep coverage analysis of pure tissues and cell types is required to comprehensively annotate lncRNAs. LncRNA natural expression variation is a feature that has not been examined in comparison to protein-coding genes. We used human primary granulocytes obtained from healthy volunteers to fill this knowledge gap. Granulocyte-specific transcriptome (and particularly lncRNA) annotation was unavailable and we used PolyA+ RNA-seq data from 10 individuals to create de novo lncRNA and mRNA annotation in granulocytes, identifying numerous novel lncRNAs. We then used ribosomal depleted RNA-seq of granulocytes from 7 individuals sampled at >=1-month intervals to calculate expression variation of the annotated lncRNAs and mRNAs. We discovered that lncRNA expression was notably more variable than mRNAs, even when controlling for general lncRNA low expression level. We confirmed the generality of the discovered phenomenon by analyzing publicly available data from 9 human tissues (20 individuals each) from GTEx project and lymphoblastoid cell lines (462 individuals). Further analysis of the latter dataset allowed us to show that high expression variability influences the process of lncRNA identification and the number of identified lncRNA loci increases steadily with the number of healthy donors used for the identification. These findings provide important novel insight into lncRNA biology and also identify new non-mRNA-like feature of lncRNAs that together give new guidelines for lncRNA identification and their functional characterization strategy. In addition, these results as influence potential prospects of the use of lncRNAs as biomarkers and their implication in personalized medicine.

The ever-increasing number of lncRNAs annotated in the human genome raises concerns about meaningfulness of their transcription and questions their functionality. Thus, a convenient large-scale lncRNA functional assessment method is of high importance. We used a previously uncharacterized lncRNA SLC38A4-AS as a model to propose a rapid RNA-biology feature characterization pipeline followed by genetic truncation leading to the functional knockout, using ready-made Human Haploid Gene Trap Collection. We show that SLC38A4-AS lncRNA is a lncRNA possessing unusual RNA-biology features, including inefficient splicing, dramatically distinguishing it from a typical mRNA or many lncRNAs. However, we show that Human Haploid Gene Trap Collection is an efficient tool for genetic manipulation and functional study of such a lncRNA. The results showed that the SLC38A4-AS lncRNA is a functional regulator and they provide a list of 6 stringently filtered potential targets of SLC38A4-AS, which included CD9 and RORB protein-coding genes.