Unraveling the impact of transposable elements on rice genome evolution and trait diversification

llistat de metadades

Director

Casacuberta i Suñer, Josep M., 1962-

Castanera Andres, Raul

Tutor

Casacuberta i Suñer, Josep M., 1962-

Date of defense

2025-10-14

Pages

176 p.



Doctorate programs

Universitat Autònoma de Barcelona. Programa de Doctorat en Biologia i Biotecnologia Vegetal

Abstract

Les seqüències repetitives són el component principal dels genomes eucariotes, i, entre elles, els elements transposables (TEs) destaquen per la seva capacitat de moure i augmentar el seu número de còpia dins del genoma de l'hoste. En les plantes, els TEs són particularment abundants, i tenen un paper central en la remodelació de l'arquitectura del genoma, influint en l'expressió gènica, contribuint a la diversitat genètica i la variació fenotípica. En aquesta tesi he investigat l'impacte, la diversitat i les conseqüències funcionals de l'activitat TE en l'arròs (Oryza sativa), un cultiu bàsic d'alta rellevància agrícola i econòmica. El capítol 1 explora la influència dels TEs en l'expressió gènica a través de les dues subespècies principals d'arròs, índica i japonica. Mitjançant dades genòmiques i transcriptòmiques, identifiquem insercions de TE que es correlacionen amb l'expressió gènica diferencial, destacant el paper dels TE en la generació de la variabilitat transcripcional. Els resultats d'aquest capítol suggereixen que les insercions ancestrals de TEs han estat seleccionades positivament després de la domesticació de l'arròs, jugant un paper important en la història evolutiva recent del cultiu. A la segona part del capítol, presento l'estudi d'un polimorfisme d'inserció de transposons (TIP) associat a l'èxit de floració, destacant la complexa interacció entre les insercions de TEs, la transcripció gènica i la variació fenotípica. El capítol 2 se centra en la caracterització d'un TIP fortament associat amb grans més llargs en arròs índica. Els nostres resultats han demostrat la presència de grans més llargs en accessions amb la inserció de l’element transposable, juntament amb una menor expressió del gen més proper IQD19. Altres anàlisis van revelar l'IQD19 com un gen candidat per millorar la longitud del gra en l'arròs, encara que la validació funcional encara està en curs. En el capítol 3, descric la presència i distribució de repeticions en tàndem de LTR-retrotransposons (LTR-RTs) en els genomes d'arròs, demostrant que aquestes estructures són altament complexes i polimorfes en diferents accessions d'arròs. L'anàlisi es va estendre a altres espècies vegetals (Arabidopsis, ametlla i cotó), evidenciant que les insercions de LTR-RTs en tàndem són comunes en els genomes vegetals. Es presenten en detall dos loci, que il·lustren la complexitat estructural i les limitacions de les eines bioinformàtiques actuals per resoldre aquestes regions. Finalment, el capítol 4 aborda els reptes metodològics d'analitzar els TE en les anàlisis poblacionals a causa del biaix del genoma de referència. Comparem la detecció de TIP i les associacions fenotípiques (TIP-GWAS) en una col·lecció de 3.000 genomes utilitzant dades de lectura curta i múltiples genomes de referència. A la segona part del capítol, vaig avaluar tres protocols de construcció de pangenoma i vaig mesurar la seva eficàcia en la captura de la diversitat TE en la població d'arròs.


Las secuencias repetitivas son el componente principal de los genomas eucariotas, y entre ellas, los elementos transponibles (TEs) destacan por su capacidad de moverse y aumentar su número de copias dentro del genoma huésped. En plantas, los ET son particularmente abundantes y desempeñan un papel fundamental en la remodelación de la arquitectura genómica, influyendo en la expresión génica y contribuyendo a la diversidad genética y la variación fenotípica. En esta tesis, he investigado el impacto, la diversidad y las consecuencias funcionales de la actividad de los TEs en el arroz (Oryza sativa), un cultivo básico de gran relevancia agrícola y económica. El capítulo 1 explora la influencia de los TEs en la expresión génica en las dos subespecies principales de arroz, indica y japónica. Utilizando datos genómicos y transcriptómicos, identificamos inserciones de TEs que se correlacionan con expresión génica diferencial, destacando el papel de los TEs en la generación de variabilidad transcripcional. Los resultados de este capítulo sugieren que las inserciones ancestrales de TEs se han seleccionado positivamente tras la domesticación del arroz, desempeñando un papel importante en la historia evolutiva reciente de este cultivo. En la segunda parte del capítulo, presento el estudio de un polimorfismo de inserción de transposones (TIP) asociado con el éxito de floración, enfatizando la compleja interacción entre las inserciones de TEs, la transcripción genética y la variación fenotípica. El capítulo 2 se centra en la caracterización de un TIP fuertemente asociado con granos de arroz más largos en la subespecie índica. Nuestros resultados han demostrado la presencia de granos más largos en accesiones con la inserción del TEs, junto con una menor expresión del gen cercano IQD19. Análisis posteriores revelaron que IQD19 es un gen candidato para mejorar la longitud del grano en el arroz, aunque la validación funcional aún está en curso. En el capítulo 3, describo la presencia y distribución de repeticiones en tándem de retrotransposones LTR (LTR-RT) en genomas de arroz, mostrando que estas estructuras son altamente complejas y polimórficas en diferentes accesiones de arroz. El análisis se extendió a otras especies vegetales (Arabidopsis, almendro y algodón), evidenciando que las inserciones en tándem de LTR-RT son comunes en los genomas vegetales. Se presentan dos loci en detalle, ilustrando la complejidad estructural y las limitaciones de las herramientas bioinformáticas actuales para la resolución de estas regiones. Finalmente, el capítulo 4 aborda los desafíos metodológicos del análisis de ET en análisis poblacionales debido al sesgo del genoma de referencia. Comparamos la detección de TIP y las asociaciones fenotípicas (TIP-GWAS) en una colección de 3000 genomas utilizando datos de lecturas cortas y múltiples genomas de referencia. En la segunda parte del capítulo, realicé una evaluación de tres procesos de construcción de pangenomas y medí su eficacia para capturar la diversidad de TE a nivel de población de arroz.


Repetitive sequences are the main component of eukaryotic genomes, and, among them, transposable elements (TEs) stand out due to their ability to move and increase their copy number within the host genome. In plants, TEs are particularly abundant, and play central roles reshaping genome architecture, influencing gene expression, contributing to genetic diversity and phenotypic variation. In this thesis I have investigated the impact, diversity and functional consequences of TE activity in rice (Oryza sativa), a staple crop with high agricultural and economic relevance. Chapter 1 explores the influence of TEs on gene expression across the two main rice subspecies, indica and japonica. Using genomic and transcriptomic data, we identify TE insertions correlating with differential gene expression, highlighting the role of TEs in the generation of transcriptional variability. The results of this chapter suggest that ancestral TE insertions have been positively selected after rice domestication, playing an important role in the recent evolutionary history of the crop. In the second part of the chapter, I present the study of a transposon insertion polymorphism (TIP) associated with flowering success, emphasizing the complex interplay between TE insertions, gene transcription and phenotypic variation. Chapter 2 focuses on the characterization of a TIP strongly associated with longer grains in indica rice. Our results have demonstrated the presence of longer grains in accessions with the TE insertion, coupled with a lower expression of the nearby gene IQD19. Further analyses revealed IQD19 as a candidate gene for improving grain length in rice, although functional validation is still ongoing. In chapter 3, I describe the presence and distribution of tandem arrays of LTR-retrotransposons (LTR-RTs) in rice genomes, showing that these structures are highly complex and polymorphic across different rice accessions. The analysis was extended to other plant species (Arabidopsis, almond and cotton), evidencing that tandem LTR-RTs insertions are common in plant genomes. Two loci are presented in detail, illustrating the structural complexity and the limitations of the current bioinformatic tools for resolving these regions. Lastly, chapter 4 addresses the methodological challenges of analyzing TEs in population analyses due to the reference genome bias. We compared TIP detection and phenotypic associations (TIP-GWAS) in a collection of 3,000 genomes using short read data and multiple reference genomes. In the second part of the chapter, I performed an evaluation of three pangenome construction pipelines, measuring their effectiveness in capturing TE diversity at the rice population level.

Subjects

577 - Biochemistry. Molecular biology. Biophysics

Knowledge Area

Ciències Experimentals

Recommended citation

Documents

Llistat documents

nmd1de1.pdf

11.41Mb

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/

This item appears in the following Collection(s)