banner

Noticias

May 30, 2023

La genómica comparada revela un nitrógeno único

Nature Communications volumen 14, número de artículo: 4334 (2023) Citar este artículo

2513 Accesos

13 altmétrico

Detalles de métricas

La Asteraceae (familia de las margaritas) es una de las familias de plantas más grandes. No se ha dilucidado la base genética de su alta biodiversidad y excelente adaptabilidad. Aquí, comparamos los genomas de 29 especies de plantas terrestres, incluidos dos conjuntos de genomas de novo a escala cromosómica para la lechuga de tallo, un miembro de Asteraceae, y Scaevola taccada, un miembro de Goodeniaceae que es uno de los grupos externos más cercanos de Asteraceae. Mostramos que Asteraceae se originó hace aproximadamente 80 millones de años y experimentó una paleopoliploidización repetida. PII, el regulador universal de la asimilación de nitrógeno-carbono (NC) presente en casi todos los ámbitos de la vida, ha perdido notoriamente en Asteraceae. Mientras tanto, Asteraceae ha mejorado gradualmente el sistema de equilibrio NC mediante paleopoliploidización y duplicaciones en tándem de genes metabólicos clave, lo que ha dado como resultado una mayor absorción de nitrógeno y biosíntesis de ácidos grasos. Además de sugerir una base molecular para su éxito ecológico, el exclusivo sistema de equilibrio NC reportado para Asteraceae ofrece una posible estrategia de mejora de cultivos.

Las angiospermas (plantas con flores) experimentaron una rápida radiación terrestre y una diversificación de especies, hasta llegar a ser ecológicamente dominantes antes del final del período Cretácico, famoso por Charles Darwin como “un misterio abominable”1. En particular, las Asteraceae rivalizan con las Orchidaceae como la familia más grande de plantas con flores. Las Asteraceae comprenden más de 1620 géneros y 30 000 especies y representan aproximadamente el 10% de todas las especies con flores (Figura complementaria 1 y Nota complementaria 1)2,3. La riqueza de especies de Asteraceae es mucho mayor que la de familias relacionadas del orden Asterales, incluidas Calyceraceae (47 spp.), Goodeniaceae (430 spp.) y Menyanthaceae (60 spp.)3. Como la familia de mayor éxito ecológico con una diversidad increíble y una excelente adaptabilidad, sus miembros se encuentran en casi todos los tipos de hábitat de la Tierra, incluidos ambientes extremos, como desiertos y salinas (Figura complementaria 1)4. Otro ejemplo que puede ilustrar la extraordinaria adaptabilidad de las Asteraceae es que las plantas de esta familia se encuentran entre las tres primeras en la lista de especies globalmente invasoras (Figura complementaria 1). Se considera que el éxito ecológico de Asteraceae está relacionado con su morfología y fisiología específicas. Por ejemplo, la inflorescencia característica (capitulum) contribuye sustancialmente a la radiación ecológica al atraer insectos polinizadores que dependen en gran medida de esta familia para alimentarse y reproducirse5. Los frutos parecidos a los aquenios (cypselae) con vilano de cerdas promueven la dispersión por el viento o se adhieren al pelaje o plumaje de los animales2. Ambos métodos de dispersión dan como resultado semillas que se esparcen a una distancia mayor que la mayoría de los otros tipos de semillas. Además, los fructanos de tipo inulina, en lugar de almidones, son los principales carbohidratos de reserva en las Asteraceae y tienen funciones potenciales para aumentar su capacidad de adaptarse a los desafíos ambientales6,7,8. Sin embargo, comprender progresivamente las explosivas diversificaciones y adaptabilidad de las Asteraceae sigue siendo un gran desafío para los biólogos.

El origen y la evolución temprana de las Asteraceae no son concluyentes y son misteriosos. Los estudios filogenéticos recientes de Asteraceae utilizando nueva evidencia fósil y un muestreo más amplio de la familia ubicaron su origen en algún momento del período Cretácico tardío (hace 69–89 millones de años [MYA])2,5,9. Se consideraba que la familia era relativamente joven hasta hace poco (40 a 50 millones de años) según su registro fósil existente, y este período de tiempo es consistente con el proporcionado por los relojes moleculares2,10,11. Las subfamilias cercanas al nodo de la corona de Asteraceae propusieron y compartieron un evento de paleopoliploidización, que se consideró una triplicación del genoma completo según análisis genómicos recientes10,12,13,14. Además, se estimaron y predijeron que las frecuentes duplicaciones potenciales del genoma completo (WGD) antiguo dentro de varias tribus serían una fuerza que impulsa la evolución y aumenta la biodiversidad, considerando que las poliploidizaciones duplican todos los genes simultáneamente y proporcionan abundante material genético para procesos evolutivos, como la neofuncionalización. subfuncionalización y conservación de genes debido a efectos de dosis13,15. Los conocimientos sobre la poliploidización permiten que la base genética de rasgos específicos de Asteraceae sea factible al profundizar en los genomas de alta calidad utilizando tecnologías de secuenciación de vanguardia.

El nitrógeno (N), junto con el carbono (C), es un componente primario de los nucleótidos y las proteínas que son esenciales para la vida, pero su disponibilidad es a menudo un factor limitante para el crecimiento de las plantas en los ecosistemas naturales. El metabolismo celular de N y C en las plantas está finamente coordinado por genes sensores o reguladores para sostener un crecimiento y desarrollo óptimos16. Por ejemplo, las proteínas PII actúan como informantes del estado metabólico C de la célula al unir de forma interdependiente ATP/ADP y 2-oxoglutarato (2-OG)17. Además, los niveles de glutamina celular en las plantas se detectan adicionalmente mediante señalización PII16,17,18. El modo de función de PII se conserva en los tres dominios de la vida bajo el control de las interacciones PII-proteína diana mediante la unión de moléculas efectoras. Los taxones ecológicamente exitosos desarrollan sistemas de asimilación de N exitosos y eficientes para sobrevivir en hábitats severos o competir por el alimento. Aproximadamente el 90% de las especies de la familia Leguminosae pueden fijar N atmosférico mediante una asociación simbiótica con bacterias del suelo y se han generalizado gracias a las radiaciones más espectaculares19. Las orquídeas son uno de los pocos linajes de plantas con flores que han podido colonizar con éxito nichos epífitos o litofíticos, aferrándose a árboles o rocas y creciendo en condiciones secas utilizando el metabolismo del ácido crasuláceo20. Presumimos razonablemente que podría haber factores inusuales en el sistema de absorción de nutrientes de Asteraceae.

En este trabajo, generamos dos conjuntos de genomas de alta calidad de lechuga de tallo (Lactuca sativa var. angustana), un cultivo económico representativo de Asteraceae, y Scaevola taccada, una planta representativa de la familia Goodeniaceae que es el linaje hermano de Calyceraceae y Asteraceae. (Figura 1a, b). Se realiza un análisis genómico comparativo de los 29 taxones, incluidas siete especies de Asteraceae y 22 especies, que son representantes de diferentes clados evolutivos de plantas terrestres. Descubre la historia de la evolución genómica, la arquitectura genómica y la diferenciación funcional genética de Asteraceae, lo que posiblemente podría conducir a su singularidad y diversidad. Sorprendentemente, el gen regulador conservado que mantuvo el equilibrio de la asimilación N/C, PII, se pierde en toda la familia Asteraceae durante su transición genómica. Se ha propuesto un sistema de equilibrio NC único que cubre, entre otros, la absorción de N y la síntesis de ácidos grasos y proporciona una base molecular sólida para la adaptabilidad de Asteraceae.

a Relación filogénica entre lechuga de tallo y Sc. taccada. Las flechas rojas indican sus respectivas familias, Asteraceae y Goodeniaceae. El árbol fue adaptado de Angiosperm Phylogeny (http://www.mobot.org/MOBOT/research/-APweb/). b Hábitat, morfología y flores de lechuga de tallo y Sc. taccada. Hábitat típico de Sc. taccada en una playa tropical en Sanya, provincia de Hainan, China (arriba a la izquierda); Flores de Sc. taccada (arriba a la derecha); Morfología de la lechuga como producto básico en un supermercado (abajo a la derecha); Flores de lechuga de tallo (abajo a la izquierda). c Características del genoma de la lechuga de tallo y Sc. taccada. Las pistas de los círculos exterior a interior indican I, cariotipos cromosómicos; II, densidad genética en ventanas de 1 Mb; III, niveles de expresión génica (FPKM promediado en ventanas de 1 Mb); IV, densidad de LTR-RT (ventanas de 1 Mb); V, densidad de transposones de ADN (ventanas de 1 Mb); VI, contenido de GC; VII, sintenia entre los dos genomas.

El ensamblaje del genoma de novo para el tallo de lechuga se basó en un conjunto de secuenciación en tiempo real (SMRT) de un solo nucleótido con cobertura de 105 veces, mapeo óptico de cobertura de 119 veces, captura de conformación cromosómica con cobertura de 108 veces (Hi-C ) secuenciación y lecturas de Illumina con cobertura de 158 veces (Tabla complementaria 1 y Notas complementarias 2 y 3). Los tamaños N50 de los contigs, los andamios con mapeo óptico y los andamios analizados adicionalmente con Hi-C fueron 4,95 Mb, 186,5 Mb y 332,3 Mb, respectivamente (Tablas complementarias 2 y 3). El genoma ensamblado final, a saber, SL1.0, tiene 2589,7 Mb, incluidos nueve pseudocromosomas y los genomas completos de cloroplastos y mitocondrias (Fig. 1c, Tablas complementarias 2 y 3, Nota complementaria 4 y Figuras complementarias 2-5). .

Los conjuntos de datos de RNA-Seq de diferentes tejidos producidos por este estudio y todas las etiquetas de secuencia expresadas (EST) de lechuga de NCBI se utilizaron para predecir los genes y anotar el genoma (Nota complementaria 5 y Figura complementaria 6). Se identificaron un total de 40,341 genes codificadores de proteínas de alta confianza y 5453 ARN no codificantes, y sus funciones se anotaron mediante búsquedas en seis bases de datos disponibles públicamente (Tablas complementarias 4 y 5). Finalmente, junto con la anotación en Gene Ontology (GO) y Kyoto Encyclopedia of Genes and Genomes (KEGG), se anotaron más del 85% de los genes (Tabla complementaria 4).

Se utilizaron diferentes medios para evaluar la calidad del genoma (Nota complementaria 6 y figuras complementarias 7 a 9). Primero, se realizó una alineación por pares entre SL1.0 y el genoma de otro cultivar de lechuga (La. sativa var. capitata) y, además de su fuerte colinealidad y consistencia, SL1.0 fue mucho más completo (Figura complementaria 8). . En segundo lugar, el 98,37% de todas las lecturas de Illumina y el 95,32% de las EST, respectivamente, podrían realinearse adecuadamente con el conjunto SL1.0 (Tablas complementarias 6 a 8), y su precisión base, denominada valor de calidad (QV), se estimó en al menos 42,38, que era mejor que los dos genomas de mamíferos favorables publicados (QV35 para gorila y QV34.5 para cabra)21,22. En tercer lugar, el genoma cubría el 95,9% de los ortólogos de copia única universales de evaluación comparativa (BUSCO) completos, y ~92,3% de ellos se expresaron en al menos un tejido (Tabla complementaria 9 y Figura complementaria 7). Una característica notable de SL1.0 es la alta proporción de elementos repetitivos que constituían más del 87% (Tabla complementaria 10). Después de un examen cuidadoso de las repeticiones terminales largas (LTR), el índice de ensamblaje LTR (LAI) de SL1.0 llega a 18,13, comparable a la calidad de plantas modelo, como Arabidopsis thaliana, arroz y maíz (Figura complementaria 9)23. Además, SL1.0 capturó cinco largos tramos de secuencias teloméricas en ambos extremos de los cinco cromosomas, con números repetidos que oscilaron entre 294 y 1073 (Tabla complementaria 11). La combinación descrita anteriormente demostró que el genoma de la lechuga es un genoma de alta calidad en Asteraceae.

De manera similar, el ensamblaje del genoma de novo para Sc. taccada se basó en un conjunto de lecturas SMRT con cobertura de 102 veces, cobertura de 102 veces de lecturas Hi-C y cobertura de 105 veces de lecturas de Illumina (Tabla complementaria 12, Notas complementarias 7 y 8, y Figuras complementarias 10-13 ). Logramos generar el montaje de Sc. taccada, a saber, ST1.0, con un tamaño de 1159 Mb, incluidos ocho andamios a escala de cromosomas donde el cóntig N50 alcanzaba los 9,6 Mb, y con genomas completos de cloroplastos y mitocondrias (Fig. 1c, Tablas complementarias 13 y 14, Nota complementaria 9 y figuras complementarias 11 a 13). Las secuencias repetidas cubrieron ~952 Mbp (más del 80 % del conjunto) y los retrotransposones LTR (LTR-RT) ocuparon casi el 82 % de todas las repeticiones (Tabla complementaria 15 y Nota complementaria 10). Cuando se utilizaron los conjuntos de datos de RNA-Seq de cuatro tejidos diferentes para anotar ST1.0, se obtuvieron 25,328 genes codificadores de proteínas y 4219 ARN no codificantes con información de anotación detallada (Tablas complementarias 16 y 17 y Nota complementaria 10). Además, las secuencias repetidas del genoma estaban bien ensambladas con un LAI tan alto como 12,01. La integridad estimada de BUSCO de ST1.0 alcanzó el 94,2% (Tabla complementaria 18 y Figura complementaria 14). Todas las demás evaluaciones que se determinaron utilizando métodos idénticos a los de SL1.0 indican una alta calidad e integridad de ST1.0 (Tablas complementarias 18 y 19).

Para investigar el origen y la evolución del genoma de Asteraceae, utilizamos los genomas de Sc. taccada y 21 representantes de diferentes ramas filogenéticas de plantas terrestres y las siete Asteraceae secuenciadas, incluida la lechuga (Fig. 2a, Figs. 15 y 16 complementarias y Nota complementaria 11). Seguimos el tiempo de diferenciación del linaje de Sc. taccada y Asteraceae hasta hace aproximadamente 78 a 82 millones de años (MYA) a finales del período Cretácico (Fig. 2a), lo que fue consistente con los hallazgos de la reciente conservación de registros fósiles de granos de polen y análisis moleculares basados ​​en secuencias de genoma disperso y transcriptoma2,5 .

a Filogenia y escala de tiempo de 29 especies de plantas terrestres representativas. Las barras grises en los nodos representan intervalos de confianza del 95% de las fechas de divergencia estimadas, mientras que la flecha y la estrella rojas indican el origen de Asteraceae hace alrededor de 80 millones de años (MYA) a finales del Cretácico. Los números en cada rama o nodo representan expansiones (rojo) y contracciones (negro) de grupos ortólogos. MRCA: ancestro común más reciente. b Distribución de densidad de la tasa de sustitución sinónima (Ks) estimada de pares de sintelog para comparaciones intragenómicas (Sc. taccada, lechuga (La. sativa), girasol (Helianthus annuus), alcachofa (Cynara cardunculus) y café (C. arabica)) y para SC. taccada versus café, lechuga y alcachofa. c Macrosynteny visualización de los genomas de la vid (Vitis vinifera), café, Sc. taccada, lechuga y alcachofa que muestran eventos de triplicación en Asteraceae. Tres ejemplos de sintelogs están coloreados en rojo, verde y azul, donde una copia está en vid, café y sc. taccada, y tres ejemplares son en lechuga y alcachofa. Los números indican cromosomas. Los datos de origen se proporcionan como un archivo de datos de origen.

Calculamos el número de sustituciones sinónimas por sitio sinónimo (Ks) de todos los parálogos. La distribución de Ks reveló diferentes eventos de poliploidización experimentados por las especies de Asteraceae, incluida la triplicación ancestral del genoma completo de los Eudicots (WGT-γ)24, la triplicación del genoma completo que comparten las especies de Asteraceae (WGT-1)12,14, y una duplicación del genoma completo específica del linaje en el genoma del girasol (WGD-2) 10 (Fig. 2b y Nota complementaria 12). Carolina del Sur. taccada compartió un claro pico de Ks con el café (Coffea arabica), lo que sugiere que Sc. taccada y el café experimentaron solo el evento WGT-γ, un antiguo evento WGT que ocurrió aproximadamente entre 122 y 164 millones de años10,24, lo cual fue consistente con resultados previos del transcriptoma de Scaevola aemula25. Los perfiles de distribución de Ks similares de los parálogos entre Sc. taccada versus lechuga y lechuga versus lechuga indicaron que el evento WGT ocurrió poco después de la cladogénesis entre Asteraceae y Goodeniaceae (Fig. 2b y Fig. complementaria 17a). WGT-1 fue el único evento WGT que ocurrió en los ancestros de Asteraceae después de WGT-γ. La comparación intergenómica y los análisis de síntesis también respaldaron esta observación (Fig. 2c y Nota complementaria 12). Además, estos análisis sugieren que el evento WGT-1 tuvo lugar cerca del momento de la formación de Asteraceae (Fig. 2a).

También investigamos las regiones retenidas por triplicación (TRR) después del evento WGT-1 utilizando el Sc. genoma taccada como referencia (Tabla complementaria 20, Nota complementaria 13 y Figura complementaria 18). Detectamos genes homólogos clave responsables de procesos biológicos esenciales (p. ej., floración, biosíntesis/metabolismo de la pared celular, biosíntesis de ácidos grasos) en los TRR. Un análisis más detallado de los genes enriquecidos en TRR reveló que los genes relacionados con la pared celular, la fosforilación de proteínas, la biosíntesis de ácidos grasos y la membrana celular se retuvieron selectivamente (Figura complementaria 17b, Datos complementarios 1 a 5 y Nota complementaria 13). Todas estas funciones están estrechamente relacionadas con las respuestas al estrés y la adaptación ambiental; por ejemplo, las pectina metilesterasas (PME) pueden facilitar la modificación de la pared celular. Los genes que codifican delta-9 acil-lípido desaturasas (ADS) y factores de transcripción MIKC-MADS mostraron un patrón de retención similar (Figuras complementarias 17c, 19 y 20 y Nota complementaria 13). La distinta composición genómica de los TRR con regiones genéticas significativamente más altas y secuencias repetitivas más bajas en comparación con la de todo el genoma indica que estas regiones se seleccionaron preferentemente (Figura complementaria 17d y Nota complementaria 13). Un análisis de enriquecimiento y agotamiento de las familias de elementos repetidos en estos TRR indicó que la disminución de los elementos repetidos fue causada principalmente por la eliminación de LTR-RT (Figura 21 complementaria y Nota complementaria 14), que se han expandido sustancialmente y dominan los genomas de Asteraceae. (Nota complementaria 14, datos complementarios 6 a 10, tabla complementaria 21 y figuras complementarias 22 a 35).

A continuación, analizamos la evolución de la familia de genes según el árbol filogenético y los grupos ortólogos en el nodo ancestral de Asteraceae y el nodo ancestral de las familias Asteraceae y Goodeniaceae (Fig. 2a, Nota complementaria 15 y Fig. complementaria 36). Las familias de genes en rápida evolución estuvieron involucradas en una amplia gama de procesos biológicos, en particular la reproducción, la respuesta a estímulos, la inmunidad y los depósitos de nutrientes (Figura complementaria 37). Paralelamente, analizamos los dominios funcionales de estos genes e identificamos 107 entradas de Interpro que se enriquecieron en al menos dos especies de Asteraceae (P <0,05) (Datos complementarios 11 y Nota complementaria 16). En particular, 18 entradas estaban relacionadas con dominios de transposones (retro) y varios tipos de dominios de dedos de zinc, incluidos los de tipo CCHC con dedos de zinc, tipo BED, tipo PMZ, tipo TTF, tipo SWIM y tipo GRF. identificado (Datos complementarios 11). Otro grupo enriquecido estaba relacionado con la biosíntesis de ácidos grasos, como las acil-CoA desaturasas, las beta-cetoacil sintasas y las desaturasas de ácidos grasos (DAP) (Datos complementarios 11). También identificamos 114 grupos de genes ortólogos en cuatro categorías como específicos de linaje en Asteraceae, incluidos genes de factores transcripcionales como bHLH, MYB, Znf, SPL y MADS-box, un subclado de la familia de receptores quinasas de FERONIA, genes para el metabolismo secundario clave. en Asteraceae (p. ej., biosíntesis de inulina y alcaloides) y remodelación celular (Nota complementaria 17, Tablas complementarias 22 y 23, Datos complementarios 12 y 13, y Figuras complementarias 38 a 48).

También investigamos genes que estaban ausentes en las siete especies de Asteraceae secuenciadas (Tabla complementaria 24 y Nota complementaria 18). La ausencia más notoria en las siete Asteraceae y Sc. taccada era PII. La PII ocurre ampliamente en los tres dominios de la vida y tiene un papel fundamental en la detección y regulación de las señales NC18. Utilizamos los datos del transcriptoma de la Iniciativa Mil Transcriptomas de Plantas (1KP), incluidas 39 especies de Asteraceae y flor de abanico (Scaevola mossambicensis), otra especie de Goodeniaceae, y confirmamos la pérdida de PII en Asteraceae y Goodeniaceae (Fig. 3a, Nota complementaria 19, Datos complementarios 14 y Tabla complementaria 25), lo que indica que la PII se perdió en el antepasado de Asteraceae y Goodeniaceae.

a Distribución filogenética de PII en 1090 plantas verdes de la colección de la Iniciativa de Transcriptomas de las Mil Plantas (OTPTI). A la izquierda se muestra un árbol filogenético simplificado y a la derecha se enumeran especies u otros nombres taxonómicos. Los clados sin PII están etiquetados en fuente roja. b Análisis de colinealidad de la región que contiene PII en zanahoria (D. carota), Sc. taccada y lechuga. El cromosoma 1 que contiene PII en la zanahoria y los cromosomas ensamblados correspondientes en Sc. La taccada y la lechuga se muestran verticalmente. Las líneas rojas y negras en los cromosomas indican la existencia y pérdida de PII, respectivamente. El tono gris y el sintelog del genoma en el recuadro muestran el reordenamiento cromosómico entre la zanahoria y Sc. taccada. c, d Visualización de Microsynteny de las regiones cromosómicas colineales entre zanahoria y Sc. taccada (c) y entre zanahoria y lechuga (d). La posición de PII en la zanahoria está marcada con flechas rojas. e Análisis de complementación de fluorescencia bimolecular (BiFC) que muestra la interacción entre LsNAGK y PII (DcPII) in vivo. f Ensayos desplegables de GST que muestran la interacción entre LsNAGK y PII (DcPII) in vitro. Cada experimento se repitió tres veces de forma independiente con resultados similares. Los datos de origen se proporcionan como un archivo de datos de origen.

Para rastrear cómo se perdió PII, seleccionamos otra especie de grupo externo cercano, la zanahoria (Daucus carota), como referencia, y realizamos análisis sinténicos por pares con Sc. taccada y otras especies de Asteraceae (Fig. 3b y Nota complementaria 19). A diferencia de la zanahoria, en la que el bloque sinténico que contiene PII se asigna a la mitad del brazo inferior del cromosoma 1, este bloque sinténico se ubicó a lo largo de las regiones de los telómeros en los genomas de Asteraceae y Goodeniaceae (Fig. 3b). La sintenia por pares indicó una extensa reordenación cromosómica entre la zanahoria (Chr 01) y Sc. taccada (Chr 05), y PII se ubicó en el borde del área reorganizada (Fig. 3b). Además, detectamos una microinversión (que involucra entre 20 y 30 genes) entre la zanahoria y Sc. taccada (Fig. 3c) y entre zanahoria y lechuga (Fig. 3d). La PII se ubicó en el borde de la región invertida (Fig. 3c, d). Tomando estos resultados en conjunto, proponemos que se produjo un reordenamiento cromosómico seguido de una microinversión en el antepasado de Goodeniaceae y Asteraceae, lo que condujo a la pérdida de PII.

PII es un sensor de N localizado en el cloroplasto que activa el complejo N-acetil-L-glutamato quinasa (NAGK) para promover la asimilación de N16,17. La PII también forma un complejo con la subunidad de la proteína transportadora de biotina carboxilo (BCCP) de la acetil-CoA carboxilasa (ACCasa, que cataliza el primer paso en la biosíntesis de ácidos grasos) para inhibir la actividad de la ACCasa18,27. Además, la PII puede participar en la regulación negativa de la absorción de N y prevenir el exceso de absorción de nitrito en las plantas terrestres28,29. Para evaluar la influencia de la ausencia de PII en Asteraceae, generamos plantas de lechuga transgénicas que expresan un gen PII exógeno de zanahoria (Da. carota), tomate (Solanum lycopersicum) y Arabidopsis (A. thaliana), respectivamente. Las PII de zanahoria/tomate representan las PII canónicas con sitios de unión a glutamina específicos de la planta que se eliminaron parcialmente en la de Arabidopsis (Nota complementaria 20 y Figura complementaria 49). De acuerdo con informes anteriores30, AtPII se localizó en el cloroplasto en lechugas transgénicas que expresan AtPII (Fig. 3e y Figs. Suplementarias 50 y 51). Los ensayos in vivo (Complementación de Fluorescencia Bimolecular-BiFC) y las pruebas in vitro (Pull-down) respaldan firmemente las interacciones entre AtPII, DcPII, SlPII y NAGK en la lechuga (Fig. 3e, f, Fig. 52 complementaria y Nota complementaria 20). ). El contenido de nitrato N y la actividad ACCasa fueron significativamente menores en las plantas transgénicas (Figura complementaria 52 y Nota complementaria 20). En comparación con la lechuga silvestre, el contenido total de aminoácidos libres, especialmente ácido glutámico, glutamina y arginina, aumentó significativamente en las plantas transgénicas que expresan DcPII y SIPII, mientras que se redujo en las líneas que expresan AtPII (Figuras complementarias 52 y Nota complementaria 20). Aunque merece la pena explorar las razones específicas, se sospechaba que las diferencias en los sitios de unión de glutamina de las proteínas PII tenían un efecto (Nota complementaria 21). Estos resultados indican que la PII exógena podría alterar el equilibrio NC original en la lechuga.

La presencia casi universal de PII en casi todos los ámbitos de la vida indica que su ausencia en Asteraceae debería dar como resultado una reprogramación importante del sistema de equilibrio NC. Por lo tanto, examinamos los diferentes genomas en busca de la presencia de genes implicados en la absorción y el metabolismo de N. Asteraceae tenía significativamente más miembros de las familias de genes transportadores de nitrato 2 (NRT2) y NRT3, que codifican transportadores de doble componente involucrados en la asimilación de nitrato de alta afinidad31, en comparación con las otras especies, incluida Sc. taccada (P <0,01; Fig. 4a, f). Esta observación fue consistente con la rápida expansión de los ortólogos del reservorio de N en el nodo de la corona de Asteraceae (Figura complementaria 37 y Nota complementaria 22).

a, f Número de genes para las familias del transportador de nitrato 2 (NRT2) y NRT3 en Asteraceae y otras especies de plantas terrestres. **P < 0,01 y ***P < 0,001, según lo determinado mediante la prueba t de Student de dos colas. El número (n) de puntos de datos para cada grupo se muestra a continuación. Los datos se presentan como valores medios +/−SD. b, g Valor Ka/Ks de pares de genes ortólogos (Sc. taccada versus La. sativa) y pares de genes parálogos (La. sativa versus La. sativa) de los miembros del clado I NRT2 (d) y clado III NRT3 (i). c, h Visualización de microsynteny de sintelogs de clado I NRT2 (d) y clado III NRT3 (i) en Sc. Genomas de taccada y La. sativa. Los pares ortólogos NRT2 y NRT3 están resaltados con líneas verdes. d, i Árbol filogenético simplificado de NRT2 (d) y NRT3 (i) en especies de Asteraceae y otras especies. Los genes de la especie Asteraceae están marcados en rojo oscuro, mientras que los clados de otras especies están colapsados. e, j Expresión de NRT2 (e) y NRT3 (j) en diferentes tejidos de cuatro especies representativas de Asteraceae. Los valores de FPKM de genes en diferentes tejidos se escalan por filas para enfatizar el tejido con la mayor expresión. Los datos de origen se proporcionan como un archivo de datos de origen.

Análisis de colinealidad entre lechuga y Sc. taccada reveló que la expansión de las familias NRT2 y NRT3 fue iniciada por el evento WGT y surgió principalmente por duplicaciones en tándem (Fig. 4c, h). Los NRT2 de Asteraceae se agruparon principalmente en los clados I y II de un árbol filogenético reconstruido (Fig. 4d y Fig. 53 complementaria) con expresión preferencial en la raíz (Fig. 4e y Fig. 54 complementaria). Estos genes se agruparon junto con miembros clave de los transportadores de nitrato de alta afinidad en Arabidopsis, incluidos genes que funcionan principalmente en las raíces, como NRT2.1 (At1g08090), NRT2.2 (At1g08100) y NRT2.6 (At3g45060) (Figura complementaria. 53 y Nota Complementaria 22)31. De manera similar, los miembros de NRT3 en Asteraceae se agruparon principalmente en dos clados (II y III; Fig.4i) y se expresaron preferentemente en la raíz (Fig. 4j y Fig. 55 y 56 complementarias). El valor Ka / Ks de los pares de genes ortólogos y pares de genes parálogos de los miembros del clado I NRT2 y del clado III NRT3 indicó que todos los genes duplicados se sometieron a una selección purificadora durante la evolución (Fig. 4b, gy Nota complementaria 22). Estas observaciones demuestran una expansión de los transportadores de nitrato de alta afinidad en Asteraceae a través de WGT y duplicaciones en tándem posteriores.

Otra fuerte huella genómica de la pérdida de PII fue que los genes asociados con el metabolismo de los ácidos grasos en Asteraceae estaban enriquecidos en TRR, se habían expandido rápidamente y tenían numerosas entradas de InterPro (Datos complementarios 1 a 5, Figuras complementarias 17b y 57 a 59, y Figuras complementarias 1 a 5). Nota 23). En consecuencia, analizamos los genes clave en la biosíntesis de ácidos grasos, es decir, ADS, FAD y 3-oxoacil-[proteína portadora de acil] sintasas (KAS). Las tres familias se expandieron significativamente en Asteraceae en comparación con las otras especies (P <0,01; Fig. 5a y Figs. complementarias 60-63). Por ejemplo, la SC. El genoma de taccada contenía solo tres genes FAD, mientras que los de las especies de Asteraceae contenían al menos 14 FAD (Fig. 5b y Nota complementaria 23). Exploramos los mecanismos que gobiernan la expansión de estas familias de genes. De manera similar a las familias NRT, la expansión de las familias ADS, FAD y KAS se produjo inicialmente a través del evento WGT y posteriormente mediante duplicaciones en tándem (Fig. 5c, Nota complementaria 23 y Figs. complementarias 60-65).

a Número de genes para ADS, FAD y KAS en las siete especies de Asteraceae y otras 22 plantas terrestres. ****P < 0,0001, según lo determinado mediante la prueba t de Student de dos colas. El número (n) de puntos de datos para cada grupo se mostró debajo de los ejes x. Los datos se presentan como valores medios +/−SD. b Árboles filogenéticos simplificados de ADS, FAD y KAS en las siete especies de Asteraceae, Sc. taccada y 21 plantas terrestres representativas. Los genes de las especies Asteraceae y Sc. taccada están marcados con diferentes colores y estrellas como se indica, y los clados de otras especies están colapsados. c Visualización microsintética de patrones típicos de expansión de genes ADS, FAD y KAS en las especies representativas de Asteraceae y Sc. taccada. Los datos de origen se proporcionan como un archivo de datos de origen.

La secuenciación y comparación del genoma revelaron un escenario único en la evolución de las Asteraceae. Antes de la división entre Asteraceae y Goodeniaceae, una gran inversión cromosómica colocó el locus PII cerca del telómero, que, según nuestra hipótesis, se perdió posteriormente debido a una microinversión (Fig. 3). En comparación con otras plantas superiores y especies de Goodeniaceae, Asteraceae desarrolló una mejora gradual del sistema de equilibrio NC, inicialmente a través del WGT que ocurrió aproximadamente entre 78 y 82 millones de años (Fig. 2a), y posteriormente mediante duplicaciones en tándem. En el sistema Asteraceae, la expansión de los genes transportadores de nitrato de alta afinidad aumentó potencialmente su capacidad para absorber N (Fig. 6 y Nota complementaria 22), especialmente en ambientes pobres en N (Fig. 4). Además, la eliminación de la inhibición de PII aumentaría la actividad de la ACCasa (Fig. 3) y proporcionaría más sustratos para la biosíntesis de ácidos grasos (Fig. 6b y Nota complementaria 23, que se cumpliría mediante la expansión de los genes de biosíntesis de ácidos grasos FAD, KAS, y ADS (Fig. 5). Por lo tanto, proponemos que las Asteraceae desarrollaron un sistema de equilibrio NC único después de la pérdida de PII, lo que resultó en una mayor capacidad de absorción de N y biosíntesis de ácidos grasos (Fig. 6), lo que puede explicar su alta biodiversidad y Excelente adaptabilidad.

un sistema de equilibrio NC canónico en especies que contienen PII. La estructura de la PII trimérica se descargó del Protein Data Bank (//www.ncbi.nlm.nih.gov/Structure/pdb/2O67). b El sistema de equilibrio NC deducido en Asteraceae que carece de PII. La absorción reforzada de N y los procesos de asimilación de N y C se muestran en negrita y en rojo. Los procesos de regulación estaban indicados por líneas, mientras que las de puntos representaban el proceso biológico que no ha sido confirmado directamente pero sí altamente especulativo.

La novedad genómica basada en duplicaciones del genoma contribuye a la especiación y la radiación adaptativa y, en consecuencia, es probable que permita a los organismos utilizar nuevas oportunidades ecológicas o gestionar nuevos desafíos ambientales13,15,32. De acuerdo con informes anteriores2,9,12, estimamos que la paleopoliploidización temprana en Asteraceae ocurrió cerca de la especiación de Asteraceae y Goodeniaceae, remontándose al período Cretácico tardío (~80 millones de años), lo que posiblemente proporcionó materiales genéticos para manejar una serie de explosivos. Radiaciones durante el Eoceno. La evidencia empírica limitada sugiere que los genes duplicados comúnmente retenidos después de la paleopoliploidización en las vías críticas relacionadas con el estrés podrían ser los factores clave que mejoran parcialmente la adaptabilidad. Por ejemplo, los genes que alteran la pared celular en respuesta a las bajas temperaturas y la oscuridad comúnmente se conservaban después de los WGD, cuando el enfriamiento global y la oscuridad eran los dos factores de estrés principales33. La investigación de los duplicados de la familia de genes MADS-box en las eudicotiledóneas centrales sugirió que el evento WGT-γ probablemente inició la diversificación funcional de los reguladores del desarrollo de los órganos florales, favoreció la innovación morfológica de las flores y promovió potencialmente la radiación adaptativa de las eudicotiledóneas centrales32. En particular, utilizando Sc. taccada como referencia nos permitió obtener de forma independiente genes retenidos después de la paleopoliploidización en las especies de Asteraceae. Curiosamente, observamos que los genes asociados con la biosíntesis de la pared celular, la proteína fosfatasa, la floración y la biosíntesis de ácidos grasos se enriquecieron simultáneamente en los TRR de los genomas de Asteraceae estudiados (P <0,05), y varias familias vitales están relacionadas con la adaptabilidad, como las MADS. -box, PME y ADS (Figura complementaria 17b). Por lo tanto, esta retención genética sesgada después de los WGD está potencialmente relacionada con la adaptabilidad y especiación de Asteraceae.

Además, la sub/neofuncionalización de genes duplicados vitales aumenta la diversidad genética y posiblemente facilita la evolución adaptativa en Asteraceae. Dichos genes incluyen reguladores esenciales y genes funcionales relacionados con la defensa (Nota complementaria 17). Sorprendentemente, los signos de amplificación y diferenciación dramáticas de la familia de genes FERONA condujeron a una masa de genes específicos de linaje, acompañados de la aparición de miARN específicos de Asteraceae (Nota complementaria 17). Además, la divergencia genética de las vías biosintéticas de los alcaloides y la inulina determinó potencialmente la base genética de estas características en Asteraceae (Nota complementaria 17). Como componente más abundante de los genomas, los (retro)transposones, que funcionan mediante sus inserciones en genes o regiones promotoras, son impulsores clave adicionales que provocan la divergencia de genes y genomas en las plantas. Por ejemplo, las proteínas derivadas de la transposasa FHY3/FAR1 regulan la biosíntesis de clorofila en A. thaliana34. Aquí, observamos que los genes (retro) asociados a transposones eran significativamente mayores en Asteraceae, incluidos varios genes clave, como RVT-Znf y RT_RNaseH_2. BDR4 (Figura complementaria 22f). Además, los genes con elementos de ADN potencialmente reguladores derivados de elementos (retro)transponibles estaban involucrados en una amplia gama de funciones biológicas, como BDR4 (Nota complementaria 14 y Figura complementaria 22f). Nuestras observaciones fueron consistentes con otros estudios previos que reflejaron el importante papel de las secuencias repetitivas en la diversificación de los genomas de Asteraceae35,36. Todos los datos discutidos anteriormente proporcionan evidencia de los impulsores y los impactos de la dinámica genómica y genética en la radiación de las especies y las características conservadoras/de innovación de la familia Asteraceae.

Los potentes sistemas de captación y absorción de nitrógeno son esenciales para que las plantas sobrevivan en ambientes con nutrientes limitados y son particularmente frecuentes en Asteraceae. Como representante de la planta Asteraceae de rápido crecimiento, M. micrantha, sus metabolitos pueden aumentar la disponibilidad de nitrógeno enriqueciendo los microbios que participan en las vías del ciclo del nitrógeno37. Aquí, identificamos que la PII, que desempeña un papel clave en la detección de señales de nitrógeno y carbono en todos los ámbitos de la vida18, se ha perdido en las plantas de Asteraceae. Cuando se expresa PII exógena en lechuga, las proteínas PII aún pueden interactuar con NAGK e inhibir la actividad ACCasa, lo que a su vez afecta muchas vías fisiológicas y metabólicas, como alterar la síntesis de aminoácidos y la absorción de N (nitrato). Estos cambios indican que Asteraceae, representada por la lechuga, ha desarrollado un sistema de equilibrio NC único. Dado que el sistema de detección de PII es beneficioso para mantener la homeostasis metabólica bajo un suministro fluctuante de nitrógeno, es posible que la pérdida de PII en los ancestros de las Asteraceae no fuera desventajosa. Debido al aumento de los genes NRT2/3 a través de WGT y la duplicación en tándem, los genes NRT2/3 (como binarios), los llamados transportadores de nitrato de alta afinidad, podrían absorber nitrato de un ambiente de baja concentración de nitrato y proporcionar un suministro de nitrógeno relativamente abundante. resultando en equilibrar las desventajas de la pérdida de PII en Asteraceae. En esta situación, las especies de Asteraceae desarrollaron aún más sistemas compensatorios para compensar la pérdida de PII, lo que llevó a su aptitud superior y radiación sucesiva.

La base genética alterada del sistema de equilibrio NC tiene definitivamente una influencia multifacética en la fisiología de las plantas de Asteraceae y finalmente afecta la capacidad de adaptación al medio ambiente. La expansión genética de los transportadores de nitrato de alta afinidad aumentó objetivamente la capacidad de las plantas para absorber nitrógeno y, por tanto, su adaptabilidad. Por ejemplo, la señalización del glutamato activa las respuestas de las plantas y la adaptación al estrés ambiental38, además de la germinación de las semillas39, la arquitectura de las raíces40, la germinación del polen y el crecimiento del tubo polínico41,42. El uso de glutamato como molécula de señalización también está implicado en la respuesta y adaptación a la sal, el frío, el calor, la sequía, los patógenos y el estrés de las heridas38,43,44. La PII regula la síntesis de ácidos grasos en los cloroplastos al interactuar con el complejo ACCasa e inhibe su actividad. En Asteraceae, aliviar la inhibición de ACCasa proporciona más sustratos posibles para la biosíntesis de ácidos grasos (AG) y UFA (Fig. 6). Las plantas han desarrollado estrategias elaboradas con los AUG que han surgido como defensores generales para evitar efectos adversos45,46.

Dado que la pérdida de PII en Asteraceae podría ocurrir en el antepasado de Goodeniaceae y Asteraceae (~80 millones de años), el sistema de equilibrio NC único en Asteraceae evolucionó durante una larga historia, lo que podría resultar en cambios complicados en comparación con otras plantas con PII. Se necesitan más estudios para investigar a fondo la maquinaria de adaptación fisiológica y metabólica basada en el sistema de equilibrio NC único en Asteraceae. Limitados por la distribución geográfica y la disponibilidad de información genómica, no pudimos incluir Calyceraceae, que es el otro linaje hermano de Asteraceae y compartió WGT-125. El muestreo adecuado de los genomas de Calyceraceae y las subfamilias basales de Asteraceae (por ejemplo, Barnadesioideae, Famatnanthoideae y Stifftioideae) nos ayudará a revelar completamente el sistema de equilibrio NC único en Asteraceae y su historia evolutiva en el futuro. Con base en la comprensión detallada de este sistema de equilibrio NC único, se podrían diseñar estrategias mediante la reconstrucción del sistema NC para mejorar los cultivos, especialmente para enfrentar los desafíos climáticos globales.

Se plantó lechuga de tallo (Lactuca sativa var. angustana) en el invernadero de la Academia de Ciencias Agrícolas y Forestales de Beijing (BAAFS), Beijing (39°94´N y 116°28´E) en la primavera de 2018, y Scaevola taccada Se recolectaron plántulas de Haikou, provincia de Hainan (20°03´N y 110°12´E) y se plantaron en una cámara climática artificial en BAAFS en el verano de 2019.

Se recolectaron muestras para el ensamblaje de novo de una sola planta de lechuga y de un solo Sc. planta taccada. Para la secuenciación de una sola molécula en tiempo real (SMRT), se aisló el ADN genómico utilizando un kit Midi de ADN para cultivo celular y de sangre (QIAGEN Inc., Valencia, CA, EE. UU.). Las bibliotecas de 20 kb se construyeron utilizando kits de preparación de plantillas SMRTbell (Pacific Biosciences, Menlo Park, CA, EE. UU.) y se secuenciaron en un instrumento PacBio RS II (Pacific Biosciences) utilizando el reactivo de secuenciación P6-C4. Para los análisis de HiSeq, el ADN se aisló utilizando kits de ADN genómico de plantas (Tiangen, Beijing, China). Se prepararon y secuenciaron bibliotecas con inserciones de 450 pb en una plataforma Illumina HiSeq X (San Diego, CA, EE. UU.) para lecturas de extremos emparejados de 150 pb. Se utilizaron hojas jóvenes para el mapeo óptico aislando ADN de alto peso molecular, que luego se marcó usando la enzima de marcado directo DLE-1 después del aislamiento. Se tomaron imágenes de las muestras de ADN marcadas utilizando un sistema BioNano Irys (Bionano Genomics, San Diego, CA, EE. UU.), y solo se usaron moléculas > 150 kb para análisis adicionales. Para la biblioteca Hi-C, las hojas se fijaron en formaldehído al 1% (v/v) y la reacción de reticulación se terminó añadiendo glicina. Luego, las secciones de hojas se retiraron de la mezcla, se enjuagaron con ddH2O y se molieron hasta obtener un polvo fino en nitrógeno líquido para aislar el ADN entrecruzado. El ADN reticulado aislado se purificó, se digirió con enzimas MobI y se marcó con biotina. Los fragmentos de ADN marcados con biotina se capturaron y se enriquecieron por PCR para construir la biblioteca Hi-C47. La biblioteca Hi-C se secuenció en una plataforma Illumina HiSeq X como lecturas de extremos emparejados de 150 pb. Se recolectaron muestras de hojas, flores, raíces y tallos por separado para la secuenciación profunda del transcriptoma (RNA-Seq). El ARN total se aisló utilizando un kit RNAprep Pure Plant (Tiangen). La construcción de la biblioteca RNA-seq se realizó siguiendo el protocolo estándar del fabricante (Illumina) y se secuenció en una plataforma Illumina HiSeq X.

Se utilizó el software Jellyfish (v2.0)48 para calcular la frecuencia de k-mer (longitud de k-mer 21), luego se usó Genomescope (v1.0.0)49 para estimar la heterocigosidad del genoma, el contenido repetido y el tamaño del genoma a partir de las lecturas de secuencia. .

Se recolectaron hojas tiernas de Sc. secuenciados. planta taccada y analizado mediante un citómetro de flujo. Se analizaron muestras de álamo negro (Populus trichocarpa) (2n = 2x = 38) y tomate (Solanum lycopersicum) (2n = 2x = 24) como referencias del tamaño del genoma. Se recolectaron y detectaron más de 5000 núcleos por muestra utilizando un citómetro de flujo CyFlow Space (Partec, Alemania) equipado con una fuente UV-LED (emisión a 365 nm) y un láser azul de estado sólido (455 nm). Los datos se analizaron utilizando Flomax2.8 (Sysmex Partec, Francia), con un coeficiente de variación <5%.

El ensamblaje del genoma de la lechuga se realizó de forma gradual. Primero, se utilizó Falcon (v0.4)50 para obtener los contigs iniciales. Luego, se realizó un paso de pulido inicial con Arrow (v2.2.3) usando lecturas largas solo de PacBio, y luego se usó Pilon (v1.20)51 para corregir los errores de secuenciación en los contigs con lecturas cortas precisas de Illumina. Los mapas ópticos de Bionano se ensamblaron en mapas físicos de consenso utilizando BioNano Solve v3.0.1 (//bionanogenomics.com/). Para anclar los armazones híbridos en los cromosomas, Juicer (v1.5)52 y 3D-DNA (v201008)53 alinearon los datos de secuenciación de Hi-C en los armazones.

El PacBio lee del Sc. El genoma de taccada se corrigió utilizando el módulo de corrección de lecturas del canal CANU (v1.7.1)54. El ensamblaje de novo se realizó utilizando el software WTDBG2 (v2.5)55 en el modo CCS. Para anclar los armazones híbridos en los cromosomas, los datos de secuenciación Hi-C se alinearon en armazones como se describe para el tallo de lechuga.

La calidad del ensamblaje del genoma se evaluó a diferentes niveles. Las lecturas de Illumina con alta precisión de base única se alinearon utilizando BWA (0.7.12-r1039)56. Se calcularon lecturas asignadas correctamente para reflejar el grado correcto de ensamblaje. La precisión base de la secuenciación se determinó calculando el valor de calidad (QV) del conjunto21,22. Brevemente, la llamada al polimorfismo de un solo nucleótido (SNP) se realizó en función de las lecturas alineadas usando SAMtools (v1.4)57, y el número de SNP se contó con escala Phred >30 y cobertura >3 (n). Simultáneamente, también se calculó (N) el número de posiciones del genoma con cobertura de lectura> 3. Finalmente, el QV del conjunto se calculó como:

La integridad del panorama genético se estimó utilizando datos de expresión, incluidos datos de RNA-seq y etiquetas de secuencia expresada (EST). Las EST de lechuga de GenBank se alinearon con los genomas ensamblados utilizando la herramienta de alineación tipo BLAST (v0.36) con parámetros predeterminados58. Las lecturas generadas en este estudio a partir de diferentes lechugas y Sc. Los tejidos taccada (raíces, hojas, flores y tallos) se alinearon con los dos genomas utilizando Hisat2 (v2.1.2)59. Se calculó BUSCO para evaluar la integridad del ensamblaje y la anotación del genoma con ortólogos de copia única60.

Minimap2 (v2.18) 61 realizó la alineación por pares entre nuestro genoma de lechuga SL1.0 y el genoma de lechuga de hoja publicado anteriormente (el genoma Lsa_v1) y se visualizó a través de Minidot (https://github.com/thackl/minidot). El ensamblaje de secuencias repetidas fue evaluado mediante el programa de índice de ensamblaje de repetición terminal larga (LAI), que evalúa la contigüidad de un ensamblaje utilizando retrotransposones de repetición terminal larga (LTR-RT). La canalización LTR_retriever (v2.9.0)62 se utilizó para integrar los LTR-RT candidatos identificados por LTR_FINDER (v1.0.7)63 y LTRharvest (v1.5.9)64. Luego se calculó el LAI del genoma completo basándose en la biblioteca LTR-RT generada por LTR_retriever.

Los dos genomas fueron anotados con la misma tubería. Para las secuencias repetidas, se construyó una biblioteca de repeticiones personalizada para incluir familias de repeticiones conocidas y novedosas. Se buscaron elementos transponibles invertidos en miniatura (MITE) de los dos ensamblajes utilizando MITE-Hunter (v1.0)65 con parámetros predeterminados. Luego se utilizó la canalización LTR_retriever para integrar los LTR-RT candidatos identificados por LTR_FINDER y LTRharvest. Se realizó un enmascaramiento repetido inicial de los genomas con la biblioteca repetida derivada de la combinación de los MITE y LTR-RT identificados. El genoma enmascarado repetidamente se cargó en RepeatModeler (v1.0.11)66 para identificar familias repetidas. Finalmente, todas las secuencias repetidas identificadas se combinaron y buscaron en una base de datos de proteínas vegetales (Swiss-Prot, https://www.uniprot.org/) que excluía las proteínas codificadas por transposones. Se eliminaron los elementos con similitud significativa con los genes de las plantas. Se utilizó RepeatMasker (v4.0.6)66 para buscar elementos transponibles (TE) similares en la biblioteca Repbase TE y en la biblioteca de repetición personalizada.

Los genes codificadores de proteínas se predijeron a partir del genoma enmascarado repetido utilizando MAKER-P (v2.31.10)67, que integra evidencia de homología de proteínas, transcripciones y predicciones ab initio. La evidencia basada en homología se obtuvo alineando secuencias de proteínas de siete especies de plantas (Arabidopsis thaliana, lechuga, girasol [Helianthus annuus], alcachofa [Cynara cardunculus var. scolymus], Chrysanthemum nankingense, Artemisia annua y arroz [Oryza sativa]) con cada ensamblaje del genoma.

Los datos de RNA-seq derivados de cuatro bibliotecas diferentes se ensamblaron de novo utilizando Trinity (v2.8.2)68. También se utilizaron EST extraídas de las bases de datos de nucleótidos y EST del NCBI (//www.ncbi.nlm.nih.gov/nucleótido/) para predecir genes. Primero, todas las secuencias de transcripción se cargaron en el proceso PASA (v2.4.1)68 para realizar el ensamblaje de alineación. Se extrajeron cinco mil modelos y secuencias de genes completos para entrenar los parámetros de SNAP (v1.0) y el software Augustus (v3.0.3)69,70. Luego, todos los datos y predicciones se utilizaron para producir un conjunto de genes de consenso. Finalmente, se utilizó nuevamente el proceso PASA para refinar el modelo genético obtenido.

Para refinar la identificación de microARN (miARN), las lecturas se alinearon con el genoma enmascarado repetido usando BWA56 y los miARN se identificaron usando miRDeep2 (v0.1.3)71. Los genes de ARN de transferencia y ARN ribosómico se predijeron utilizando los algoritmos del paquete tRNAscan-SE (v2.0.0)72 y RNAmmer (v1.2) con parámetros predeterminados73, respectivamente. Otros ARN no codificantes se identificaron utilizando Infernal cmscan (v1.1.4)74 mediante una búsqueda en la base de datos Rfam (//rfam.xfam.org/, versión 13.0).

Se empleó OrthoFinder (v2.4.0)75 para inferir grupos ortólogos en las 29 especies seleccionadas. Los 29 genomas consistían en 7 especies de Asteraceae, 8 del orden Asterids, 6 de los clados Rosids, 3 de clados monocotiledóneas y 5 especies antiguas (Ginkgo biloba, pícea noruega [Picea abies], Selaginella moellendorffii, Amborella trichopoda y China). árbol de tulipán [Liriodendron chinense]). Se identificaron genes de bajo número de copias (LCN) según los resultados de OrthoFinder con los requisitos: copia estrictamente única en La. sativa, Sc. taccada, Se. moellendorffii, G. biloba y vid (Vitis vinifera), y copia única en al menos 5 de las 24 especies seleccionadas76.

Se utilizaron dos métodos independientes para reconstruir el árbol de especies de las 29 especies seleccionadas. Se realizaron múltiples alineamientos utilizando MUSCLE (v3.8.31)77. A continuación, se utilizó trimAL (v1.2)78 para recortar regiones alineadas de baja calidad con la opción “-automated1”. Los árboles de genes LCN se estimaron a partir de los sitios restantes utilizando RAxML (v.7.7.8)79 con el modelo JTT + G + I para secuencias de aminoácidos. El modelo de mejor ajuste se seleccionó utilizando ModelFinder bajo el criterio de información bayesiano80. La reconstrucción filogenética se realizó paso a paso con un conjunto cuidadosamente seleccionado de 9784 genes utilizando el método de coalescencia implementado en ASTRAL (v5.5.1)81. Además, se concatenaron las múltiples secuencias de alineación de los genes en los 389 LCN OrthoGroups (OG) y se reconstruyó el árbol de especies utilizando RAxML.

Se concatenaron los 389 genes LCN (185,822 sitios) en cada especie y se corrigió la topología del árbol inferida de nuestro análisis basado en coalescencia de los 9784 genes de 29 taxones. Luego, se realizó un análisis de datación filogenómica bayesiana de los genes seleccionados en MCMCtree, parte del paquete PAML (v4.10.0)82, y un cálculo de probabilidad aproximado para las longitudes de las ramas. La datación molecular se realizó utilizando un modelo autocorrelacionado de variación de la tasa entre linajes, el modelo de sustitución JC69 y un previo uniforme en los tiempos relativos de los nodos. Las distribuciones posteriores de las edades de los nodos se estimaron utilizando el muestreo de Monte Carlo de la cadena de Markov, con muestras extraídas cada 200 pasos en más de 10 millones de pasos después de un período de prueba de 200.000 pasos. También se implementó el método de probabilidad penalizada bajo una tasa de sustitución variable usando r8s (v1.8.1). Se implementaron tres calibraciones de fósiles correspondientes a los grupos de coronas de angiospermas (~126 millones de años), eudicotiledóneas (~120 millones de años) y monocotiledóneas (~113 millones de años) como restricciones de edad mínima en nuestro análisis de datación por probabilidad penalizada83. El mejor valor del parámetro de suavizado de los genes LCN concatenados se determinó realizando validaciones cruzadas de un rango de parámetros de suavizado de 0,01 a 10.000 (algoritmo = TN; crossv = sí; cvstart = 0; cvinc = 0,5; cvnum = 15). Finalmente, se calibró un reloj molecular relajado mediante el tiempo de divergencia por pares en el sitio web TIMETREE (http://www.timetree.org/)84 y el tiempo de divergencia de las especies se estimó utilizando r8s (v1.8.1)85. Se utilizó el software CAFÉ (v4.2.1)86 para calcular la evolución de la familia de genes basándose en el árbol filogenético y los grupos ortólogos.

El sc. taccada, lechuga, girasol, alcachofa, cap. Se compararon los genomas de Nankingense y café (Coffea arabica). MCscan (v1.3.6)87 identificó comparaciones de Synteny con parámetros predeterminados para predecir parálogos y ortólogos. La divergencia de secuencia de parálogos (dentro de cada genoma) y ortólogos (entre Sc. sericea y otro genoma) se calculó en base a sustituciones sinónimas (Ks) utilizando el método de máxima verosimilitud implementado en codeml del paquete PAML88 bajo el modelo F3x4.

Las regiones retenidas por triplicación (TRR) se definieron en los genomas a escala cromosómica de las especies de Asteraceae, lechuga, alcachofa, girasol y Mikania micrantha. No se produjeron otros eventos de WGD en los genomas de lechuga y alcachofa después del evento WGT-1. Sin embargo, el girasol y M. micrantha experimentaron otro evento WGD después del WGT-1. Primero, el SC. MCscan87 utilizó el genoma de taccada como referencia común para generar regiones ortólogas en relación con otros genomas de Asteraceae seleccionados. Para lechugas y alcachofas, las tres mejores combinaciones para cada Sc. La región taccada se extrajo para calcular el diseño de los equivalentes a nivel de gen. Las regiones genómicas que contenían genes homólogos triplicados consecutivos se definieron como TRR. Para girasol y M. micrantha, las seis mejores coincidencias para cada Sc. Se extrajo la región taccada y las regiones genómicas que contenían cuatro, cinco y seis copias consecutivas de genes homólogos se definieron como TRR.

Se investigó más a fondo la composición genómica de los TRR en las especies de Asteraceae. Las secuencias repetidas se integraron y anotaron con Extensive de novo TE Annotator (EDTA, v2.0.0)89. Para comparar, se calculó la composición genómica (secuencias genéticas o repetitivas) dentro de ventanas de 1 Mb y pasos de 1 Mb en todo el genoma. Las matrices de datos por pares se sometieron a una prueba t de Student de dos colas para examinar la importancia de la diferencia. Cada familia de secuencias repetitivas se sometió a una prueba hipergeométrica para predecir el enriquecimiento o el agotamiento de los TRR en comparación con su distribución en todo el genoma. Se realizó una corrección de pruebas múltiples mediante el método de tasa de descubrimiento falso (FDR) y el umbral ajustado se estableció en P <0,01.

La ontología genética (GO) se realizó en los TRR utilizando Cytoscape (v3.8.2)90. Los términos GO significativamente enriquecidos (P <0,01) compartidos por los genomas se identificaron y visualizaron utilizando el paquete ggplot2. Las familias de genes sobrerrepresentadas en los TRR se examinaron mediante una prueba hipergeométrica.

La función de las proteínas codificadas por todos los genes predichos se anotó utilizando InterProScan (v5.24)91 mediante la búsqueda en bases de datos disponibles públicamente. Los ID de Gene Ontology (GO) y Kyoto Encyclopedia of Genes and Genomes (KEGG) para cada gen se asignaron de acuerdo con la entrada correspondiente de InterPro. El análisis de enriquecimiento se realizó en función de los dominios funcionales de todas las proteínas codificadas en las 29 especies utilizando la prueba de Fisher con una corrección FDR.

Después de recortar las secuencias del adaptador y eliminar las lecturas de baja calidad, los datos de secuencia de ARN de cada muestra se asignaron a los genomas de referencia utilizando Hisat 2 (v2.1.2)59 y StringTie (v1.3.4)92 con parámetros predeterminados. Los niveles de expresión génica se normalizaron como fragmentos por kilobase de exón por millón de fragmentos mapeados (FPKM).

Los tejidos vegetales utilizados para el estudio de la función PII procedían del cultivar de lechuga 'Grand Rapids'. Semillas esterilizadas en superficie se germinaron en placas de agar Murashige y Skoog (MS) que contenían 3% (p/v) de sacarosa y 0,8% (p/v) de agar, con el pH ajustado a 5,8 con KOH. Las plantas se cultivaron en cámaras de crecimiento a 25 °C bajo un fotoperíodo de 16 h de luz/8 h de oscuridad. El ADNc de PII de longitud completa de zanahoria (DcPII, DCAR_002917), tomate (SIPII, Solyc06g009400.3.1) y Arabidopsis (AtPII, AT4G01900) se clonó en un vector de expresión vegetal (pYBA1132), respectivamente, y luego se transformó en lechuga con Agrobacterium (Agrobacterium tumefaciens, cepa EHA105) utilizando el método de transformación del disco foliar93.

El ARN total se extrajo de plántulas de lechuga utilizando el reactivo TRIzol (Invitrogen, Carlsbad, CA, EE. UU.) y se trató con DNasa I (TaKaRa, Dalian, China) para eliminar la contaminación del ADN genómico. El ARN total se transcribió de forma inversa en ADNc utilizando la transcriptasa inversa SuperScript II (Invitrogen) y cebadores aleatorios (Promega, Madison, WI, EE. UU.). La expresión relativa de PII se midió utilizando Power SYBR Green PCR Master Mix (Applied Biosystems, Waltham, MA, EE. UU.) en un termociclador ABI 7500 (Applied Biosystems) siguiendo las instrucciones del fabricante. Los cebadores se diseñaron utilizando Primer Premier 5 (//www.premierbiosoft.com/primerdesign/) (Datos complementarios 15). Se realizaron tres réplicas biológicas para cada muestra. Se utilizó TUBULIN (TUB) de lechuga como referencia interna para normalizar los datos. Los cebadores fueron TUB-F: 5'-TAGGCGTGTGAGTGAGCAGT-3' y TUB-R: 5'-AACCCTCGTACTCTGCCTCTT-3'. El cambio en los valores de expresión génica se calculó utilizando el método 2 –ΔΔCt (umbral de ciclo). Los valores relativos de expresión génica se representaron utilizando SigmaPlot versión 10.0 (SYSTAT Software, Inc., https://systatsoftware.com/).

Las hojas de plantas transgénicas que portaban la construcción derivada de pYBA1132 que expresaba la fusión de la proteína verde fluorescente (GFP) se cortaron en pequeños cuadrados para la observación de la fluorescencia. La fluorescencia de GFP o autofluorescencia de cloroplasto se observó mediante microscopía confocal de barrido láser (ZEISS710; Carl Zeiss, Oberkochen, Alemania).

Las regiones codificantes de PII en tres especies y LsNAGK se ligaron a los vectores pMal-C5x y pGEX-4T-1, respectivamente. Los plásmidos construidos se transformaron en células competentes de Escherichia coli BL21 (ZOMANBIO, Beijing, China). Los vectores vacíos también se transformaron en células competentes para el control negativo. Las células se cultivaron en medio Luria-Bertani (LB) a 37 °C hasta que la DO600 alcanzó 0,5 y luego se enfriaron a 16 °C. Añadir IPTG al medio hasta la concentración final de 200 μM y cultivar durante la noche en una incubadora a 160 rpm a 16 °C. La proteína PII fusionada con MBP y MBP se purificó con resina de amilosa (NEB, MA, EE. UU.). La proteína LsNAGK fusionada con GST y GST se purificó mediante GST MagBeads (Sangon Biotech, Shanghai, China).

Se adsorbieron GST purificada y proteína LsNAGK fusionada con GST (10 nmol) sobre las perlas magnéticas de GST. Se agregaron proteínas MBP y PII fusionadas con MBP al sistema y se incubaron a temperatura ambiente durante dos horas. Luego, las perlas magnéticas se lavaron dos veces y se hirvieron en tampón de carga SDS 1X durante 15 minutos y se analizaron mediante transferencia Western utilizando anticuerpos anti-GST y anti-MBP (Yeasen, Shanghai, China).

Para el experimento de complementación de fluorescencia bimolecular (BiFC), los plásmidos construidos y los vectores vacíos se transformaron en células competentes de Agrobacterium EHA105 (Coolaber, Beijing, China). Al mismo tiempo, se cultivó Agrobacterium GV3101 que porta la proteína de expresión P19. Se coinfiltraron diferentes combinaciones de soluciones de agrobacterium cYFP, nYFP y P19 en las hojas de Nicotiana benthamiana. Las señales de fluorescencia se detectaron utilizando un microscopio confocal Nikon A1. La señal YFP se excita mediante un láser a 488 nm. También detectamos autofluorescencia de cloroplastos a 665 nm para determinar la ubicación de LsNAGK y PII.

Se cosecharon plantas frescas, se congelaron inmediatamente y se molieron hasta obtener una fina molienda en nitrógeno líquido. Para determinar el contenido de monómeros de aminoácidos libres, se extrajeron muestras con ácido clorhídrico 0,1 M y se derivatizaron con reactivo Waters AccQ•Tag. Los extractos de las muestras se analizaron utilizando un sistema UPLC-Orbitrap-MS (UPLC, sistema de cromatografía líquida de ultra alto rendimiento Vanquish; MS, espectrómetro de masas híbrido Q-Orbitrap Q Exactive, Thermo Fisher Scientific, EE. UU.). El contenido total de aminoácidos libres se calculó como la suma de los contenidos de 25 monómeros de aminoácidos libres.

La actividad ACCasa se detectó mediante el método del azul de molibdeno (Boxbio, Beijing, China). En resumen, el ACC puede catalizar acetil coenzima A, NaHCO3 y ATP para generar malonil CoA, ADP y fósforo inorgánico. El azul de molibdeno y el fosfato generan una sustancia con un pico de absorción característico a 660 nm. La actividad de ACC se determina midiendo el aumento de fósforo inorgánico mediante el método de determinación de fósforo con molibdato de amonio. Medimos la actividad ACCasa de lechuga PII de tipo salvaje y con sobreexpresión utilizando el lector de microplacas multimodo BioTek Synergy H1 (Agilent, Santa Clara, CA, EE. UU.) para tres réplicas biológicas y tres réplicas técnicas.

El contenido de nitrógeno nitrato se midió mediante el método del ácido nitrosalicílico utilizando el kit de ensayo correspondiente (Boxbio, Beijing, China). En resumen, el NO3- puede reaccionar con el ácido salicílico para formar ácido nitrosalicílico en condiciones de ácido concentrado, que se vuelve amarillo en condiciones de pH>12. Dentro de un cierto rango, la profundidad del color es proporcional al contenido. Medimos el contenido de nitrógeno nitrato de lechuga PII de tipo salvaje y con sobreexpresión utilizando el lector de microplacas multimodo BioTek Synergy H1 (Agilent, Santa Clara, CA, EE. UU.) para tres réplicas biológicas y tres réplicas técnicas.

Más información sobre el diseño de la investigación está disponible en el Resumen del informe de Nature Portfolio vinculado a este artículo.

Los datos de secuenciación utilizados en este estudio, los cromosomas ensamblados, los andamios no colocados y las anotaciones se depositaron en la base de datos Genome Sequence Archive (GSA) y Genome Warehouse (GWH) en el BIG Data Center con el código de acceso PRJCA007442. También se puede encontrar información detallada sobre la lechuga de tallo en LettuceGDB [https://lettucegdb.com/]94. Se han subido a Zenodo [https://zenodo.org/record/8058114]95 archivos adicionales que incluyen la biblioteca de repeticiones personalizada, árboles genéticos y árboles filogenéticos. Los datos originales se proporcionan con este documento.

Proyecto Genoma Amborella et al. El genoma de Amborella y la evolución de las plantas con flores. Ciencia 342, 1241089 (2013).

Artículo de Google Scholar

Mandel, J.R. y col. Una filogenia central completamente resuelta revela numerosas dispersiones y diversificaciones explosivas a lo largo de la historia de Asteraceae. Proc. Acad. Nacional. Ciencia. Estados Unidos 116, 14083–14088 (2019).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Panero, JL & Crozier, BS Dinámica macroevolutiva en la diversificación temprana de Asteraceae. Mol. Filogenet. Evolución. 99, 116-132 (2016).

Artículo PubMed Google Scholar

Funk, VA y col. En todas partes menos en la Antártida: uso de un superárbol para comprender la diversidad y distribución de las Compositae. K. Dan. Vidensk. Selsk. Biol. Skr. 55, 343–373 (2005).

Google Académico

Barreda, VD et al. Evolución temprana del clado de angiospermas Asteraceae en el Cretácico de la Antártida. Proc. Acad. Nacional. Ciencia. Estados Unidos 112, 10989–10994 (2015).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Valluru, R. y Van Den Ende, W. Plantar fructanos en ambientes estresados: conceptos emergentes y perspectivas futuras. J. Exp. Bot. 59, 2905–2916 (2008).

Artículo CAS PubMed Google Scholar

Wei, H. y col. Los factores de transcripción CiMYB5 y CiMYB3 de achicoria R2R3-MYB regulan la expresión de fructano 1-exohidrolasa en respuesta al estrés abiótico y a señales hormonales. J. Exp. Bot. 68, 4323–4338 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Shen, F., He, H., Huang, X., Deng, Y. y Yang, X. Información sobre la evolución convergente de la biosíntesis de fructanos en angiospermas a partir del genoma de achicoria altamente característico. N. fitol. 238, 1245-1262 (2023).

Artículo CAS Google Scholar

Zhang, C. y col. Conocimientos filotranscriptómicos sobre la diversidad, poliploidía e innovación morfológica de Asteraceae. J. Integral. Biol vegetal. 63, 1273–1293 (2021).

Artículo CAS PubMed Google Scholar

Badouin, H. y col. El genoma del girasol proporciona información sobre el metabolismo del aceite, la floración y la evolución de las Asteridas. Naturaleza 546, 148-152 (2017).

Artículo ADS CAS PubMed Google Scholar

Kim, KJ, Choi, KS y Jansen, RK Dos inversiones del ADN del cloroplasto se originaron simultáneamente durante la evolución temprana de la familia del girasol (Asteraceae). Mol. Biol. Evolución. 22, 1783-1792 (2005).

Artículo CAS PubMed Google Scholar

Barker, MS y cols. Múltiples paleopoliploidizaciones durante la evolución de las compuestas revelan patrones paralelos de retención de genes duplicados después de millones de años. Mol. Biol. Evolución. 25, 2445–2455 (2008).

Artículo CAS PubMed PubMed Central Google Scholar

Huang, CH et al. Múltiples eventos de poliploidización en Asteraceae con dos eventos anidados en la historia temprana revelados por la filogenómica nuclear. Mol. Biol. Evolución. 33, 2820–2835 (2016).

Artículo CAS PubMed PubMed Central Google Scholar

Reyes-Chin-Wo, S. et al. Ensamblaje del genoma con datos de ligadura de proximidad in vitro y triplicación del genoma completo en lechuga. Nat. Comunitario. 8, 14953 (2017).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Bekaert, M., Edger, PP, Chris Pires, J. & Conant, GC La resolución en dos fases de la poliploidía en la red metabólica de Arabidopsis da lugar a restricciones de dosis relativas y absolutas. Célula vegetal 23, 1719-1728 (2011).

Artículo CAS PubMed PubMed Central Google Scholar

Chellamuthu, VR et al. Un mecanismo de detección de glutamina muy extendido en el reino vegetal. Celda 159, 1188-1199 (2014).

Artículo CAS PubMed Google Scholar

Hsieh, MH, Lam, HM, Van De Loo, FJ y Coruzzi, G. Una proteína similar a PII en Arabidopsis: papel putativo en la detección de nitrógeno. Proc. Acad. Nacional. Ciencia. EE.UU. 95, 13965-13970 (1998).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Selim, KA, Ermilova, E. y Forchhammer, K. De las cianobacterias a Archaeplastida: nuevos conocimientos evolutivos sobre la señalización de PII en el reino vegetal. N. fitol. 227, 722–731 (2020).

Artículo de Google Scholar

Azani, N. y col. Una nueva clasificación de subfamilias de leguminosas basada en una filogenia taxonómicamente completa. Taxón 66, 44–77 (2017).

Artículo de Google Scholar

Zhang, GQ y cols. El genoma de Apostasia y la evolución de las orquídeas. Naturaleza 549, 379–383 (2017).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Bickhart, DM y cols. La secuenciación de una sola molécula y la captura de la conformación de la cromatina permiten el ensamblaje de referencia de novo del genoma de la cabra doméstica. Nat. Gineta. 49, 643–650 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Gordon, D. y col. Ensamblaje de secuencia de lectura larga del genoma del gorila. Ciencia 352, aae0344 (2016).

Artículo ADS PubMed PubMed Central Google Scholar

Ou, S., Chen, J. y Jiang, N. Evaluación de la calidad del ensamblaje del genoma utilizando el índice de ensamblaje LTR (LAI). Ácidos nucleicos res. 46, e126 (2018).

PubMed PubMed Central Google Académico

Jiao, Y. et al. Poliploidía ancestral en plantas con semillas y angiospermas. Naturaleza 473, 97-100 (2011).

Artículo ADS CAS PubMed Google Scholar

Barker, MS y cols. La mayoría de las compuestas (Asteraceae) son descendientes de un paleohexaploide y todas comparten un ancestro paleotetraploide con las calyceraceae. Soy. J.Bot. 103, 1203-1211 (2016).

Artículo CAS PubMed Google Scholar

Leebens-Mack, JH et al. Mil transcriptomas de plantas y la filogenómica de las plantas verdes. Naturaleza 574, 679–685 (2019).

Artículo de Google Scholar

Bourrellier, ABF y cols. La actividad de la acetil-CoA carboxilasa del cloroplasto está regulada por el 2-oxoglutarato mediante la interacción de PII con la subunidad transportadora de biotina carboxilo. Proc. Acad. Nacional. Ciencia. Estados Unidos 107, 502–507 (2010).

Artículo ADS CAS Google Scholar

Ferrario-Méry, S. et al. Caracterización fisiológica de mutantes de Arabidopsis afectados en la expresión de la supuesta proteína reguladora PII. Planta 223, 28-39 (2005).

Artículo PubMed Google Scholar

Ferrario-Méry, S., Meyer, C. & Hodges, M. La absorción de nitrito de cloroplasto aumenta en mutantes PII de Arabidopsis. FEBS Lett. 582, 1061–1066 (2008).

Artículo PubMed Google Scholar

Chen, YM et al. La proteína de transducción de señales PII de Arabidopsis thaliana forma un complejo regulado por arginina con la N-acetil glutamato quinasa del plástido. J. Biol. Química. 281, 24084 (2006).

Artículo CAS Google Scholar

Krapp, A. y col. Transporte y señalización de nitratos en Arabidopsis. J. Exp. Bot. 65, 789–798 (2014).

Artículo CAS PubMed Google Scholar

Zhang, L. y col. La antigua ola de eventos de poliploidización en plantas con flores y su adaptación facilitada al estrés ambiental. Entorno de células vegetales. 43, 2847–2856 (2020).

Artículo CAS PubMed Google Scholar

Wu, S., Han, B. y Jiao, Y. Contribución genética de la paleopoliploidía a la evolución adaptativa en angiospermas. Mol. Planta 13, 59–71 (2020).

Artículo CAS PubMed Google Scholar

Tang, W. y col. Las proteínas derivadas de la transposasa FHY3/FAR1 interactúan con el FACTOR 1 DE INTERACCIÓN DEL FITOCROMO para regular la biosíntesis de clorofila mediante la modulación de HEMB1 durante la desetiolación en Arabidopsis. Célula vegetal 24, 1984-2000 (2012).

Artículo CAS PubMed PubMed Central Google Scholar

Staton, SE y cols. El genoma del girasol (Helianthus annuus L.) refleja una historia reciente de acumulación sesgada de elementos transponibles. Planta J. 72, 142-153 (2012).

Artículo ADS CAS PubMed Google Scholar

Staton, SE y Burke, JM Las transiciones evolutivas en Asteraceae coinciden con cambios marcados en la abundancia de elementos transponibles. BMC Genomics 16, 623 (2015).

Artículo PubMed PubMed Central Google Scholar

Liu, B. y col. El genoma de Mikania micrantha proporciona información sobre el mecanismo molecular del rápido crecimiento. Nat. Comunitario. 11, 340 (2020).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Zhu, JK Señalización y respuestas al estrés abiótico en plantas. Celda 167, 313–324 (2016).

Artículo CAS PubMed PubMed Central Google Scholar

Kong, D. y col. El homólogo 3.5 del receptor de glutamato de Arabidopsis modula el nivel de Ca2+ citosólico para contrarrestar el efecto del ácido abscísico en la germinación de las semillas. Fisiol vegetal. 167, 1630-1642 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Forde, señalización de BG Glutamato en raíces. J. Exp. Bot. 65, 779–787 (2014).

Artículo CAS PubMed Google Scholar

Michard, E. et al. Los genes similares a los receptores de glutamato forman canales de Ca2+ en los tubos de polen y están regulados por la D-serina del pistilo. Ciencia 332, 434–437 (2011).

Artículo ADS CAS PubMed Google Scholar

Wudick, MM y cols. La clasificación CORNICHON y la regulación de los canales GLR subyacen a la homeostasis del Ca2+ del tubo polínico. Ciencia 360, 533–536 (2018).

Artículo ADS CAS PubMed Google Scholar

Toyota, M. y col. El glutamato desencadena señales de defensa de las plantas a larga distancia basadas en calcio. Ciencia 361, 1112-1115 (2018).

Artículo ADS CAS PubMed Google Scholar

Mousavi, SAR, Chauvin, A., Pascaud, F., Kellenberger, S. & Farmer, EE Los genes SIMILARES AL RECEPTOR DE GLUTAMATO median la señalización de heridas de hoja a hoja. Naturaleza 500, 422–426 (2013).

Artículo ADS CAS PubMed Google Scholar

Lim, GH, Singhal, R., Kachroo, A. y Kachroo, P. Señalización mediada por ácidos grasos y lípidos en la defensa de las plantas. Año. Rdo. Fitopatol. 55, 505–536 (2017).

Artículo CAS PubMed Google Scholar

Okazaki, Y. & Saito, K. Funciones de los lípidos como moléculas de señalización y mitigadores durante la respuesta al estrés en las plantas. Planta J. 79, 584–596 (2014).

Artículo CAS PubMed Google Scholar

Lieberman-Aiden, E. et al. Un mapeo completo de interacciones de largo alcance revela los principios de plegamiento del genoma humano. Ciencia 326, 289–293 (2009).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Marçais, G. & Kingsford, C. Un enfoque rápido y sin bloqueos para el recuento paralelo eficiente de apariciones de k-mers. Bioinformática 27, 764–770 (2011).

Artículo PubMed PubMed Central Google Scholar

Vurture, GW et al. GenomeScope: creación rápida de perfiles del genoma sin referencias a partir de lecturas breves. Bioinformática 33, 2202–2204 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Chin, CS y cols. Ensamblaje del genoma diploide en fases con secuenciación de una sola molécula en tiempo real. Nat. Métodos 13, 1050–1054 (2016).

Artículo CAS PubMed PubMed Central Google Scholar

Walker, BJ y cols. Pilon: una herramienta integrada para la detección integral de variantes microbianas y la mejora del ensamblaje del genoma. MÁS UNO 9, e112963 (2014).

Artículo ADS PubMed PubMed Central Google Scholar

Durand, NC y cols. Juicer proporciona un sistema de un solo clic para analizar experimentos Hi-C con resolución de bucle. Sistema celular. 3, 95–98 (2016).

Artículo CAS PubMed PubMed Central Google Scholar

Dudchenko, O. y col. El ensamblaje de novo del genoma de Aedes aegypti utilizando Hi-C produce andamios de longitud cromosómica. Ciencia 356, 92–95 (2017).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Koren, S. y col. Canu: ensamblaje de lectura larga escalable y preciso mediante ponderación adaptativa de κ-mer y separación repetida. Genoma Res. 27, 722–736 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Ruan, J. & Li, H. Ensamblaje de lectura larga rápido y preciso con wtdbg2. Nat. Métodos 17, 155-158 (2020).

Artículo CAS PubMed Google Scholar

Li, H. y Durbin, R. Alineación de lectura corta rápida y precisa con la transformada de Burrows-Wheeler. Bioinformática 25, 1754-1760 (2009).

Artículo CAS PubMed PubMed Central Google Scholar

Li, H. y col. El formato de alineación/mapa de secuencia y SAMtools. Bioinformática 25, 2078–2079 (2009).

Artículo PubMed PubMed Central Google Scholar

Kent, WJ BLAT: la herramienta de alineación tipo BLAST. Genoma Res. 12, 656–664 (2002).

CAS PubMed PubMed Central Google Académico

Kim, D., Paggi, JM, Park, C., Bennett, C. y Salzberg, SL Alineación del genoma basada en gráficos y genotipado con HISAT2 y genotipo HISAT. Nat. Biotecnología. 37, 907–915 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Simão, FA, Waterhouse, RM, Ioannidis, P., Kriventseva, EV y Zdobnov, EM BUSCO: evaluación de la integridad del ensamblaje y la anotación del genoma con ortólogos de copia única. Bioinformática 31, 3210–3212 (2015).

Artículo PubMed Google Scholar

Li, H. Minimap2: alineación por pares para secuencias de nucleótidos. Bioinformática 34, 3094–3100 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Ou, S. & Jiang, N. LTR_retriever: un programa sensible y de alta precisión para la identificación de retrotransposones LTR. Fisiol vegetal. 176, 1410-1422 (2018).

Xu, Z. & Wang, H. LTR-FINDER: una herramienta eficaz para la predicción de retrotransposones LTR de longitud completa. Ácidos nucleicos res. 35, W265-W268 (2007).

Artículo PubMed PubMed Central Google Scholar

Ellinghaus, D., Kurtz, S. & Willhoeft, U. LTRharvest, un software eficiente y flexible para la detección de novo de retrotransposones LTR. BMC Bioinformática 9, 18 (2008).

Artículo PubMed PubMed Central Google Scholar

Han, Y. & Wessler, SR MITE-Hunter: un programa para descubrir elementos transponibles de repetición invertida en miniatura a partir de secuencias genómicas. Ácidos nucleicos res. 38, e199 (2010).

Artículo PubMed PubMed Central Google Scholar

Smit, A., Hubley, R. y Grenn, P. RepeatMasker Open-4.0.7 (RepeatMasker, 2015).

Campbell, MS y cols. MAKER-P: un conjunto de herramientas para la creación, gestión y control de calidad rápidos de anotaciones del genoma de plantas. Fisiol vegetal. 164, 513–524 (2014).

Artículo CAS PubMed Google Scholar

Grabherr, MG et al. Ensamblaje del transcriptoma de longitud completa a partir de datos de RNA-Seq sin un genoma de referencia. Nat. Biotecnología. 29, 644–652 (2011).

Artículo CAS PubMed PubMed Central Google Scholar

Korf, I. Hallazgo de genes en genomas novedosos. BMC Bioinformática 5, 59 (2004).

Artículo PubMed PubMed Central Google Scholar

Stanke, M., Diekhans, M., Baertsch, R. y Haussler, D. Uso de alineaciones de ADNc nativas y mapeadas sintéticamente para mejorar la búsqueda de genes de novo. Bioinformática 24, 637–644 (2008).

Artículo CAS PubMed Google Scholar

Friedländer, MR, MacKowiak, SD, Li, N., Chen, W. y Rajewsky, N. MiRDeep2 identifica con precisión genes de microARN conocidos y cientos de nuevos en siete clados de animales. Ácidos nucleicos res. 40, 37–52 (2012).

Artículo PubMed Google Scholar

Lowe, TM & Eddy, SR TRNAscan-SE: un programa para la detección mejorada de genes de ARN de transferencia en secuencia genómica. Ácidos nucleicos res. 25, 955–964 (1996).

Artículo de Google Scholar

Lagesen, K. y col. RNAmmer: anotación rápida y consistente de genes de ARN ribosómico. Ácidos nucleicos res. 35, 3100–3108 (2007).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Nawrocki, EP y Eddy, SR Infernal 1.1: búsquedas de homología de ARN 100 veces más rápidas. Bioinformática 29, 2933–2935 (2013).

Artículo CAS PubMed PubMed Central Google Scholar

Emms, DM y Kelly, S. OrthoFinder: resolver sesgos fundamentales en las comparaciones del genoma completo mejora drásticamente la precisión de la inferencia de ortogrupos. Genoma Biol. 16, 157 (2015).

Zhang, L. y col. El genoma del nenúfar y la evolución temprana de las plantas con flores. Naturaleza 577, 79–84 (2020).

Artículo ADS CAS PubMed Google Scholar

Edgar, RC MUSCLE: alineación de secuencias múltiples con alta precisión y alto rendimiento. Ácidos nucleicos res. 32, 1792-1797 (2004).

Artículo CAS PubMed PubMed Central Google Scholar

Capella-Gutiérrez, S., Silla-Martínez, JM & Gabaldón, T. trimAl: una herramienta para el recorte de alineación automatizado en análisis filogenéticos a gran escala. Bioinformática 25, 1972-1973 (2009).

Artículo PubMed PubMed Central Google Scholar

Stamatakis, A. RAxML versión 8: una herramienta para el análisis filogenético y el posanálisis de grandes filogenias. Bioinformática 30, 1312-1313 (2014).

Artículo CAS PubMed PubMed Central Google Scholar

Kalyaanamoorthy, S., Minh, BQ, Wong, TKF, Von Haeseler, A. y Jermiin, LS ModelFinder: selección rápida de modelos para estimaciones filogenéticas precisas. Nat. Métodos 14, 587–589 (2017).

Artículo CAS PubMed PubMed Central Google Scholar

Mirarab, S. y col. ASTRAL: estimación de árbol de especies basado en coalescencia a escala genómica. Bioinformática 30, i541 – i548 (2014).

Artículo CAS PubMed PubMed Central Google Scholar

Yang, Z. PAML 4: análisis filogenético por máxima verosimilitud. Mol. Biol. Evolución. 24, 1586-1591 (2007).

Artículo CAS PubMed Google Scholar

Barba-Montoya, J., dos Reis, M., Schneider, H., Donoghue, PCJ y Yang, Z. Limitación de la incertidumbre en la escala de tiempo de la evolución de las angiospermas y la veracidad de una revolución terrestre del Cretácico. N. fitol. 218, 819–834 (2018).

Artículo de Google Scholar

Kumar, S., Stecher, G., Suleski, M. & Hedges, SB TimeTree: un recurso para líneas de tiempo, árboles de tiempo y tiempos de divergencia. Mol. Biol. Evolución. 34, 1812–1819 (2017).

Artículo CAS PubMed Google Scholar

Sanderson, MJ r8s: Inferir tasas absolutas de evolución molecular y tiempos de divergencia en ausencia de un reloj molecular. Bioinformática 19, 301–302 (2003).

Artículo CAS PubMed Google Scholar

De Bie, T., Cristianini, N., Demuth, JP & Hahn, MW CAFE: una herramienta computacional para el estudio de la evolución de la familia de genes. Bioinformática 22, 1269-1271 (2006).

Artículo PubMed Google Scholar

Wang, Y. et al. MCScanX: un conjunto de herramientas para la detección y análisis evolutivo de la síntesis y colinealidad de genes. Ácidos nucleicos res. 40, e49 (2012).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Yang, Z. Paml: un paquete de programas para análisis filogenético por máxima verosimilitud. Bioinformática 13, 555–556 (1997).

Artículo CAS Google Scholar

Ou, S. y col. Evaluación comparativa de métodos de anotación de elementos transponibles para la creación de un proceso completo y optimizado. Genoma Biol. 20, 275 (2019).

Artículo CAS PubMed PubMed Central Google Scholar

Otasek, D., Morris, JH, Bouças, J., Pico, AR y Demchak, B. Automatización de Cytoscape: potenciar el análisis de redes basado en flujos de trabajo. Genoma Biol. 20, 185 (2019).

Artículo PubMed PubMed Central Google Scholar

Jones, P. y col. InterProScan 5: clasificación de funciones de proteínas a escala genómica. Bioinformática 30, 1236-1240 (2014).

Artículo CAS PubMed PubMed Central Google Scholar

Pertea, M. et al. StringTie permite una reconstrucción mejorada de un transcriptoma a partir de lecturas de RNA-seq. Nat. Biotecnología. 33, 290–295 (2015).

Artículo CAS PubMed PubMed Central Google Scholar

Yu, C. y col. La regulación positiva de un homólogo de KN1 mediante la inserción de un transposón promueve el desarrollo de hojas en la lechuga. Proc. Acad. Nacional. Ciencia. Estados Unidos 117, 33668–33678 (2020).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Guo, Z. et al. LettuceGDB: la base de datos comunitaria sobre genética y ómicas de la lechuga. Planta Comun. 4, 100425 (2023).

Artículo CAS PubMed Google Scholar

Shen, F. y col. La genómica comparada revela un sistema único de equilibrio nitrógeno-carbono en Asteraceae, lettuce_data. zenodo https://doi.org/10.5281/zenodo.8058114 (2023).

Descargar referencias

Agradecemos al profesor Hongzhi Kong y al profesor Guangyuan Rao por la discusión y los comentarios. La financiación fue proporcionada por la Academia de Ciencias Agrícolas y Forestales de Beijing (KJCX201907-2, JKZX202201 y YXQN202203), la Oficina Municipal de Agricultura y Asuntos Rurales de Beijing (G20220628003-13) y la Fundación Nacional de Ciencias Naturales de China (31621001).

Estos autores contribuyeron igualmente: Fei Shen, Yajuan Qin, Rui Wang.

Laboratorio Clave de Biotecnología y Recursos Genéticos Agrícolas de Beijing, Instituto de Biotecnología, Academia de Ciencias Agrícolas y Forestales de Beijing, 100097, Beijing, China

Fei Shen, Yajuan Qin, Xin Huang, Ying Wang, Jianhua Wei y Xiaozeng Yang

Laboratorio Clave de Desarrollo y Control de Calidad de Cultivos Ornamentales de Beijing, Facultad de Horticultura, Universidad Agrícola de China, 100193, Beijing, China

Rui Wang y Junna He

Laboratorio Estatal Clave de Investigación de Proteínas y Genes Vegetales, Facultad de Ciencias Agrícolas Avanzadas, Universidad de Pekín, 100871, Beijing, China

Ying Wang, Yue Zhou y Lei Li

Laboratorio Estatal Clave de Botánica Evolutiva y Sistemática, Instituto de Botánica, Academia China de Ciencias, 100093, Beijing, China

Tiangang Gao y Yuannian Jiao

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

También puedes buscar este autor en PubMed Google Scholar.

XY, LL y JW concibieron este estudio. YW cultivó las plantas y recogió muestras. FS realizó el ensamblaje del genoma, la anotación y el análisis de datos. YQ, RW y XH generaron y analizaron las líneas transgénicas de lechuga PII. YJ, YZ, JH y TG brindaron asesoramiento conceptual. XY, FS y LL escribieron el manuscrito con contribuciones de todos los autores.

Correspondencia a Jianhua Wei, Lei Li o Xiaozeng Yang.

Los autores declaran no tener conflictos de intereses.

Nature Communications agradece a Khaled Selim, Jisen Zhang y los demás revisores anónimos por su contribución a la revisión por pares de este trabajo. Un archivo de revisión por pares está disponible.

Nota del editor Springer Nature se mantiene neutral con respecto a reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso Abierto Este artículo está bajo una Licencia Internacional Creative Commons Attribution 4.0, que permite el uso, compartir, adaptación, distribución y reproducción en cualquier medio o formato, siempre y cuando se dé el crédito apropiado a los autores originales y a la fuente. proporcione un enlace a la licencia Creative Commons e indique si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la normativa legal o excede el uso permitido, deberá obtener permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Shen, F., Qin, Y., Wang, R. et al. La genómica comparada revela un sistema de equilibrio nitrógeno-carbono único en Asteraceae. Nat Comuna 14, 4334 (2023). https://doi.org/10.1038/s41467-023-40002-9

Descargar cita

Recibido: 12 de octubre de 2022

Aceptado: 07 de julio de 2023

Publicado: 20 de julio de 2023

DOI: https://doi.org/10.1038/s41467-023-40002-9

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, actualmente no hay un enlace para compartir disponible para este artículo.

Proporcionado por la iniciativa de intercambio de contenidos Springer Nature SharedIt

Al enviar un comentario, acepta cumplir con nuestros Términos y pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.

COMPARTIR