Muntatge del transcriptoma de Novo i descobriment gènic de la tija carnosa de Cistanche Deserticola-Ⅱ
Sep 18, 2024
Classificació funcional de totes les transcripcions expressades basada en l'ontologia gènica i les bases de dades KEGG
L'anotació d'ontologia gènica (GO) es va obtenir a partir del fitxer d'associació d'identitats i anotacions UniProt. En total, 20.907 transcripcions, que representen el 32,69% del total de seqüències expressades, es van assignar a 1.745 termes funcionals. Dels termes GO funcionals totals, les assignacions al procés biològic van constituir la majoria (1.116, 63,95%) seguides pel component cel·lular (329, 18,85%) i la funció molecular (300, 17,20%). Les funcions assignades de les transcripcions expressades cobrien una àmplia gamma de categories GO, i els 10 termes GO principals amb les transcripcions més anotades es van enumerar a la taula 3. Proporcionem la distribució de totes les transcripcions expressades en tres categories d'ontologia gènica (funció molecular, component cel·lular i procés biològic) al fitxer suplementari (S3 Dataset). Els termes GO relacionats amb les funcions d'unió i l'activitat de la transferasa es van representar predominantment a la categoria de funció molecular. Pel que fa a les funcions d'unió, la unió de cations (4.394 transcripcions) va representar la més abundant, seguida de la unió de nucleòtids/nucleòsids (3.404 transcripcions de mitjana) i la unió a proteïnes (2.422 transcripcions). Mentre que en el grup d'activitat de la transferasa, la majoria són aquells amb grups que contenen fòsfor transferint (2.256 transcripcions, 65,77%). Entre la categoria de components cel·lulars, les transcripcions estaven més localitzades intracel·lulars (10.581 transcripcions de mitjana), mentre que entre la categoria de processos biològics, les transcripcions estaven més implicades en el procés metabòlic del biopolímer (6.683 transcripcions de mitjana), seguida de la regulació del procés cel·lular (4.841 transcripcions). ), expressió gènica (4.678 transcripcions) i transport (3.512 transcripcions).

TUBULOSA NATURAL DE CISTANCHE PER PREVENIR L'ALZHEIMER PHGS75% ECH 30% ACT 12%
Per extreure gens implicats en la biosíntesi de lignina i PhG, es van cercar 21.358 seqüències de proteïnes potencials no redundants contra seqüències de gens de 13 organismes vegetals a la base de dades KEGG i es van assignar a 275 vies KEGG amb almenys 5 visites. Les 10 vies principals amb seqüències més alineades s'enumeren a la taula 4. La majoria de les vies estaven implicades en processos metabòlics primaris, com ara el metabolisme dels aminoàcids o proteïnes (ko01230, ko04141 i ko04120), el metabolisme dels carbohidrats (ko01200 i ko00500) i els nucleòtids. metabolisme dels nucleòsids (ko03018, ko00230 i ko00240). A més, hi ha 27 vies secundàries relacionades amb el metabolisme (Fig 2), com ara la biosíntesi de la columna vertebral terpenoide, la biosíntesi de fenilpropanoides, la biosíntesi de carotenoides, la biosíntesi d'alcaloides d'isoquinolina i la biosíntesi d'alcaloides de tropà, piperidina i piridina. Aquests resultats proporcionen una indicació addicional que els processos metabòlics actius estaven en marxaC. deserticolateixit de la tija. Totes les transcripcions expressades associades a les vies KEGG es van enumerar al fitxer suplementari (S4 Dataset). Tot i que hi ha algunes vies canviades significativament entre C. deserticola i altres plantes, com l'arròs (S5 Dataset), el nostre objectiu principal en aquest estudi és revelar tot el perfil del transcriptoma de la tija de C. deserticola i imaginar les vies relacionades de la biosíntesi de PhGs. que podria ser útil per guiar el cultiu.

Gens candidats que codifiquen enzims implicats en la biosíntesi de la lignina
La lignina és el segon polímer natural terrestre més abundant del regne vegetal, que composa fins a un terç del material que es troba a les parets cel·lulars de les plantes. Com a component important de les parets cel·lulars, les lignines ajuden al transport de l'aigua, proporcionen suport mecànic i integritat estructural i defensen contra patògens i herbívors. Aquests papers de la lignina són molt valuosos per donar suport al creixement erectiu subterrani de C. deserticola al desert. En aquest estudi, vam presentar la imatge completa de les vies de biosíntesi de la lignina a C. deserticola (Fig 3), en què els monòmers de lignina es biosintetitzen a partir de fenilalanina mitjançant una sèrie de reaccions enzimàtiques, incloent hidroxilació, metilació, reducció i procés de polimerització oxidativa. Es van detectar enzims relacionats amb la biosíntesi de la lignina per a tres formes sintetitzades principalment al teixit vascular (p-hidroxil-fenil (H), guaiacil (G) i siringil (S) lignina) i 5-hidroxil-guaiacil lignina que només es va identificar en plantes deficients en COMT (àcid cafeic 3-O-metiltransferasa, EC 2.1.1.68) (com ara desactivadores).

La fenilalanina amoníaco-liasa (PAL, EC 4.3.1.24) és el primer enzim clau en la via de la biosíntesi de la lignina (Fig 3) que transforma la fenilalanina en àcid cinàmic per desaminació no oxidativa. Es van seqüenciar un total de 6.297 lectures PAL i es van reunir 7 transcripcions PAL a C. deserticola (taula 5). Mitjançant la comparació de semblances de seqüències, vam trobar que 4 d'elles (comp28550_c1_seq1/2/3/5) tenien més del 95% de semblança amb la seqüència d'ARNm coneguda de C. deserticola (gi| 289595227|gb|ADD12041.1|), mentre que comp28550_c1_seq4 i comp25940_c{0_seq1 tenien un 77% i un 82% de semblances, respectivament. La predicció ORF va revelar que 5 transcripcions tenien potencials de codificació de proteïnes i portades amb el domini aminoàcid liasa (PF00221.14). Entre ells, només la transcripció comp28550_c1_seq4 podria codificar una seqüència proteica completa de 718 residus d'aminoàcids. S'ha informat que PAL va ser codificat per una petita família multigènica en la majoria d'espècies de plantes, com ara 4 a Arabidopsis thaliana, 5 a Populus trichocarpa, 3 a Scutellaria baicalensis i 7 Cucumis sativus, etc. La nostra anàlisi filogenètica va suggerir que n'hi havia 4. Gens que codifiquen PAL a C.


deserticola i els vam anomenar CdPAL1, CdPAL2, CdPAL3 i CdPAL4, respectivament (S2 Fig). La 4-cumarat-CoA lligasa (4CL, EC 6.2.1.12) i la trans-cinamat 4-monooxigenasa (CYP73A, EC 1.14.13.11) són dos enzims responsables de transformar l'àcid cinàmic en dicumarol-CoA en dos inversos. ordres. També es troben a la columna vertebral i els seus valors d'expressió FPKM són 39,57 i 51,93, respectivament.

Els quatre tipus de lignines es van biosintetitzar per diferents vies que estaven controlades per tres enzims clau, cinamoil-CoA reductasa (CCR, EC 1.2.1.44), shikimat o-hidroxicinamoiltransferasa (HCT, EC 2.3.1.133) i ferulat{{1{ {56}}}}hidroxilasa (F5H, EC 1.14.-.-). El CCR es va informar com un punt de control de la via de les lignines [50, 51] que va catalitzar X-CoA (X incloent dicumarol, cafeoil, feruloil, 5-hidroxil-feruloil i sinapoil) en Y-aldehid (Y inclòs p -puma, cafeoil, coniferil, 5-hidroxil-coniferil i snap), mentre que l'HCT va catalitzar p-cumaroil-CoA en àcid p-cumaroil shikimic/àcid p-cumaroil quínic. Els dos enzims, igual que un interruptor, regulaven la biosíntesi de P-hidroxil-fenil lignines o els altres tres tipus de lignines. F5H va ser un altre interruptor de branca que regulava la siringil lignina i la 5-hidroxil-guaiacil lignina. Altres enzims importants com l'àcid cafeic 3-O-metiltransferasa (COMT, EC 2.1.1.68), la cafeoil-CoA O-metiltransferasa (CCoAOMT, EC 2.1.1.104) i la cinamil-alcohol deshidrogenasa (CAD, EC 1.1.1.195). ) també es van detectar expressats. La informació detallada sobre l'expressió es mostra a la taula 6. Aquests gens enzimàtics identificats en aquest estudi proporcionaran un recurs valuós per als estudis genòmics funcionals en aquesta important planta medicinal. Es van seleccionar 10 gens relacionats amb la via de biosíntesi de lignines a la taula 6 per a la verificació RT-qPCR per confirmar els nostres resultats RNAseq (Fig 4) i les seves altes correlacions (coeficient de correlació de Pearson: 0, 90343) van indicar una gran precisió i reproductibilitat de la nostra anàlisi del transcriptoma. El conjunt de dades S1 enumera les seqüències d'encebadors utilitzades en aquesta anàlisi.

TUBULOSA NATURAL DE CISTANCHE PER A LA MILLORA DE LA FUNCIÓ SEXUAL PHGS75% ECH 30% ACT 12%
Gens candidats que codifiquen enzims implicats en la biosíntesi de PhG
Se sap que els glucòsids feniletanoides (PhG) són els ingredients actius principals de C. deserticola amb activitats de millora de la potència sexual, eliminació de radicals lliures i anti-envelliment. Tres components químics dels PhG són l'àcid orgànic, el sacàrid i l'aglicon de feniletanol (Fig 3). Els àcids orgànics que inclouen l'àcid cafeic, l'àcid ferúlic i l'àcid cumàlic són productes de la via de la biosíntesi dels fenilpropanoides. Els components del sacàrid, inclosos la glucosa i la ramnosa, són productes de les vies del metabolisme dels hidrats de carboni, com ara el metabolisme del midó i la sacarosa, el metabolisme del sucre amino i dels nucleòtids, el metabolisme de la fructosa i la manosa, etc. No obstant això, la via de biosíntesi de la part del feniletanol encara no està clara. Aquí, vam proposar dues possibles vies de biosíntesi de feniletanol basades en les nostres dades de seqüència. Una és la via de l'àcid cafeic o de l'àcid ferúlic, també coneguda com la via de l'àcid cinàmic, que és similar a la via de la columna vertebral de la biosíntesi de la lignina. Un altre es basa en la via del metabolisme de la fenilalanina (Fig 3), en què la fenilalanina a feniletanol es va aconseguir mitjançant una coneguda "via Enrlich" que es va trobar per primera vegada al llevat fa un segle i es va validar en flors de petúnia, tomàquet i rosa. Es van detectar quatre gens enzimàtics que codifiquen l'aspartat/tirosina aminotransferasa, la histidina-fosfat aminotransferasa i l'amino oxidasa primària que són els responsables de la conversió de la fenilalanina en feniletanol expressats a la tija de C. deserticola. El producte del fenil etanol es pot oxidar encara més per la monooxigenasa o metilat per la metiltransferasa en els seus derivats (feniletanol aglicon) que participen en la biosíntesi de PhG. En resum, es van proposar dues vies putatives de biosíntesi de feniletanol-glicon per aC. deserticolaperò encara necessitem més estudis.
Debats
En els darrers anys, la genòmica de les plantes s'ha desenvolupat ràpidament amb l'aplicació de la tecnologia de seqüenciació de nova generació, mentre que poques investigacions s'han centrat en la genòmica de les plantes medicinals del desert. És urgent realitzar investigacions genòmiques o transcriptòmiques per entendre la seva adaptació a ambients de sequera i salinitat i la via de biosíntesi dels principals components bioactius. El descobriment del transcriptoma de novo per a algunes plantes medicinals,


com Panax ginseng, Ginkgo biloba i Glycyrrhiza uralensis s'han explotat per primera vegada utilitzant la plataforma Roche 454 per la seva llarga durada de lectura. A causa de la capacitat de muntatge eficaç amb lectures curtes, especialment les lectures avançades de parelles, la seqüenciació i el muntatge de transcriptoma basats en Illumina també s'han utilitzat àmpliament per a organismes model i no model. En el present estudi, vam generar uns 8G de lectures aparellades de 101 bp i vam produir seqüències unigenes més llargues amb una longitud mitjana de 725 bp. Les dades de transcriptoma específiques de tija a gran escala podrien proporcionar dades de referència útils i utilitzar-se per extreure el metabolisme secundari dels components bioactius de C. deserticola. Hi ha un 81,62% del total de lectures en brut passat filtres de qualitat estrictes (incloent el retall d'adaptadors i el descart de lectures de baixa qualitat) abans del muntatge, cosa que suggereix l'alta qualitat de les nostres dades de seqüenciació, i el 82,08% de les lectures d'alta qualitat van ser útils per al muntatge. Altres lectures que no s'han pogut utilitzar per al muntatge poden provenir d'errors de seqüenciació, paràmetres de muntatge i altres. Aquestes lectures d'alta qualitat no utilitzades van seguir sent útils per millorar el muntatge de novo combinat amb lectures més llargues d'una altra plataforma (com ara Roche 454) en el futur.

TUBULOSA NATURAL DE CISTANCHE PER A LA MILLORA DE LA FUNCIÓ SEXUAL PHGS75% ECH 30% ACT 12%
Un gran nombre de transcripcions reunides (30.098) van mostrar grans similituds de seqüències amb gens coneguts a bases de dades públiques, cosa que suggereix que les nostres dades d'extrem aparellat basades en Illumina cobrien una fracció substancial de les transcripcions de C. deserticola. Les transcripcions sense èxits BLAST poden ser degudes a regions no traduïdes 3' o 5', ARN no codificant o noves seqüències de gens de C. deserticola. Les transcripcions expressades es van anotar a una àmplia gamma de categories GO i vies KEGG (taules 3 i 4), en les quals moltes transcripcions es van assignar a vies secundàries relacionades amb el metabolisme. Com sabem, el fenilpropanoide pot funcionar com un compost antimicrobià inducible amb un gran benefici per a un estil de vida subterrani [1], i també actuar com a molècula senyal en les interaccions planta-microbi a més de la seva utilitat medicinal [68, 69]. El terpenoide s'utilitza per a la biosíntesi de components bioactius (com ara 6- desoxicatalpol) [70]. Vam trobar que els gens implicats en la via de biosíntesi de la columna vertebral dels fenilpropanoides i terpenoides eren molt abundants a C. deserticola. Més important encara, el descobriment de vies ben representades de la biosíntesi de la lignina (Fig 3) va indicar el procés metabòlic actiu de la lignina a la tija de C. deserticola. Es van detectar tots els gens enzimàtics coneguts implicats en la biosíntesi de la lignina (Fig 3) expressats i quatre enzims clau, inclosos PAL, CCR, HCT i F5H, tenien una menor abundància d'expressió (FPKM 26,47, 3,89, 3,4 i 3,83, respectivament) en comparació amb altres gens enzimàtics (taula 6). Si el canvi d'expressió d'aquests tres gens podria influir o no en la producció de lignina a C. deserticola és digne d'estudiar més endavant. El PAL és un enzim clau en la biosíntesi de la lignina i també està implicat en la biosíntesi de fenilpropanoide, resveratrol, flavonoide i cumarina [71–74]. Hem detectat quatre gens PAL diferents al genoma de C. deserticola (Fig S2) que coincideix amb que PAL va ser codificat per una petita família multigènica [39, 43, 45–49] i, a més, vam demostrar que pot tenir un paper important en el flux metabòlic de carboni. .
PhG és l'ingredient actiu principal de C. deserticola. Els gens implicats en la biosíntesi del feniletanol són importants per a la qualitat de C. deserticola. Hem deduït dues vies de biosíntesi diferents de feniletanol i 17 gens enzimàtics implicats en la biosíntesi de PhG a la tija de C. deserticola. També es van deduir per primera vegada els possibles processos post-cafeic/ferúlic (Fig 3) a partir d'una fórmula estructural d'intermedis i propietats catalitzadores dels enzims corresponents, en què l'àcid cafeic/ferúlic s'oxidaria primer en derivat de fenilpiruvat; després, el grup carboxil va ser privat per les descarboxilases; finalment, el grup aldehid es va tornar a convertir en grup alcohol per la deshidrogenasa. Aquesta és la primera aplicació de la tecnologia de seqüenciació d'extrems parells d'Illumina per investigar tot el transcriptoma de C. deserticola i per muntar lectures d'ARN-seq sense un genoma de referència. Aquest estudi proporcionarà recursos útils i seqüències de gens per a la investigació de la genòmica funcional i la proteòmica sobre C. deserticola en el futur.
Conclusions
En aquest estudi, vam perfilar el transcriptoma de la tija de C. deserticola a partir de dades de seqüenciació d'alt rendiment, vam identificar gens implicats en les vies de biosíntesi de la lignina i també vam inferir per primera vegada la possible via de biosíntesi de PhGs, cosa que sens dubte accelerarà la comprensió. dels processos fisiològics ambigus i el gran valor medicinal a nivell molecular. Fins ara, aquest és el primer intent de muntar de nou tot el transcriptoma de la tija de C. deserticola i detectar la via de biosíntesi de components medicinals mitjançant conjunts de dades de seqüenciació basats en Illumina. El nostre estudi pot promoure el desenvolupament de medicaments naturals i la selecció de cultivars amb trets medicinals.

TUBULOSA NATURAL DE CISTANCHE PER A LA MILLORA DE LA FUNCIÓ SEXUAL PHGS75% ECH 30% ACT 12%







