留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

叶菜型甘薯叶绿体基因组及其特征分析

上一篇

下一篇

李国良, 张鸿, 林赵淼, 等. 叶菜型甘薯叶绿体基因组及其特征分析[J]. 西南大学学报(自然科学版), 2023, 45(10): 43-53. doi: 10.13718/j.cnki.xdzk.2023.10.005
引用本文: 李国良, 张鸿, 林赵淼, 等. 叶菜型甘薯叶绿体基因组及其特征分析[J]. 西南大学学报(自然科学版), 2023, 45(10): 43-53. doi: 10.13718/j.cnki.xdzk.2023.10.005
LI Guoliang, ZHANG Hong, LIN Zhaomiao, et al. Analysis of Chloroplast Genomic Characteristics of Leafy Sweetpotato[J]. Journal of Southwest University Natural Science Edition, 2023, 45(10): 43-53. doi: 10.13718/j.cnki.xdzk.2023.10.005
Citation: LI Guoliang, ZHANG Hong, LIN Zhaomiao, et al. Analysis of Chloroplast Genomic Characteristics of Leafy Sweetpotato[J]. Journal of Southwest University Natural Science Edition, 2023, 45(10): 43-53. doi: 10.13718/j.cnki.xdzk.2023.10.005

叶菜型甘薯叶绿体基因组及其特征分析

  • 基金项目: 财政部和农业农村部国家现代农业产业技术体系项目(CARS-10-B14);福建省人民政府-中国农业科学院农业高质量发展超越“5511”协同创新工程项目(KXXYJBG0039);福建省属公益类科研院所基本科研专项(2021R1031011)
详细信息
    作者简介:

    李国良,硕士,助理研究员,主要从事甘薯抗逆基因功能研究 .

    通讯作者: 邱思鑫,博士,研究员; 
  • 中图分类号: S531

Analysis of Chloroplast Genomic Characteristics of Leafy Sweetpotato

  • 摘要:

    为探明叶菜型甘薯叶绿体基因组特征及其与番薯属植物的亲缘关系, 以叶菜型甘薯'福菜薯18号’为试验材料, 利用BGISEQ-500平台和Oxford Nanopore Technologies单分子测序技术对全基因组进行建库测序, 并组装其叶绿体基因组. 结果显示: 叶菜型甘薯叶绿体基因组全长161 387 bp, 具有典型的环状四分体结构, 其大单拷贝区(large single copy, LSC)、小单拷贝区(small single copy, SSC)和2个反向重复序列(inverted repeat, IR)的长度分别为87 597, 12 052和30 869 bp. 注释共得到132个基因, 包含87个蛋白编码基因, 8个rRNA基因, 37个tRNA基因. 在叶菜型甘薯叶绿体基因组中共搜索到54个SSR位点, 其中单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸重复基序个数分别为32, 4, 3, 11, 2和2个. 系统进化分析表明, 叶菜型甘薯与甘薯四倍体野生种Ipomoea tabascana和二倍体野生种Ipomoea trifida具有较近的亲缘关系.

  • 加载中
  • 图 1  叶菜型甘薯的cpDNA图谱

    图 2  基于蛋白编码基因构建45个物种的系统进化树

    图 3  两种类型叶绿体dotplot图

    表 1  甘薯叶绿体基因组注释基因列表

    基因分类 基因分组 基因名称
    光合系统基因 光系统Ⅰ基因 psaApsaBpsaCpsaIpsaJ
    光系统Ⅱ基因 psbApsbBpsbCpsbDpsbEpsbFpsbHpsbIpsbJpsbKpsbLpsbMpsbNpsbTpsbZ
    细胞色素复合物 petNpetApsbFpsbEpetGpetBapetDapetL
    ATP酶基因 atpAatpBatpEatpFaatpHatpI
    NADH氧化还原酶基因 ndhAandhBacndhCndhDndhEndhFndhGndhHndhIndhJndhK
    二磷酸核酮糖羧化酶大亚基基因 rbcL
    自我复制基因 RNA聚合酶亚基基因RNA rpoArpoBrpoC1arpoC2
    核糖体蛋白小亚基基因 rps2rps3rps4rps7crps8rps11rps12bcrps14rps15rps16arps18rps19c
    核糖体蛋白大亚基基因 rpl2rpl14rpl16arpl20rpl22rpl23crpl32rpl33rpl36
    核糖体核糖核酸基因 rrn4.5crrn5crrn16crrn23c
    转移RNA基因 trnA-UGCactrnC-GCAtrnD-GUCtrnE-UUCtrnfM-CAUtrnF-GAAtrnG-GCCtrnG-UCCatrnH-GUGtrnI-CAUtrnI-GAUactrnK-UUUatrnL-CAAtrnL-UAAtrnL-UAGtrnM-CAUtrnN-GUUtrnP-UGGtrnQ-UUGtrnR-ACGtrnR-UCUtrnS-GCUtrnS-GGAtrnS-UGAtrnT-GGUtrnT-UGUtrnV-GACtrnV-UACatrnW-CCAtrnY-GUA
    其他基因 翻译起始密码子基因 infA
    成熟酶K基因 matK
    乙酰辅酶A羧化酶基因 accD
    膜蛋白基因 cemA
    细胞色素合成基因 ccsA
    蛋白酶基因 clpPb
    假定叶绿体阅读框 ycf1cycf2cycf15pafIbpafII
    注:a表示基因含有1个内含子,b表示基因含有2个内含子,c表示含有2个拷贝基因.
    下载: 导出CSV

    表 2  叶菜型甘薯各氨基酸同义密码子偏好性

    氨基酸 密码子 RSCU值 数量/个 氨基酸 密码子 RSCU值 数量/个
    丙氨酸Ala(A) GCA 1.076 406 赖氨酸Lys(K) AAA 1.499 1 266
    GCC 0.615 232 AAG 0.501 423
    GCG 0.482 182 甲硫氨酸Met(M) ACG 0.006 1
    GCT 1.826 689 ATG 3.950 637
    精氨酸Arg(R) AGA 1.780 508 ATT 0.012 2
    AGG 0.645 184 GTG 0.031 5
    CGA 1.391 397 苯丙氨酸Phe(F) TTC 0.684 574
    CGC 0.456 130 TTT 1.316 1 104
    CGG 0.484 138 脯氨酸Pro(P) CCA 1.118 322
    CGT 1.244 355 CCC 0.882 254
    天冬酰胺Asn(N) AAC 0.461 321 CCG 0.549 158
    AAT 1.539 1 071 CCT 1.451 418
    天冬氨酸Asp(D) GAC 0.400 232 丝氨酸Ser(S) AGC 0.478 179
    GAT 1.600 927 AGT 1.230 461
    半胱氨酸Cys(C) TGC 0.548 91 TCA 1.102 413
    TGT 1.452 241 TCC 0.985 369
    谷氨酰胺Gln(Q) CAA 1.554 832 TCG 0.619 232
    CAG 0.446 239 TCT 1.585 594
    谷氨酸Glu(E) GAA 1.471 1 194 终止子TER TAA 1.793 52
    GAG 0.529 429 TAG 0.586 17
    甘氨酸Gly(G) GGA 1.531 695 TGA 0.621 18
    GGC 0.419 190 苏氨酸Thr(T) ACA 1.139 429
    GGG 0.811 368 ACC 0.778 293
    GGT 1.240 563 ACG 0.393 148
    组氨酸His(H) CAC 0.505 166 ACT 1.691 637
    CAT 1.495 491 色氨酸Trp(W) TGG 1.000 469
    异亮氨酸Ile(I) ATA 0.916 723 酪氨酸Tyr(Y) TAC 0.387 187
    ATC 0.602 475 TAT 1.613 780
    ATT 1.483 1 171 缬氨酸Val(V) GTA 1.454 532
    亮氨酸Leu(L) CTA 0.828 407 GTC 0.473 173
    CTC 0.417 205 GTG 0.601 220
    CTG 0.384 189 GTT 1.473 539
    CTT 1.340 659
    TTA 1.810 890
    TTG 1.220 600
    下载: 导出CSV

    表 3  54个cpDNA在叶菜型甘薯叶绿体基因组上的分布

    编号 SSR类型 SSR 片段大小/bp 起始/ bp 终止/ bp 编号 SSR类型 SSR 片段大小/bp 起始/ bp 终止/ bp
    1 p1 (T)13 13 174 186 28 p3 (GGA)4 12 59 833 59 844
    2 p1 (A)11 11 1 499 1 509 29 p1 (T)10 10 61 307 61 316
    3 p1 (A)12 12 1 627 1 638 30 p2 (TA)6 12 63 682 63 693
    4 p4 (TTGT)3 12 6 482 6 493 31 p1 (A)12 12 65 204 65 215
    5 p1 (A)15 15 7 849 7 863 32 p1 (T)10 10 68 002 68 011
    6 p1 (A)11 11 8 103 8 113 33 p4 (AATA)3 12 68 611 68 622
    7 p4 (AATA)3 12 9 787 9 798 34 p4 (TTTC)3 12 70 897 70 908
    8 p1 (T)10 10 9 974 9 983 35 p1 (A)13 13 71 118 71 130
    9 p1 (T)10 10 10 322 10 331 36 p1 (T)10 10 71 636 71 645
    10 p1 (T)10 10 12 680 12 689 37 p1 (T)11 11 72 788 72 798
    11 p1 (T)11 11 13 335 13 345 38 p3 (AGA)4 12 73 321 73 332
    12 p4 (CAAT)3 12 13 896 13 907 39 p1 (T)10 10 73 678 73 687
    13 p1 (A)10 10 15 855 15 864 40 p1 (A)11 11 74 034 74 044
    14 p1 (T)13 13 18 901 18 913 41 p1 (T)11 11 77 369 77 379
    15 p1 (T)10 10 26 702 26 711 42 p4 (AAAT)3 12 78 552 78 563
    16 p1 (A)10 10 28 254 28 263 43 p6 (AATCAA)3 18 88 064 88 081
    17 p1 (T)13 13 30 193 30 205 44 p4 (TATC)3 12 93 626 93 637
    18 p4 (TCAA)3 12 30 875 30 886 45 p5 (TTCTA)4 20 100 375 100 394
    19 p1 (T)10 10 31 059 31 068 46 p1 (A)12 12 110 849 110 860
    20 p3 (TTC)4 12 36 291 36 302 47 p1 (A)10 10 111 260 111 269
    21 p1 (T)10 10 36 505 36 514 48 p4 (ATAG)3 12 121 006 121 017
    22 p1 (A)13 13 37 715 37 727 49 c (T)10…(A)10 64 130 241 130 304
    23 p1 (A)11 11 47 936 47 946 50 p1 (T)10 10 137 716 137 725
    24 c (T)10…(T)13 71 48 444 48 514 51 p1 (T)12 12 138 125 138 136
    25 p4 (GAAA)3 12 48 969 48 980 52 p5 (AATAG)4 20 148 589 148 608
    26 p1 (T)12 12 50 231 50 242 53 p4 (AGAT)3 12 155 347 155 358
    27 c (T)10…(T)13 97 56 116 56 212 54 p6 (ATTTTG)3 18 160 901 160 918
    下载: 导出CSV
  • [1] 李保珠, 赵孝亮, 彭雷. 植物叶绿体发育及调控研究进展[J]. 植物学报, 2014, 49(3): 337-345. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-ZWXT201403012.htm
    [2] 程慧, 葛春峰, 张红, 等. 果树叶绿体基因组测序及系统发育研究进展[J]. 核农学报, 2018, 32(1): 58-69. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-HNXB201801009.htm
    [3] 杨亚蒙, 焦健, 樊秀彩, 等. 桑叶葡萄叶绿体基因组及其特征分析[J]. 园艺学报, 2019, 46(4): 635-648. doi: 10.16420/j.issn.0513-353x.2018-0596
    [4] 宋芸, 贾孟君, 曹亚萍, 等. 连翘叶绿体基因组特征分析[J]. 园艺学报, 2022, 49(1): 187-199. doi: 10.16420/j.issn.0513-353x.2020-0781
    [5] 王璐璐, 黄雨, 傅玉凡, 等. 甘薯淀粉相关性状变异性的分析[J]. 西南大学学报(自然科学版), 2022, 44(2): 39-47. doi: 10.13718/j.cnki.xdzk.2022.02.005
    [6] 李静, 傅玉凡, 黄雨, 等. 10个叶菜型甘薯品种茎尖性状的分析与评价[J]. 西南大学学报(自然科学版), 2022, 44(4): 45-53. doi: 10.13718/j.cnki.xdzk.2022.04.006
    [7] 胡颖, 王茜, 张新新, 等. 叶绿体DNA标记在谱系地理学中的应用研究进展[J]. 生物多样性, 2019, 27(2): 219-234. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-SWDY201902013.htm
    [8] PAHLICH E, GERLITZ C. A Rapid DNA Isolation Procedure for Small Quantities of Fresh Leaf Tissue [J]. Phytochemistry, 1980, 19: 11-13. doi: 10.1016/0031-9422(80)85004-7
    [9] CHEN S F, ZHOU Y Q, CHEN Y R, et al. Fastp: an Ultra-fast All-in-one FASTQ Preprocessor [J]. Bioinformatics, 2018, 34(17): i884-i890. doi: 10.1093/bioinformatics/bty560
    [10] LI H. Minimap2: Pairwise Alignment for Nucleotide Sequences [J]. Bioinformatics, 2018, 34(18): 3094-3100.
    [11] LANGMEAD B, SALZBERG S L. Fast Gapped-read Alignment with Bowtie 2 [J]. Nature Methods, 2012, 9(4): 357-359.
    [12] WICK R R, JUDD L M, GORRIE C L, et al. Unicycler: Resolving Bacterial Genome Assemblies from Short and Long Sequencing Reads [J]. PLoS Computational Biology, 2017, 13(6): e1005595.
    [13] TILLICH M, LEHWARK P, PELLIZZER T, et al. GeSeq-versatile and Accurate Annotation of Organelle Genomes [J]. Nucleic Acids Research, 2017, 45(W1): W6-W11.
    [14] LOWE T M, EDDY S R. TRNAscan-SE: a Program for Improved Detection of Transfer RNA Genes in Genomic Sequence [J]. Nucleic Acids Research, 1997, 25(5): 955-964.
    [15] LOHSE M, DRECHSEL O, BOCK R. Organellar Genome DRAW (OGDRAW): a Tool for the Easy Generation of High-quality Custom Graphical Maps of Plastid and Mitochondrial Genomes [J]. Current Genetics, 2007, 52(5): 267-274.
    [16] SHARP P M, LI W H. Codon Usage in Regulatory Genes in Escherichia coli does not Reflect Selection for 'Rare' Codons [J]. Nucleic Acids Research, 1986, 14(19): 7737-7749.
    [17] BEIER S, THIEL T, MVNCH T, et al. MISA-web: a Web Server for Microsatellite Prediction [J]. Bioinformatics, 2017, 33(16): 2583-2585.
    [18] BENSON G. Tandem Repeats Finder: a Program to Analyze DNA Sequences [J]. Nucleic Acids Research, 1999, 27(2): 573-580.
    [19] RICE P, LONGDEN I, BLEASBY A. EMBOSS: The European Molecular Biology Open Software Suite [J]. Trends in Genetics: TIG, 2000, 16(6): 276-277.
    [20] KATOH K, STANDLEY D M. MAFFT Multiple Sequence Alignment Software Version 7: Improvements in Performance and Usability [J]. Molecular Biology and Evolution, 2013, 30(4): 772-780.
    [21] PRICE M N, DEHAL P S, ARKIN A P. Fast Tree 2-approximately Maximum-likelihood Trees for Large Alignments [J]. PLoS One, 2010, 5(3): e9490.
    [22] 李玉梅, 李书娴, 李向上, 等. 第三代测序技术在转录组学研究中的应用[J]. 生命科学仪器, 2018, 16(S1): 114-121, 113. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-SBKY2018Z1014.htm
    [23] 战斌慧, 周雪平. 高通量测序技术在植物及昆虫病毒检测中的应用[J]. 植物保护, 2018, 44(5): 120-126, 167. doi: https://www.cnki.com.cn/Article/CJFDTOTAL-ZWBH201805021.htm
    [24] SRISUWAN S, SIHACHAKR D, SILJAK-YAKOVLEV S. The Origin and Evolution of Sweet Potato (Ipomoea batatas Lam. ) and Its Wild Relatives through the Cytogenetic Approaches [J]. Plant Science, 2006, 171(3): 424-433.
    [25] GONZALES A M, FANG Z, DURBIN M L, et al. Nucleotide Sequence Diversity of Floral Pigment Genes in Mexican Populations of Ipomoea purpurea (Morning Glory) Accord with a Neutral Model of Evolution [J]. Journal of Heredity, 2012, 103(6): 863-872.
    [26] YAN L, LAI X J, LI X D, et al. Analyses of the Complete Genome and Gene Expression of Chloroplast of Sweet Potato (Ipomoea batata) [J]. PLoS One, 2015, 10(4): e0124083.
    [27] ZOU H D, ZHANG X J, CHEN J Y, et al. Complete Chloroplast Genome of a Novel Chlorophyll-deficient Mutant (clm) in Sweetpotato (Ipomoea batatas L. ) [J]. Mitochondrial DNA Part B, 2021, 6(3): 968-969.
    [28] LI F W, KUO L Y, ROTHFELS C J, et al. rbcL and matK Earn Two Thumbs up as the Core dna Barcode for Ferns [J]. PLoS One, 2011, 6(10): e26597.
  • 加载中
图( 3) 表( 3)
计量
  • 文章访问数:  982
  • HTML全文浏览数:  982
  • PDF下载数:  244
  • 施引文献:  0
出版历程
  • 收稿日期:  2023-03-06
  • 刊出日期:  2023-10-20

叶菜型甘薯叶绿体基因组及其特征分析

    通讯作者: 邱思鑫,博士,研究员; 
    作者简介: 李国良,硕士,助理研究员,主要从事甘薯抗逆基因功能研究
  • 福建省农业科学院 作物研究所/农业农村部南方薯类观测实验站, 福州 350013
基金项目:  财政部和农业农村部国家现代农业产业技术体系项目(CARS-10-B14);福建省人民政府-中国农业科学院农业高质量发展超越“5511”协同创新工程项目(KXXYJBG0039);福建省属公益类科研院所基本科研专项(2021R1031011)

摘要: 

为探明叶菜型甘薯叶绿体基因组特征及其与番薯属植物的亲缘关系, 以叶菜型甘薯'福菜薯18号’为试验材料, 利用BGISEQ-500平台和Oxford Nanopore Technologies单分子测序技术对全基因组进行建库测序, 并组装其叶绿体基因组. 结果显示: 叶菜型甘薯叶绿体基因组全长161 387 bp, 具有典型的环状四分体结构, 其大单拷贝区(large single copy, LSC)、小单拷贝区(small single copy, SSC)和2个反向重复序列(inverted repeat, IR)的长度分别为87 597, 12 052和30 869 bp. 注释共得到132个基因, 包含87个蛋白编码基因, 8个rRNA基因, 37个tRNA基因. 在叶菜型甘薯叶绿体基因组中共搜索到54个SSR位点, 其中单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸重复基序个数分别为32, 4, 3, 11, 2和2个. 系统进化分析表明, 叶菜型甘薯与甘薯四倍体野生种Ipomoea tabascana和二倍体野生种Ipomoea trifida具有较近的亲缘关系.

English Abstract

  • 开放科学(资源服务)标志码(OSID):

  • 叶绿体是绿色植物进行光合作用最重要的细胞器,是许多基本物质和次生代谢物合成的重要场地[1]. 叶绿体蛋白虽然绝大多数是由核基因编码,但也有100多种蛋白是由叶绿体基因组(cpDNA)编码的. cpDNA序列长度为130~150 kb,具有典型的双链环状结构,由1个大单拷贝区(LSC),1个小单拷贝区(SSC)和两个反向重复区(IR)组成. 大多数的cpDNA是母系遗传,但也有一部分植物是父系遗传或双亲遗传. 相对于核基因组的复杂多样性,cpDNA结构简单,序列高度保守,不同物种或同一物种不同个体间仅存在着局部区域的序列变异,因此cpDNA更易解析,更有利于研究植物的分类与进化[2-4].

    甘薯是我国重要的粮食作物、饲料作物和食品加工业、化工业的原料作物[5]. 叶菜型甘薯是一类以鲜幼嫩茎叶作蔬菜用的甘薯品种,与普通甘薯相比,其茎叶产量较高[6]. 叶绿体基因组的完整解析是准确研究植物系统进化关系、发掘基因功能的更有效而可靠的手段[7]. 叶菜型甘薯的父本或母本往往来源于普通甘薯,其叶绿体基因组序列与普通甘薯有什么差别目前尚未清楚,甘薯种间叶绿体基因组之间存在多少碱基差异目前也不清楚. 本研究以叶菜型甘薯‘福菜薯18号’为材料,通过序列拼接获得完整的叶绿体基因组,并利用生物信息学方法进行分析,为叶菜型甘薯的亲缘关系和甘薯种间关系奠定基础.

  • 以叶菜型甘薯‘福菜薯18号’为试验材料,其嫩梢幼叶于2021年7月采自‘福菜薯18号’甘薯组培苗.

  • 利用DNA提取试剂盒(南京诺维赞生物科技有限公司)提取甘薯组织总DNA[8],用1.5%琼脂糖凝胶电泳和Nanodrop 2000检测甘薯总DNA的质量和完整性,DNA质量合格后进行上机测试.

    二代测序实验流程按照BGISEQ-500的标准程序执行,样品基因组DNA检测合格后,用超声波法将DNA片段化,然后对片段化的DNA进行纯化,末端修复,3′端加A,连接测序接头,构建测序文库,文库质检合格后用BGISEQ-500平台进行测序.

    三代测序采用Oxford Nanopore Technologies公司的建库试剂盒进行测序文库构建,文库检验合格后上机测序.

  • 使用Fastp软件对原始数据进行过滤,去除其中的接头序列及低质量序列,获取高质量的序列数据,按参考物种的叶绿体基因组序列进行组装,得到叶绿体基因组序列组装结果[9]. 使用minimap2将三代测序reads比对NCBI旋花科所有叶绿体基因组数据,提取比对长度大于5 000 bp的reads用于后续组装[10]. 使用bowtie2将二代测序reads比对广州佰数生物科技有限公司自建的叶绿体基因组数据库,将比对上的reads用于后续组装[11]. 组装软件使用Unicycler version:v 0.4.8,将上述提取到的叶绿体候选三代和二代reads用于叶绿体基因组组装[12].

    使用GeSeq软件对叶绿体基因序列进行注释[13];利用tRNAscan-SE在线网站对tRNA进行注释[14],利用RNAmmer 1.2 Server(http://www.cbs.dtu.dk/services/RNAmmer/)对rRNA进行注释,经人工修正后获得最终的注释结果;最后使用OGDRAW(https://chlorobox.mpimp-golm.mpg.de/OGDraw.html)软件生成基因组物理图谱[15].

  • 根据Sharp等[16]计算方法对组装好的叶菜型甘薯叶绿体基因组序列进行密码子偏好性(Relative Synonymous Codon Usage,RSCU)值统计和分析. 采用MISA软件(http://pgrc.ipk-gatersleben.de/misa/)对组装好的叶菜型甘薯叶绿体基因组序列进行微卫星扫描[17],利用Tandem repeats finder v 4.04软件检测串联重复序列,默认参数参考文献[18].

    由于叶绿体基因组组装过程中发现有两种类型的叶绿体,即叶绿体基因组在SSR区域具有正反两种方向的结构,因此利用dottup软件对两种类型的叶绿体基因组进行共线性分析[19].

  • 从NCBI数据库下载番薯属Ipomoea trifida(NC_034670),Ipomoea cordatoteiloba(NC_041204),Ipomoea lacunosa(NC_037912),Ipomoea cynanchifolia(NC_041203)和Ipomoea ramosissima(NC_041205) 等45个种植物叶绿体基因组序列与叶菜型甘薯进行聚类分析,利用其与两个外群物种全叶绿体序列构建进化树. 使用软件mafft(默认参数)进行序列比对[20],而后利用fasttree软件构建ML进化树[21].

  • 从NCBI数据库下载8个甘薯叶绿体基因组数据,将9个基因组序列用mafft对比后,以‘福菜薯18号’叶绿体基因组为参考序列进行SNP和Indel分析.

  • 叶菜型甘薯的cpDNA序列全长为161 387 bp,由大单拷贝区域(LSC,87 597 bp),小单拷贝区域(SSC,12 052 bp)及两个反向重复区域(IRA和IRB,30 869 bp)4个部分构成(图 1). 组装注释好的叶绿体基因序列提交至GenBank,获得序列登录号OM808940. 基因注释结果表明:叶菜型甘薯cpDNA具有132个功能基因,包括87个蛋白编码基因、8个rRNA基因和37个tRNA基因. 其中,18个基因在IR区域复制,包括7个蛋白编码基因(ycf1ycf2ycf15ndhBndhHrps7rps15),7个tRNA基因(trnI-CAUtrnL-CAAtrnV-GACtrnI-GAUtrnA-UGCtrnR-ACGtrnN-GUU)和4个rRNA基因(rrn4.5,rrn5rrn16rrn23). 叶菜型甘薯cpDNA总的GC质量分数为37.54%,AT质量分数为62.46%.

    经过统计分析,叶菜型甘薯cpDNA中20个基因包含内含子,其中,11个蛋白编码基因和7个tRNA基因含有1个内含子,2个蛋白编码基因(pafIclpP)含有2个内含子(表 1). rps12有2个拷贝,每个拷贝具有3个外显子,且两个拷贝共享第1个外显子,第1个外显子位于LSC区域,另外2个外显子位于IR区域.

  • 对于不同的生物体蛋白质结构组成,即使编码氨基酸的密码子相同,但是对于氨基酸的同义密码子使用频率却是不相等的,这种同义密码子使用频率的不相等就是密码子偏好性(RSCU). 叶菜型甘薯cpDNA中RSCU值大于1.00的密码子为32个,其中大多数以A或T结尾,仅3个以G结尾(ATG,TTG,TGG). 编码亮氨酸(Leu)的密码子数量最多,为2 950个,占比10.35%;半胱氨酸(Cys)出现的次数最少,为332,占比1.16%(表 2). 这与大多数被子植物叶绿体基因组密码子使用偏好一致.

  • SSR(Simple Sequence Repeats) 是一类由1~6个核苷酸为重复单位组成的长达几十个核苷酸的串联重复序列,每个SSR两侧的序列一般是相对保守的单拷贝序列. 从叶菜型甘薯叶绿体基因组中共鉴定到54个SSR位点,其中,单核苷酸、二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸重复分别有32,4,3,11,2和2个(表 3),且32个单核苷酸重复均由A或T组成.

  • 从NCBI上下载旋花科甘薯近缘种植物的叶绿体基因组序列,对全基因组序列的共有蛋白编码基因进行聚类分析,并以Distimake quinquefoliusOperculina macrocarpa为外类群. 结果显示,叶菜型甘薯与普通甘薯‘clm’和甘薯四倍体野生种Ipomoea tabascana聚为一类,普通甘薯‘徐薯18号’和甘薯二倍体野生种Ipomoea trifida聚为一类,同时聚为一个大类. 旋花科的黄毛银背藤也与番薯属植物聚为一类,两个外群植物Distimake quinquefoliusOperculina macrocarpa聚为一类,与番薯属植物分为两个进化支(图 2).

  • 由于叶绿体基因组组装过程中发现有两种类型的叶绿体,即叶绿体基因组在SSR区域具有正反两种方向的结构,利用dottup软件对两种类型的叶绿体基因组进行共线性分析,其中蓝色是正向共线性,紫红色是反向共线性(图 3).

  • 以‘福菜薯18号’为对照,对甘薯品种间叶绿体基因组进行种内SNP分析,发现有199个SNP位点,其中有118个位点位于编码区中,编码区包含matKrpoC2psaBaccDpsbLrps8ycf1ycf2ndhBndhCndhEndhFndhH等基因,ycf1ycf2具有较多的SNP位点,其余位于非编码区中. ‘福菜薯18号’叶绿体基因组与其他甘薯相比,有121个片段缺失,其中有37个属于SSR位点缺失;有146个片段插入,其中有66个属于SSR位点插入;另外还有7个长片段替换(数据略).

  • 20世纪70年代末,双脱氧终止法标志着第一代测序技术的诞生,实现了对DNA序列的测序与分析,由于这种方法测序通量低、自动化水平差等缺点,限制了其在转录组学和基因组学的发展. 第二代测序是边合成边测序,通过捕捉末端新合成的碱基来获得待测DNA片段的序列,实现了高通量和自动化测定,极大地提高了测序速度,但由于二代测序包含PCR扩增等过程,可能会引入模板迁移等假阳性,而且二代测序读长普遍较短,也限制了其应用. 三代测序技术以PacBio公司的单分子实时测序技术(Single Molecule Real Time Sequencing,SMRT-seq)和Oxford Nanopore Technologies的纳米孔单分子测序技术为代表,与前两代测序技术相比,其最大的特点就是单分子实时测序,测序过程无需进行PCR扩增,可以实现长片段序列测定,但缺点是通量相对较小,测序成本较高[22-23]. 本文为提高叶菜型甘薯叶绿体基因组测定序列的准确性,采用了二代和三代测序数据相结合,克服了测序技术本身的不足,保证序列拼接组装的准确性.

    甘薯属于旋花科番薯属植物,本研究从NCBI上下载了45个番薯属植物的叶绿体基因组数据,包括普通甘薯‘徐薯18号’等叶绿体基因组数据并进行序列对比,并以Distimake quinquefoliusOperculina macrocarpa为外类群构建系统进化树,结果显示,叶菜型甘薯与甘薯四倍体野生种Ipomoea tabascana和甘薯二倍体野生种Ipomoea trifida聚为一类. Srisuwan等[24]通过细胞遗传学方法认为甘薯栽培种与野生种Ipomoea trifida具有更为密切关系,Ipomoea trifida是甘薯栽培种和四倍体Ipomoea tabascana的祖先,与叶绿体基因组进化相一致. 有研究表明,番薯属植物Ipomoea purpurea与其近缘种Ipomoea albaIpomoea nil在花青素合成基因中有约1%的核苷酸多态性,符合分子进化的标准中性模型[25]. 甘薯种内SNP分析结果表明,甘薯叶绿体基因组总长度有所差异,‘徐薯18号’的叶绿体基因组长度为161 303 bp[26],甘薯‘clm’及其对照分别为161 393 bp和161 429 bp[27],甘薯叶绿体基因中存在单核苷酸突变,也存在长片段替换、缺失和插入,这些碱基差异有些是位于编码区基因matKrpoC2psaBaccDrbcL中,其中matKrbcL是植物DNA条形码的核心序列[28],另外一些编码基因是否可以成为番薯属的DNA条形码有待更多数据的支持.

参考文献 (28)

目录

/

返回文章
返回