留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

利用基因组测序技术鉴定家蚕转基因位点方法的建立

上一篇

下一篇

周昂, 蒋晶晶, 左伟东, 等. 利用基因组测序技术鉴定家蚕转基因位点方法的建立[J]. 西南大学学报(自然科学版), 2025, 47(4): 113-122. doi: 10.13718/j.cnki.xdzk.2025.04.010
引用本文: 周昂, 蒋晶晶, 左伟东, 等. 利用基因组测序技术鉴定家蚕转基因位点方法的建立[J]. 西南大学学报(自然科学版), 2025, 47(4): 113-122. doi: 10.13718/j.cnki.xdzk.2025.04.010
ZHOU Ang, JIANG Jingjing, ZUO Weidong, et al. Establishment of A Genome Sequencing Method for Identification of Transgenic Sites in Silkworm[J]. Journal of Southwest University Natural Science Edition, 2025, 47(4): 113-122. doi: 10.13718/j.cnki.xdzk.2025.04.010
Citation: ZHOU Ang, JIANG Jingjing, ZUO Weidong, et al. Establishment of A Genome Sequencing Method for Identification of Transgenic Sites in Silkworm[J]. Journal of Southwest University Natural Science Edition, 2025, 47(4): 113-122. doi: 10.13718/j.cnki.xdzk.2025.04.010

利用基因组测序技术鉴定家蚕转基因位点方法的建立

  • 基金项目: 国家自然科学基金项目(U20A2058,31830094);中央高校基本科研业务费自然科学项目(SWU-KQ22005)
详细信息
    作者简介:

    周昂,硕士研究生,主要从事家蚕经济性状的研究 .

    通讯作者: 李春林,副教授
  • 中图分类号: S882

Establishment of A Genome Sequencing Method for Identification of Transgenic Sites in Silkworm

  • 摘要:

    建立一种基于基因组测序技术高效鉴定家蚕转基因插入位点的方法,并分析测序深度对位点鉴定准确性的影响,从而为家蚕及其他物种利用基因组测序技术开展低成本、高通量的转基因位点鉴定提供参考。首先,采集两份家蚕转基因材料的蛹,进行全基因组测序,并经过质量控制筛选出高质量的测序后读段(reads)。以载体序列和家蚕基因组为参考,经两轮比对分析,得到覆盖基因组和载体的目标reads。利用目标reads上的基因组序列在家蚕泛基因组数据库中进行比对分析,进而获得插入位点的具体位置。随后,运用Seqtk软件对数据进行抽样,分析不同测序深度对位点鉴定准确性的影响。两份材料的基因组测序数据分别为9.76 G和11.18 G,质控后读段(clean reads)数量分别为32 639 026和37 394 695,测序深度约为20×。序列比对分析和聚合酶链式反应(PCR)实验验证结果显示:TransGene_1的插入位点位于1号染色体1 899 494 bp与1 899 495 bp之间;TransGene_2的插入位点位于21号染色体959 510 bp与959 515 bp之间,且插入位点均处于基因间区。利用两份转基因材料的基因组测序数据进行不同测序深度的模拟分析,发现转基因材料TransGene_1在测序深度为6×时就能够得到覆盖两侧断点的reads,实现精确定位,而TransGene_2则需要测序深度达到10×及以上才能实现精确定位。

  • 加载中
  • 图 1  应用基因组测序技术鉴定家蚕转基因插入位点的方法流程

    图 2  TransGene_1插入位点鉴定比对结果

    图 3  TransGene_1插入位点左、右臂断点鉴定及Sanger测序结果

    图 4  不同深度测序文件模拟测试方案

    表 1  TransGene插入位点鉴定引物信息

    检测位置 引物名称 序列(5'3') 产物大小/bp
    左臂断点 T1-L-F CTAAATGCACAGCGACGGAT 304
    T1-L-R ATAGAAGACGCTCAGTTGGC
    T2-L-F ATGGCCTTGGAATCGTCAGA 200
    T2-L-R TCATTTTGACTCACGCGGTC
    右臂断点 T1-R-F ATTACTGGGCCAACAACTGC 537
    T1-R-R TGTGCCAAAGTTGTTTCTGACT
    T2-R-F ACCGATAAAACACATGCGTCA 402
    T2-R-R CAAAAGCGGATAGGGCACAA
    基因组序列 T1-G-F CGTTGAACATAATGTGCTTGACG 590
    T1-G-R ACGGTTAACTTATCTGCCTTCG
    T2-G-F GGCCTCCCAGACAGAATAGT 364
    T2-G-R CCAGCAAAAGTGATCCGAGG
    注:bp指碱基对数。
    下载: 导出CSV

    表 2  基因组测序结果

    样本名称 clean reads数 高质量碱基数 Q30/% GC/% 测序深度/×
    TransGene_1 32 639 026 9 759 018 256 98.02 37.40 20
    TransGene_2 37 394 695 11 180 626 164 97.95 37.40 20
    注:Q30:质量值大于等于30的碱基数占总碱基数的百分比;GC:样品GC含量,即G和C类型的碱基数占总碱基数的百分比。
    下载: 导出CSV

    表 3  TransGene插入位点比对结果统计

    样本名 左臂reads数 右臂reads数 最短碱基数/bp 最长碱基数/bp 平均碱基数/bp
    TransGene_1 10 6 34 105 55.4
    TransGene_2 6 11 32 118 65.7
    注:以上结果均为比对到基因组的情况。reads指测序仪单次测序所得到的碱基序列,bp指碱基对数。
    下载: 导出CSV

    表 4  不同深度样本的鉴定情况

    测序深度/× 未检测率/% 单侧检测率/% 检测率/%
    Trans Gene_1 Trans Gene_2 Trans Gene_1 Trans Gene_2 Trans Gene_1 Trans Gene_2 Trans Gene_1 Trans Gene_2
    2 2 40.4 18.2 36.4 63.6 36.4 18.2
    4 4 0 0 36.4 45.5 63.6 54.5
    5 5 0 0 9.1 27.3 90.9 72.7
    6 6 0 0 0 27.3 100 72.7
    8 8 0 0 0 18.2 100 81.8
    10 10 0 0 0 0 100 100
    12 12 0 0 0 0 100 100
    14 14 0 0 0 0 100 100
    16 16 0 0 0 0 100 100
    下载: 导出CSV
  • [1] 龚晓平, 王楠, 况晓明, 等. 利用RNA干涉研究水稻OsROSES1基因的功能[J]. 西南大学学报(自然科学版), 2020, 42(6): 1-10. doi: 10.13718/j.cnki.xdzk.2020.06.001
    [2] 雷建军, 朱张生, 陈长明, 等. 辣椒分子育种研究进展[J]. 西南大学学报(自然科学版), 2023, 45(7): 1-20. doi: 10.13718/j.cnki.xdzk.2023.07.001
    [3] JIANG L, WANG G H, CHENG T C, et al. Resistance to Bombyx Mori Nucleopolyhedrovirus via Overexpression of an Endogenous Antiviral Gene in Transgenic Silkworms [J]. Archives of Virology, 2012, 157(7): 1323-1328. doi: 10.1007/s00705-012-1309-8
    [4] MATSUMOTO Y, ISHII M, ISHII K, et al. Transgenic Silkworms Expressing Human Insulin Receptors for Evaluation of Therapeutically Active Insulin Receptor Agonists [J]. Biochemical and Biophysical Research Communications, 2014, 455(3-4): 159-164. doi: 10.1016/j.bbrc.2014.10.143
    [5] MA L, XU H F, ZHU J Q, et al. Ras1(CA) Overexpression in the Posterior Silk Gland Improves Silk Yield [J]. Cell Research, 2011, 21(6): 934-943. doi: 10.1038/cr.2011.36
    [6] KUWANA Y, SEZUTSU H, NAKAJIMA K I, et al. High-Toughness Silk Produced by a Transgenic Silkworm Expressing Spider (Araneus Ventricosus) Dragline Silk Protein [J]. PLoS One, 2014, 9(8): e105325. doi: 10.1371/journal.pone.0105325
    [7] KIM S W, YUN E Y, CHOI K, et al. Expression of the Blue Fluorescent Protein in Fibroin H-Chain of Transgenic Silkworm [J]. International Journal of Industrial Entomology, 2014, 52: 25-32.
    [8] ZHANG Y, ZHOU X, GE X, et al. Insect-Specific MicroRNA Involved in the Development of the Silkworm BombyxMori [J]. PLoS One, 2009, 4(3): e4677. doi: 10.1371/journal.pone.0004677
    [9] XU X, WANG Y H, LIU Z L, et al. Disruption of Egg-Specific Protein Causes Female Sterility in Bombyx Mori [J]. Insect Science, 2022, 29(1): 128-138. doi: 10.1111/1744-7917.12904
    [10] HAMILTON C A, STLAURENT R A, DEXTER K, et al. Phylogenomics Resolves Major Relationships and Reveals Significant Diversification Rate Shifts in the Evolution of Silk Moths and Relatives [J]. BMC Evolutionary Biology, 2019, 19(1): 182. doi: 10.1186/s12862-019-1505-1
    [11] GREEN M R, SAMBROOK J. Southern Blotting [J]. Cold Spring Harbor Protocols, 2021, 2021(7): 269-280.
    [12] ZIMMERMANN A, LVTHY J, PAULI U. Event Specific Transgene Detection in Bt11 Corn by Quantitative PCR at the Integration Site [J]. LWT-Food Science and Technology, 2000, 33(3): 210-216. doi: 10.1006/fstl.2000.0637
    [13] TERAUCHI R, KAHL G. RapidIsolation of Promoter Sequences by TAIL-PCR: The 5'-Flanking Regions of Pal and Pgi Genes from Yams (Dioscorea) [J]. Molecular & General Genetics, 2000, 263(3): 554-560.
    [14] LI A H, ZHANG Y F, WU C Y, et al. Screening for and Genetic Analysis on T-DNA-Inserted Mutant Pool in Rice [J]. Acta Genetica Sinica, 2006, 33(4): 319-329.
    [15] TAMURA T, THIBERT C, ROYER C, et al. Germline Transformation of the Silkworm Bombyx Mori L. Using a piggyBac Transposon-Derived Vector [J]. Nature Biotechnology, 2000, 18(1): 81-84.
    [16] MAZARS G R, THEILLET C. Direct Sequencing by Thermal Asymmetric PCR [J]. Methods in Molecular Biology, 2003, 226: 355-360.
    [17] NAN G L, WALBOT V. Plasmid Rescue: Recovery of Flanking Genomic Sequences from Transgenic Transposon Insertion Sites [J]. Methods in Molecular Biology, 2009, 526: 101-109.
    [18] 徐纪明, 朱建树, 李梦真, 等. 侧翼序列获取技术研究进展[J]. 遗传, 2022, 44(4): 313-321.
    [19] POLKO J K, TEMANNI M R, VAN ZANTEN M, et al. Illumina Sequencing Technology as a Method of Identifying T-DNA Insertion Loci in Activation-Tagged Arabidopsis Thaliana Plants [J]. Molecular Plant, 2012, 5(4): 948-950.
    [20] SCHOUTEN H J, VANDEGEEST H, PAPADIMITRIOU S, et al. Re-Sequencing Transgenic Plants Revealed Rearrangements at T-DNA Inserts, and Integration of a Short T-DNA Fragment, But No Increase of Small Mutations Elsewhere [J]. Plant Cell Reports, 2017, 36(3): 493-504.
    [21] PENG C, MEI Y T, DING L, et al. Using Combined Methods of Genetic Mapping and Nanopore-Based Sequencing Technology to Analyze the Insertion Positions of G10evo-EPSPS and Cry1Ab/Cry2Aj Transgenes in Maize [J]. Frontiers in Plant Science, 2021, 12: 690951.
    [22] SIDDIQUE K, WEI J J, LI R, et al. Identification of T-DNA Insertion Site and Flanking Sequence of a Genetically Modified Maize Event IE09S034 Using Next-Generation Sequencing Technology [J]. Molecular Biotechnology, 2019, 61(9): 694-702.
    [23] NIU L, HE H L, ZHANG Y Y, et al. Efficient Identification of Genomic Insertions and Flanking Regions Through Whole-Genome Sequencing in Three Transgenic Soybean Events [J]. Transgenic Research, 2021, 30(1): 1-9.
    [24] GUO B F, GUO Y, HONG H L, et al. Identification of Genomic Insertion and Flanking Sequence of G2-EPSPS and GAT Transgenes in Soybean Using Whole Genome Sequencing Method [J]. Frontiers in Plant Science, 2016(7): 1009.
    [25] PARK D, KIM D, JANG G, et al. Efficiency to Discovery Transgenic Loci in GM Rice Using Next Generation Sequencing Whole Genomere-Sequencing [J]. Genomics & Informatics, 2015, 13(3): 81-85.
    [26] XU W T, ZHANG H W, ZHANG Y C, et al. A Paired-End Whole-Genome Sequencing Approach Enables Comprehensive Characterization of Transgene Integration in Rice [J]. Communications Biology, 2022, 5(1): 667.
    [27] JACOBSEN J C, ERDIN S, CHIANG C, et al. Potential Molecular Consequences of Transgene Integration: The R6/2 Mouse Example [J]. Scientific Reports, 2017(7): 41120.
    [28] AKTARY Z, CORVELO A, ESTRIN C, et al. Sequencing Two Tyr: : CreERT2 Transgenic Mouse Lines [J]. Pigment Cell & Melanoma Research, 2020, 33(3): 426-434.
    [29] WANG Q, SHI N N, SHANG Y, et al. Comprehensive Molecular Characterization of a Transgenic Pig Expressing hCD46 Gene [J]. Gene, 2017, 626: 376-385.
    [30] 魏强, 奥岩, 杨漫漫, 等. 利用全基因组重测序技术鉴定五指山猪GHR突变体转基因插入位点[J]. 遗传, 2021, 43(12): 1149-1158.
    [31] 田凤鸣, 陈强, 何九军, 等. 花椒根腐病拮抗菌株W-1基因组测序及抑菌机理研究[J]. 南方农业学报, 2024, 55(6): 1639-1652.
    [32] 方慧仪, 梁雨薇, 李昕苑, 等. 月月粉月季NUDIX基因家族的鉴定与表达分析[J]. 浙江大学学报(农业与生命科学版), 2024, 50(6): 852-866.
    [33] 王君妍, 王峰, 龚瑶, 等. 月季P450基因家族及其参与月季花香形成基因的鉴定[J]. 浙江大学学报(农业与生命科学版), 2025, 51(1): 54-66.
    [34] DANECEK P, BONFIELD J K, LIDDLE J, et al. Twelve Years of SAMtools and BCFtools [J]. GigaScience, 2021, 10(2): giab008.
    [35] KAWAMOTO M, JOURAKU A, TOYODA A, et al. High-Quality Genome Assembly of the Silkworm, Bombyx Mori [J]. Insect Biochemistry and Molecular Biology, 2019, 107: 53-62.
    [36] LU K P, PAN Y F, SHEN J H, et al. SilkMeta: a Comprehensive Platform for Sharing and Exploiting Pan-Genomic and Multi-Omic Silkworm Data [J]. Nucleic Acids Research, 2024, 52(D1): D1024-D1032.
    [37] 谷荣辉, 成功, 李建钦, 等. 转基因水稻对土壤性质及土壤生物的影响[J]. 云南农业大学学报(自然科学), 2014, 29(3): 448-457.
    [38] AJAY S S, PARKER S C J, ABAAN H O, et al. Accurate and Comprehensive Sequencing of Personal Genomes [J]. Genome Research, 2011, 21(9): 1498-1505.
    [39] PATOCCHI A, KEILWAGEN J, BERNER T, et al. No Evidence of Unexpected Transgenic Insertions in T1190-A Transgenic Apple Used in Rapid Cycle Breeding-Following Whole Genome Sequencing [J]. Frontiers in Plant Science, 2021, 12: 715737.
    [40] JI Y, ABRAMS N, ZHU W, et al. Identification of the Genomic Insertion Site of Pmel-1 TCR α and β Transgenes by Next-Generation Sequencing [J]. PLoS One, 2014, 9(5): e96650.
    [41] WANG X J, JIAO Y, MA S, et al. Whole-Genome Sequencing: an Effective Strategy for Insertion Information Analysis of Foreign Genes in Transgenic Plants [J]. Frontiers in Plant Science, 2020, 11: 573871.
  • 加载中
图( 4) 表( 4)
计量
  • 文章访问数:  82
  • HTML全文浏览数:  82
  • PDF下载数:  15
  • 施引文献:  0
出版历程
  • 收稿日期:  2024-01-03
  • 刊出日期:  2025-04-20

利用基因组测序技术鉴定家蚕转基因位点方法的建立

    通讯作者: 李春林,副教授
    作者简介: 周昂,硕士研究生,主要从事家蚕经济性状的研究
  • 西南大学 资源昆虫高效养殖与利用全国重点实验室/ 西南大学 农业农村部蚕桑生物学与遗传育种重点实验室, 重庆 400715
基金项目:  国家自然科学基金项目(U20A2058,31830094);中央高校基本科研业务费自然科学项目(SWU-KQ22005)

摘要: 

建立一种基于基因组测序技术高效鉴定家蚕转基因插入位点的方法,并分析测序深度对位点鉴定准确性的影响,从而为家蚕及其他物种利用基因组测序技术开展低成本、高通量的转基因位点鉴定提供参考。首先,采集两份家蚕转基因材料的蛹,进行全基因组测序,并经过质量控制筛选出高质量的测序后读段(reads)。以载体序列和家蚕基因组为参考,经两轮比对分析,得到覆盖基因组和载体的目标reads。利用目标reads上的基因组序列在家蚕泛基因组数据库中进行比对分析,进而获得插入位点的具体位置。随后,运用Seqtk软件对数据进行抽样,分析不同测序深度对位点鉴定准确性的影响。两份材料的基因组测序数据分别为9.76 G和11.18 G,质控后读段(clean reads)数量分别为32 639 026和37 394 695,测序深度约为20×。序列比对分析和聚合酶链式反应(PCR)实验验证结果显示:TransGene_1的插入位点位于1号染色体1 899 494 bp与1 899 495 bp之间;TransGene_2的插入位点位于21号染色体959 510 bp与959 515 bp之间,且插入位点均处于基因间区。利用两份转基因材料的基因组测序数据进行不同测序深度的模拟分析,发现转基因材料TransGene_1在测序深度为6×时就能够得到覆盖两侧断点的reads,实现精确定位,而TransGene_2则需要测序深度达到10×及以上才能实现精确定位。

English Abstract

  • 开放科学(资源服务)标识码(OSID):

  • 栽桑养蚕是我国先民的伟大创举,有着超5 000年的历史。蚕桑产业作为我国特色优势产业,在脱贫攻坚进程中发挥了关键作用,是当前乡村振兴的优势特色产业之一。培育高产且优质的蚕品种是推动养蚕业健康发展以及增加蚕农收入的重要根基。基因编辑技术在农业育种方面的应用越发广泛,不仅为作物抗病性的改良给予了关键支撑,还极大地推动了作物品质的提升[1-2]。在家蚕育种领域,转基因技术也被广泛用于创制优质育种素材[3-7]。就转基因素材来讲,明确其插入位点对其育种用途和推广极为关键。此外,家蚕亦是重要的实验动物,基于家蚕展开的功能基因研究对理解昆虫发育[8]、遗传[9]以及进化[10]有着重要的参考价值。转基因技术同样是功能基因研究的重要方式,确定转基因材料中目的片段的插入位点对明确目的基因的功能是不可或缺的。所以,构建高效、精准的鉴定家蚕转基因位点的方法对家蚕育种和功能基因的研究有着重大意义。

    传统上,常用DNA印迹杂交[11]确定转基因材料中目的片段的拷贝数,再通过以聚合酶链式反应(PCR)为基础的方法确定插入位点,后者包括反向PCR、交错式热不对称PCR、质粒拯救法、外源接头PCR以及Sanger测序等。例如文献[12]利用反向PCR方法成功找到Bt11转基因玉米的侧翼序列;文献[13]利用交错式热不对称PCR方法成功分离了山药Pal和Pgi基因的5'-侧翼区域;文献[14]利用质粒拯救法成功在水稻中获取到插入T-DNA序列。然而,这些基于PCR的鉴定方法往往过程繁琐。例如,反向PCR方法需要将转基因系基因组酶切处理并环化,再经数轮巢式PCR扩增,才可能鉴定到插入位点[15];交错式热不对称PCR方法需采用温度梯度和不对称的引物设计,以增加扩增特异性[16];质粒拯救法需使用限制酶对DNA进行处理,并将其导入大肠杆菌内,使用PCR筛选阳性菌落并测序[17]。其他方法也涉及较多关键中间环节,使得传统基于PCR的鉴定方法不仅检测效率低、对实验人员技术要求较高,且其成功率不高,部分情况下需重复多次才能完成插入位点鉴定。综合来看,传统转基因位点鉴定方法操作复杂、特异性低,且受连接效率、退火温度、引物设计因素等限制[18]。随着以转基因技术为代表的分子育种技术的广泛应用,有必要在各物种中建立更高效、更精准的转基因位点鉴定方法。

    近年来,随着高通量测序技术的普及,个体基因组测序成本迅速降低,使得利用基因组测序技术高效鉴定转基因插入位点成为可能。目前,在拟南芥[19-20]、玉米[21-22]、大豆[23-24]、水稻[25-26]、小鼠[27-28]、猪[29-30]、花椒树[31]、月季[32-33]等的研究中皆有利用基因组测序技术进行转基因位点鉴定的报道,但在家蚕的研究中尚未有过相关研究和报道。

    本研究利用全基因组测序技术,对两个转基因家蚕品系的插入位点进行鉴定,建立一套快速确定家蚕转基因插入位点的方法。此外,还分析了测序深度如何影响插入位点检测的准确性。

  • 转基因材料TransGene_1和TransGene_2是本实验室前期构建的2个过表达家蚕品系。TransGene_1:利用同源重组的办法,将目的基因表达核连接到piggyBac-{3×P3-EGFP}载体上,通过胚胎显微注射技术注射至新产非滞育蚕卵(G0代);随后,饲养G0代至化蛾(G1代),并在G1代蚁蚕刚孵化时筛选复眼发出绿光的个体;再饲养自交产生G2代,逐代筛选,最终获得纯合的转基因过表达品系。TransGene_2:将目标基因与家蚕A4启动子、SV40终止子通过中间载体pSL1180构建表达核[A4-Gene-SV40],酶切回收表达核后与piggyBac-[3×P3-EGFP]载体连接;再通过显微注射技术将重组载体转入家蚕非滞育卵(低温催青卵);最后利用荧光显微镜筛选复眼有绿色荧光的G1代个体逐代自交饲育,逐代筛选,最终得到转基因过表达品系。

    使用TransGene_1和TransGene_2的蛹提取基因组DNA,使用血液/细胞/组织基因组DNA提取试剂盒建立DNA文库(百迈客生物科技有限公司),利用HiSeq X平台进行双端测序,每条reads长150 bp。

  • 为了获得高质量的基因组测序数据用于后续研究,采取了以下步骤:①剔除N碱基含量超过5%的reads;②剔除质量值低于20且比例超过30%的reads。第一轮比对选用插入序列为参考,首先利用软件BWA(Burrows-Wheeler-Alignment Tool)v0.7.17将clean reads比对至参考序列;随后,使用软件samtools v1.6[34]对结果进行排序与筛选。第二轮比对选用家蚕基因组Bomo_genome[35]为参考基因组,以第一轮比对结果为输入进行比对,同样对结果进行排序与筛选。使用结果中的部分reads提交至网站http://silkmeta.org.cn/[36]进行BLAST分析,以获得具体的插入位置。

  • 根据reads对比结果确定转基因载体的插入方向,拼接转基因材料序列,并设计引物加以确认(表 1)。引物设计原则如下:设计3对引物,其中2对为断点检测引物(即一条引物设计于基因组上,另一条设计于载体(左臂或右臂)),剩下一对为基因组检测引物,上下游均位于基因组上。借助凝胶电泳情况以及PCR产物测序结果,验证插入位点鉴定的准确性。

  • 利用软件seqtk对双端测序文件予以随机抽取,从而模拟不同深度的测序状况,随机种子随机生成,每个深度设置11个重复。本研究总共设置9个梯度,模拟测序深度从2×至16×的情形。

  • 本研究运用全基因组测序技术对家蚕转基因的插入位点予以鉴定,具体分为以下4个步骤(图 1):其一,针对测序结果开展质量控制与过滤操作,去除低质量以及不适于分析的测序结果,留存clean reads以作后续分析之用。其二,于第一轮比对期间,挑选带有载体序列的reads,将插入序列当作参考,运用clean reads与之进行比对并对结果加以筛选。经筛选后的结果可分为两类,一类是完全比对成功的reads;另一类是仅有部分序列能够比对上的reads,此类reads又可细分为比对上左臂和比对上右臂两种情况,这两种情况中的reads均为需要保留的reads。其三,在第二轮比对时,筛选出与参考基因组存在部分相同序列的reads。其四,在实验验证步骤里,利用与参考基因组比对上的最长部分进行序列对比操作,确定插入位点,并设计引物开展实验验证。

    分析表明,TransGene_1的基因组测序总共获取了约9.76 GB的数据,其中包含32 639 026条clean reads,Q30达到98.02%。TransGene_2的基因组测序共得到了约11.18 GB的数据,涵盖37 394 695条clean reads,Q30为97.95%。这两份材料的测序深度均约为20×(表 2),测序质量均符合后续分析要求。

  • 依据本研究的插入位点定位策略,初步判定转基因品系TransGene_1的插入位点处于1号染色体的1 899 494 bp之处,其插入方向为从同源右臂至同源左臂(图 2b);而转基因品系TransGene_2的插入位点位于21号染色体的959 510 bp之处,插入方向为从同源左臂至同源右臂(图 2c)。

    为深入分析,对转基因材料的序列予以拼接和比对,且统计了可与家蚕参考基因组比对的reads的长度。在转基因品系TransGene_1中,最短碱基数为34 bp,最长碱基数为105 bp,平均碱基数为55.4 bp。而在TransGene_2中,最短碱基数为32 bp,最长碱基数为118 bp,平均碱基数为65.7 bp。获取具有可比对到家蚕参考基因组上的长碱基数的测序后读段(reads),有助于保证此分析方法比对结果的准确性(表 3)。

  • 为了验证本实验方法的准确性,于转基因品系TransGene_1中设计了3对引物加以验证:左臂断点的扩增产物长度为304 bp,右臂断点的扩增产物长度为537 bp,野生型家蚕预计仅扩增590 bp的基因组序列。电泳结果表明:TransGene_1左、右臂断点产物的扩增长度和预期相符,并且未扩增基因组序列,这显示该品系为转基因纯合型;野生型家蚕仅扩增基因组序列,未扩增左、右臂断点,与预期一致(图 3a)。

    在转基因品系TransGene_2中,同样设计了3对引物来进行验证,结果与预期相符(图 3b)。随后,对以上两个转基因品系的左、右臂断点扩增产物开展Sanger测序(图 3c图 3d),结果和之前拼接的序列一致,验证了本研究方案的准确性。

  • 为深入探究测序深度对插入位点鉴定准确性的影响,本研究按一定比例对clean reads进行随机抽样,梯度设为2×、4×、6×直至16×,对抽取的reads开展两轮比对,每个梯度重复11次,以此模拟并比较不同测序深度下转基因插入位点的鉴定效率(图 4)。

    利用两份转基因材料(TransGene_1与TransGene_2)的全基因组测序数据,对不同测序深度下转基因材料插入位点的鉴定情况进行了模拟(表 4)。结果表明,测序深度对插入位点的鉴定效果存在显著影响。测序深度为2×时,两份材料的未检测率分别为40.4%与18.2%,检测率分别为36.4%和18.2%,这表明此时鉴定效率较低。测序深度为5×时,两种载体的未检测率均降为0%,检测率分别提升至90.9%和72.7%,这意味着在此测序深度下鉴定效率有较大提高。测序深度为6×时,TransGene_1的鉴定率达到100%;测序深度为10×时,TransGene_2的鉴定率也达到100%,显示在这两个深度下鉴定效率分别达到最优。所以,本研究认为,针对两份转基因材料插入位点的鉴定,测序深度处于6×到10×之间,即可确保鉴定的有效性。

  • 转基因生物的安全性一直是备受关注的焦点,涉及转基因操作技术安全问题与转基因产品安全性评估。在这方面,文献[37]已对转基因水稻可能给土壤质量和土壤生物带来的影响进行了深入研究。准确掌握转基因插入位点,对评估转基因生物安全性极为关键。本研究运用全基因组测序技术,针对两个前期构建的家蚕转基因品系开展了插入位点定位及后续验证工作。序列分析结果表明:TransGene_1的插入位点位于1号染色体1 899 494 bp与1 899 495 bp之间;TransGene_2的插入位点位于21号染色体959 510 bp与959 515 bp之间,这两个插入位点均属于基因间区。具体来说,TransGene_1插入位点距离上游基因KWMTBOMO00059 1 173 bp,距离下游基因KWMTBOMO00060 3 194 bp;TransGene_2插入位点距离上游基因KWMTBOMO12353 25 903 bp,距离下游基因KWMTBOMO12354 30 067 bp。

    本研究借助全基因组测序技术精确鉴定了两个转基因品系的插入位点,并设计了检测引物,用于对转基因品系插入位点进行准确分型。这些检测引物不但可用于转基因品系的追踪与鉴别,而且可作为分子标记在其育种、选育中发挥作用。

  • 本研究在测序深度为20×时,成功借助全基因组测序数据对插入位点予以鉴定,这表明在此测序深度下能够获取同时包含载体与基因组序列的reads。通常而言,较高的测序深度可提升捕获特定reads的概率[38],但相应地会使测序费用与分析成本增加。本研究探究了测序深度对位点鉴定准确性的影响。利用现有数据开展不同深度的模拟测试,结果显示,最低测序深度为6×时即可实现对插入位点的准确鉴定。有趣的是,本研究采用两份数据进行相同的模拟测试,然而另一份具有较多clean bases的材料却需在测序深度为10×的条件下方能完成鉴定任务,这或许是不同测序文库及插入位点的保守性存在差异所致。

    在将全基因组测序与生物信息学手段相结合进行分析时,充足的高质量数据至关重要。文献[39]利用测序深度达182×的全基因组测序数据,针对快速循环育种中的转基因苹果T1109开展转基因插入验证,并与测序深度为167×的野生型苹果进行比较,结果表明在转基因苹果T1109中未检测到意外的转基因插入事件;文献[40]于测序深度为8×的转基因小鼠中成功鉴定出Pmel-1 TCR αβ转基因的基因组插入位点,这与本研究得出的最低测序深度(6×)相近。更高的测序深度能够获取更多的高质量数据,在运用生物信息学手段进行分析时能得到更精确的结果,但同时也可能致使假阳性结果增多。文献[41]对G2-6转基因水稻进行了T-DNA插入位点鉴定,在测序深度为70×时发现3条非水稻同源序列的reads,并通过实验证实这是由污染导致的假阳性。所以,在运用全基因组测序技术进行转基因位点鉴定时,应当结合物种特性以及插入基因的特点,选取适宜的测序深度。

参考文献 (41)

目录

/

返回文章
返回