服务介绍 Service Introduction
基因组de novo 测序,即基因组从头测序,是指不依赖已知的基因组序列信息,对某个物种的全基因组序列进行测序,然后利用生 物信息学手段对测序序列进行拼接、组装,从而获得该物种的全基因组序列图谱。全基因组序列图谱的构建将全面加深对该物种起源进化 以及对特定环境适应性过程的理解,为今后在该物种内发现新基因以及物种改良起到巨大的作用,为基因组学研究搭建一个高效的平台; 为后续的基因挖掘、功能验证提供 DNA 序列信息。
通过漫长的物种形成和进化,不同的物种基因组的杂合度和基因组上的重复区域不尽相同。一般杂合度不超过 0.5%、重复序列含量 不超过 50%、GC 含量为 35% 到 65% 之间的单倍体或二倍体动植物基因组定义为简单基因组。而动植物复杂基因组是指 GC 含量小于 35% 或大于 65%,重复序列高于 50% 或杂合率大于 0.5% 的二倍体或多倍体的动植物基因组。
利用 illumina 测序技术,构建插入片段大小为 180 bp、300 bp、500 bp、2 kb、5 kb、10 kb、20 kb 等大小不同的测序文库, 进行 125 bp/150 bp/250 bp 的双末端测序。其中插入片段长度超过 1 kb 的文库称之为 mate-pair 文库,长片段文库的构建便于基因组 组装过程中的重复序列定位。当测序的总体深度达到 70× 以上时,即可保证基因组拼接所需数据及序列中单碱基的准确性。
技术流程 Technical Procedures
提供的服务 Services
基因组调查:评估基因组的 GC 含量、重复度、杂合度,并估计基因组的大小。
基因组拼接统计:拼接统计,包括原始数据统计、测序深度、Contig N50、Scaffold N50、基因组 GC 含量等。
基因组注释及基因功能分类:包括基因预测、功能注释、ncRNA 注释、重复序列分析以及 GO 分类、KEGG 通路分析。
比较基因组及进化分析:核苷酸水平共线性分析,氨基酸水平共线性分析,基因簇分析以及进化关系。
组装评估标准 Assembly Evaluation Standard
样品要求 Sample Requirements
实验类型 | DNA样品总量 | 样品浓度和纯度 | 样品保存 | 样品质量 |
动植物基因组de novo 测序 | 小片段文库样本制备需要总量大于 1 μg 的样品,mate-pair 文库(2 kb、5 kb、10 kb、)样品,制备需要总量 20-50 μg | 样品浓度 >200 ng/μl,OD260/280 介于 1.8-2.0 之间,无蛋白质、RNA 或者肉眼可见杂质污染 | 请保存于干粉、酒精、TE buffer 或超纯水中,并请在样品信息单中注明 | 基因组完整、无降解,电泳结果基因组 DNA 主带应在入 -Hind llldigest 最大条带 23 KB 以上且主带清晰,无弥散 |